Agent 模型产品实习生· 2026-06-06
阶跃星辰招 Agent 模型产品实习生,参与 Agent 模型落地、评测体系建设与后训练优化,base 上海。
工作职责: 1. 深度参与 Agent 模型在真实场景下的应用落地,洞察高价值使用场景与用户痛点,定义模型能力需求、产品策略和版本优化节奏。 2. 将模糊的场景痛点(如工具调度可靠性、多步规划稳定性、跨 session 记忆连续性等)拆解为明确的模型能力 Gap、评测指标,协同算法、工程与数据团队推进落地,形成从需求定义到效果验证的完整闭环。 3. 从 0 到 1 建设 Agent 评测体系,包括定义能力范围与评测维度、设计 Benchmark、构造黄金测试集,参考业界前沿 Benchmark 设计思路,推动 trace 自动化评估平台搭建。 4. 基于评测结果持续分析模型表现,识别关键失败模式和能力短板,并协同算法团队推进模型后训练优化。 实习要求:每周到岗 4 天及以上,实习周期 4 个月及以上,ASAP,base 上海。 投递方式:简历投递邮箱 [email protected],邮件标题格式【Agent模型产品-姓名-联系方式】。
1. 熟悉 Agent 核心机制(Tool Use、Planning、长期记忆、Multi-Agent 协作等),对真实场景下的能力瓶颈有独立判断;对主流 Agent benchmark(如 SWE-bench、claw-eval、τ-bench 等)有体系化认知,理解不同 benchmark 的评测维度、设计思路与局限性。 2. Vibe coding 能力强,能熟练运用 Claude Code、Cursor 等工具提升效率,可独立搭建小型 demo 跑通验证流程。 3. 沟通、协作与表达能力强,能与算法、工程、测试、评测等不同角色清晰对齐,推动跨团队高效协作。