阶跃星辰(StepFun)

大模型评测算法实习生· 2026-06-24

组内直招 北京 实习

阶跃星辰招大模型评测算法实习生,深入参与评测框架建设、Benchmark 接入、数据分析与模型技术报告产出。

我们正在招 大模型评测算法实习生,你会参与到大模型研发链路里非常核心的一环:如何科学、稳定、高效地评估一个模型到底变强了没有。 【你会做什么】 ✅ 参与大模型自动化评测框架建设:和团队一起设计、开发、维护评测框架,支持训练链路联动,让模型评测更稳定、更高效、更可扩展。 ✅ 接入最新 Benchmark 和评测指标:跟进学术界和工业界最新的大模型评测方法,包括主客观评测、Agent Benchmark 等,并快速集成到现有平台中。 ✅ 处理和分析海量评测数据:参与数据清洗、统计分析、结果挖掘和可视化,帮助团队从评测结果里找到模型优化方向。 ✅ 参与模型技术报告撰写:协助完成多维度、多场景的大模型能力评测,并参与发版模型技术报告的产出。 【为什么推荐你来】 这个岗位不是“跑脚本打分”的重复工作,而是深入参与大模型研发闭环:评测框架 → Benchmark 接入 → 数据分析 → 模型洞察 → 技术报告 → 发版决策。你会接触到真实的大模型训练与发版流程,也会看到评测结果如何直接影响模型优化方向。如果你既喜欢写代码,也对模型能力分析、Agent 评测、LLM Benchmark 感兴趣,这会是一个很适合成长的实习机会。 投递备注格式:评测算法+名字+可实习周期+最快到岗时间

【我们希望你是】 1. 计算机、软件工程、人工智能、电子信息等相关专业在读本科 / 研究生; 2. Python 基础扎实,代码风格好,追求高质量实现; 3. 逻辑清晰,学习能力强,愿意解决真实复杂问题; 4. 可以连续线下实习 3 个月及以上,每周出勤不少于 4 天。 【如果你有这些,会非常加分】 🌟 有 ACM / ICPC / NOI / OI / CSP 等编程竞赛经历; 🌟 发表过 LLM 相关顶会论文,或有主流开源 LLM 框架开发经验; 🌟 做过大模型 Agent 系统、评测系统、开源项目; 🌟 工程能力扎实,熟练使用 AI Agent 辅助 coding; 🌟 有个人项目、开源社区贡献经验。

在 Offer岛 浏览更多 AI 岗位 →