阶跃星辰（StepFun）

大模型评测算法实习生· 2026-06-24

组内直招北京实习

介绍

阶跃星辰招大模型评测算法实习生，深入参与评测框架建设、Benchmark 接入、数据分析与模型技术报告产出。

描述

我们正在招大模型评测算法实习生，你会参与到大模型研发链路里非常核心的一环：如何科学、稳定、高效地评估一个模型到底变强了没有。【你会做什么】 ✅ 参与大模型自动化评测框架建设：和团队一起设计、开发、维护评测框架，支持训练链路联动，让模型评测更稳定、更高效、更可扩展。 ✅ 接入最新 Benchmark 和评测指标：跟进学术界和工业界最新的大模型评测方法，包括主客观评测、Agent Benchmark 等，并快速集成到现有平台中。 ✅ 处理和分析海量评测数据：参与数据清洗、统计分析、结果挖掘和可视化，帮助团队从评测结果里找到模型优化方向。 ✅ 参与模型技术报告撰写：协助完成多维度、多场景的大模型能力评测，并参与发版模型技术报告的产出。【为什么推荐你来】这个岗位不是“跑脚本打分”的重复工作，而是深入参与大模型研发闭环：评测框架 → Benchmark 接入 → 数据分析 → 模型洞察 → 技术报告 → 发版决策。你会接触到真实的大模型训练与发版流程，也会看到评测结果如何直接影响模型优化方向。如果你既喜欢写代码，也对模型能力分析、Agent 评测、LLM Benchmark 感兴趣，这会是一个很适合成长的实习机会。投递备注格式：评测算法+名字+可实习周期+最快到岗时间

要求

【我们希望你是】 1. 计算机、软件工程、人工智能、电子信息等相关专业在读本科 / 研究生； 2. Python 基础扎实，代码风格好，追求高质量实现； 3. 逻辑清晰，学习能力强，愿意解决真实复杂问题； 4. 可以连续线下实习 3 个月及以上，每周出勤不少于 4 天。【如果你有这些，会非常加分】 🌟 有 ACM / ICPC / NOI / OI / CSP 等编程竞赛经历； 🌟 发表过 LLM 相关顶会论文，或有主流开源 LLM 框架开发经验； 🌟 做过大模型 Agent 系统、评测系统、开源项目； 🌟 工程能力扎实，熟练使用 AI Agent 辅助 coding； 🌟 有个人项目、开源社区贡献经验。