Auto Research for Pretraining 研究实习生· 2026-06-25
字节跳动 Seed LLM Pre-training 团队招实习生,探索 Auto Research for Pretraining —— 用大模型 / Agent 辅助甚至自动化预训练研究,让 AI 参与 AI 的研发。
我们是字节跳动 Seed 的 LLM Pre-training 团队,正在探索一个前沿方向:Auto Research for Pretraining —— 用大模型 / Agent 来辅助甚至自动化预训练研究。让 AI 不只是写代码、回答问题,而是参与研究本身:发现问题、提出假设、设计实验、分析结果,并持续改进模型与数据。 你将参与: · LLM Agent for LLM Research · Auto Research Pipeline 搭建 · 预训练数据发现、筛选、提质与演化 · 自动实验设计与结果分析 · 让模型参与下一代基础模型研发 你将获得: · 参与基础模型核心研发 · 接触真实大规模预训练数据与实验系统 · 和团队一起探索 AI for AI Research 的范式 · 有机会产出有影响力的研究结果 投递:简历发送至 [email protected]。工作地点:深圳 / 北京 / 上海。
我们希望你: · 熟悉 Python / PyTorch,熟悉 Vibe Coding,有精湛的研究品味和工程素养,对 LLM、Agent、Pre-training 有兴趣 · 博士生或能力出众的硕士生,已达到毕业门槛,不再将论文作为追求的主要目标,对行业进展有一定认知,认同把工作成果用在 Seed 基模里比发 NeurIPS 对个人成长更有意义 · 能够实习六个月或以上,推动项目完整落地 加分项: · Agent Workflow / Agentic Coding 经验 · 预训练、数据工程、Scaling Law 相关经验 · 有高质量项目、论文或开源经历