TikTok · TikTok-Data-Rec Core

多模态 RL 实习生· 2026-06-15

上海、北京 实习

TikTok-Data-Rec Core 招多模态 RL 实习生,卡量充裕,氛围和谐平等

部门介绍:TikTok-Data-Rec Core 团队负责多模态大模型的全流程训练,探索并优化大模型在 TikTok 业务场景下的高效微调和推理技术,深入研究多模态大模型在推荐、搜索领域的创新应用,探索下一代推荐和搜索系统的新范式。 实习内容:参与 RL 技术链路的迭代优化,落地/探索创新的 RL 算法策略。 实习地点:上海-杨浦-新江湾(优先)或北京-海淀-丽金智地中心。 团队情况:卡量充裕,氛围和谐平等。

1. 全职实习 3 个月以上; 2. 熟悉 RL 基础理论与主流技术路线,深入理解 PPO、DPO、GRPO 等算法原理及其工程实现; 3. 具备 VERL 等 RL 训练框架的实际项目经验,能够独立完成 RL 训练链路搭建、算法开发、性能调优与问题定位; 4. 具备大模型后训练经验者优先,包括但不限于 SFT、RL 等方向; 5. 具备一定的科研能力,在人工智能相关顶级会议或期刊发表过论文者优先。

在 Offer岛 浏览更多 AI 岗位 →