字节跳动 · Data-AML / AI Infra

多模态大模型优化实习生· 2026-06-23

国内大厂北京 · 上海 · 杭州 · 深圳实习

介绍

字节 Data-AML AI Infra 团队招多模态大模型优化实习生，方向含投机解码/量化/蒸馏等前沿加速，实习生论文一作。

描述

部门：Data-AML 某 AI Infra 团队。团队尤其需要投机解码方向、距离毕业时间一年以上的在读硕士/博士。职位描述： 1、深度参与对字节跳动自研模型 Seedance/Seedream/Seed-VLM，以及开源 LLM/VLM 模型的软硬件协同优化和算法优化，构建业界领先的模型优化能力矩阵； 2、研发面向多端异构平台的量化&稀疏、MOE 压缩、Token 压缩、Cache 复用、投机解码、KV Cache 压缩等加速算法，构建 Training-Free 或结合 Post-training/RL-Training 的加速算法矩阵； 3、面向分布式训练/推理场景，深度挖掘模型表示位宽/分辨率/步数/结构等维度的冗余，并加速训练和推理过程，通过算法和工程创新实现降本增效； 4、探索 Efficient AIGC、Efficient LLM 领域的问题，结合具体应用场景，通过高质量数据合成、偏好对齐等手段，提升预训练大模型能力和效率，支持公司的基础模型落地； 5、研发业界效果领先的端侧 SLLM/SVLM，赋能抖音/剪映等产品的端侧大模型需求，服务全球数十亿用户。你将获得：国内 Top 的 Mass AI Infra 团队的实习机会，针对业界前沿问题做有影响力工作的机会，实习生论文一作。

要求

1、硕士学位及以上，计算机、人工智能、软件工程相关专业； 2、具备优秀的编程能力，扎实的数据结构和基础算法功底，熟练掌握 Python，熟悉深度学习框架（如 PyTorch），有 CUDA/Triton 使用经验者优先； 3、在计算机视觉、深度学习领域期刊或会议（如 CVPR、ICCV、NeurIPS、PAMI 等）发表过论文者优先；对扩散模型、视觉 Transformer 或生成式 AI 有深入研究者优先； 4、熟悉扩散模型优化技术（如步数蒸馏、高效模型结构设计）、模型优化（如量化、剪枝、稀疏化）、了解推理加速（如算子优化、分布式推理、多卡并行等）； 5、具备优秀的问题分析与解决能力，能够自主探索并设计创新性解决方案；具备良好的沟通与协作能力，能够与团队成员共同探索新技术，推动研究进展与项目落地。