多模态大模型优化实习生· 2026-06-23
字节 Data-AML AI Infra 团队招多模态大模型优化实习生,方向含投机解码/量化/蒸馏等前沿加速,实习生论文一作。
部门:Data-AML 某 AI Infra 团队。团队尤其需要投机解码方向、距离毕业时间一年以上的在读硕士/博士。 职位描述: 1、深度参与对字节跳动自研模型 Seedance/Seedream/Seed-VLM,以及开源 LLM/VLM 模型的软硬件协同优化和算法优化,构建业界领先的模型优化能力矩阵; 2、研发面向多端异构平台的量化&稀疏、MOE 压缩、Token 压缩、Cache 复用、投机解码、KV Cache 压缩等加速算法,构建 Training-Free 或结合 Post-training/RL-Training 的加速算法矩阵; 3、面向分布式训练/推理场景,深度挖掘模型表示位宽/分辨率/步数/结构等维度的冗余,并加速训练和推理过程,通过算法和工程创新实现降本增效; 4、探索 Efficient AIGC、Efficient LLM 领域的问题,结合具体应用场景,通过高质量数据合成、偏好对齐等手段,提升预训练大模型能力和效率,支持公司的基础模型落地; 5、研发业界效果领先的端侧 SLLM/SVLM,赋能抖音/剪映等产品的端侧大模型需求,服务全球数十亿用户。 你将获得:国内 Top 的 Mass AI Infra 团队的实习机会,针对业界前沿问题做有影响力工作的机会,实习生论文一作。
1、硕士学位及以上,计算机、人工智能、软件工程相关专业; 2、具备优秀的编程能力,扎实的数据结构和基础算法功底,熟练掌握 Python,熟悉深度学习框架(如 PyTorch),有 CUDA/Triton 使用经验者优先; 3、在计算机视觉、深度学习领域期刊或会议(如 CVPR、ICCV、NeurIPS、PAMI 等)发表过论文者优先;对扩散模型、视觉 Transformer 或生成式 AI 有深入研究者优先; 4、熟悉扩散模型优化技术(如步数蒸馏、高效模型结构设计)、模型优化(如量化、剪枝、稀疏化)、了解推理加速(如算子优化、分布式推理、多卡并行等); 5、具备优秀的问题分析与解决能力,能够自主探索并设计创新性解决方案;具备良好的沟通与协作能力,能够与团队成员共同探索新技术,推动研究进展与项目落地。