阿里巴巴 · 通义多模态生成团队（MAI）

多模态生成算法实习生· 2026-06-12

国内大厂杭州 / 北京实习

介绍

通义 MAI 团队招视觉/视频生成方向算法实习生，顶尖团队 + 海量算力 + 极高转正机会

描述

我们是通义多模态交互部门，阿里集团前沿 AI 研究的核心阵地，代表作包括 Z-Image、MAI-UI 等。当前我们正全力打造下一代引领行业变革的前沿多模态生成模型。核心方向： - 可控视觉生成：Layout-to-Image、精准局部编辑、多图融合生成 - 视频/3D 基础模型：高一致性、长时视觉生成你会做什么： - 研发前沿的扩散模型（Diffusion）与自回归（Autoregressive）生成架构 - 攻克多图一致性、排版布局可控、精细化图像编辑等业界前沿难题 - 推动多模态生成算法在通义千问等亿级用户场景的创新落地为什么选我们： - 顶尖团队：与前沿科学家并肩，技术自由度高，支持学术发顶会 - 海量算力：提供极其充沛的计算资源，支持大规模模型训练 - 高额福利：具竞争力的薪资 + 餐补 + 导师 1v1 + 极高转正机会

要求

- 计算机、人工智能等相关专业硕士/博士 - 熟悉 PyTorch，在 AIGC / 扩散模型 / 图像生成 / MLLM 等至少一个方向有深厚积累 - 在 CVPR、ICCV、ECCV、NeurIPS、ICLR 等顶会有高水平论文或顶级竞赛获奖者优先 - 要求连续实习 6 个月以上，每周投入 3-4 天投递说明：邮件及简历命名 [多模态生成·实习] + 姓名