阿里巴巴 · 通义多模态生成团队(MAI)
多模态生成算法实习生· 2026-06-12
介绍
通义 MAI 团队招视觉/视频生成方向算法实习生,顶尖团队 + 海量算力 + 极高转正机会
描述
我们是通义多模态交互部门,阿里集团前沿 AI 研究的核心阵地,代表作包括 Z-Image、MAI-UI 等。当前我们正全力打造下一代引领行业变革的前沿多模态生成模型。 核心方向: - 可控视觉生成:Layout-to-Image、精准局部编辑、多图融合生成 - 视频/3D 基础模型:高一致性、长时视觉生成 你会做什么: - 研发前沿的扩散模型(Diffusion)与自回归(Autoregressive)生成架构 - 攻克多图一致性、排版布局可控、精细化图像编辑等业界前沿难题 - 推动多模态生成算法在通义千问等亿级用户场景的创新落地 为什么选我们: - 顶尖团队:与前沿科学家并肩,技术自由度高,支持学术发顶会 - 海量算力:提供极其充沛的计算资源,支持大规模模型训练 - 高额福利:具竞争力的薪资 + 餐补 + 导师 1v1 + 极高转正机会
要求
- 计算机、人工智能等相关专业硕士/博士 - 熟悉 PyTorch,在 AIGC / 扩散模型 / 图像生成 / MLLM 等至少一个方向有深厚积累 - 在 CVPR、ICCV、ECCV、NeurIPS、ICLR 等顶会有高水平论文或顶级竞赛获奖者优先 - 要求连续实习 6 个月以上,每周投入 3-4 天 投递说明:邮件及简历命名 [多模态生成·实习] + 姓名