阿里巴巴 · 通义实验室

6 个岗位· 2026-05-20

国内大厂 北京 / 杭州 / 上海 实习 正式

通义语音对话团队,过去一年发布 Fun-AudioChat 系列,专注于端到端语音对话大模型的研发以及下游多模态对话业务落地,目标是让语音交互具备真正的对话智商、自然的双工节奏和丰富的表现力。 近期进展:Fun-AudioChat 1.5 在 Artificial Analysis 榜单的 Conversational Dynamics 和 Speech Reasoning 两项评测中排名第一,VStyle 对话表现力 benchmark 平均得分 4.19,超过 GPT-Realtime-2。

01

语音大模型

02

端到端语音与多模态对话

03

对话交互技术

04

Agentic 能力

05

强化学习后训练

06

NLP

在 Offer岛 浏览更多 AI 岗位 →