阿里巴巴 · 通义实验室
6 个岗位· 2026-05-20
团队介绍
通义语音对话团队,过去一年发布 Fun-AudioChat 系列,专注于端到端语音对话大模型的研发以及下游多模态对话业务落地,目标是让语音交互具备真正的对话智商、自然的双工节奏和丰富的表现力。 近期进展:Fun-AudioChat 1.5 在 Artificial Analysis 榜单的 Conversational Dynamics 和 Speech Reasoning 两项评测中排名第一,VStyle 对话表现力 benchmark 平均得分 4.19,超过 GPT-Realtime-2。
01
语音大模型
02
端到端语音与多模态对话
03
对话交互技术
04
Agentic 能力
05
强化学习后训练
06