阿里巴巴 · Qwen团队

Agent算法实习生· 2026-05-22

国内大厂 杭州 实习

Qwen团队现开放实习生岗位,诚邀对 AI Agent、强化学习感兴趣的同学加入,与我们共同构建下一代 Computer-Use Agent Model! 1. Black-box Agent RL / Online Learning • Black-box reward / value function建模与优化 • Online RL框架设计,支持Agent在真实环境中持续探索与策略迭代 • Long-horizon RL下的credit assignment与multi-step reasoning研究 2. Computer-Use Agent (Claw/CLI Agent) 建设 • 海量真实用户交互数据scale(办公场景、流程自动化、coding等),构建部署-反馈-回流-训练的完整链路 • 构建code/cli centric的agent model,通过bash、skills、mcp等方式执行各类数字任务 • Ai Agents的自进化,探索vibe research等场景,覆盖PaperBench、MLE-Bench等 3. CLI Anything • 万物皆可CLI:参与将任意网站、桌面应用、本地工具统一转化为标准化CLI,为Agent构建开放式工具环境 • 基于Web与Desktop App构成的live environments训练open-ended agents

在 Offer岛 浏览更多 AI 岗位 →