Agent算法工程师· 2026-05-25

国内大厂北京 · 上海 · 杭州正式实习

介绍

探索大模型在计算机交互与多模态生产力中的应用，构建高保真环境与数据集，推动智能体闭环进化。探索大模型在真实数字世界中的“手”与“眼”。我们将聚焦于 Computer Use Agent （CUA）与多模态生产力场景（如自动化办公、视频内容理解与生成），通过构建高保真交互环境、高质量指令数据及先进的RL.奖励机制，赋予 Qwen自主操作GUI、处理复杂多媒体任务的能力，实现从“感知”到“行动”的闭环进化。 1. Computer Use Agent （CLI & GUI 混合交互范式）：探索并实现命令行（CLI）与图形界面（GUI）无缝协同的新一代 Agent架构。Agent 将同时具备开发者级的终端操控能力与面向通用软件的界面交互能力。 2. Productivity Agent（多模态生产力场景）：面向真实需求，构建覆盖多领域的自动化智能体矩阵：（1）办公自动化：专业PPT制作、复杂文档生成与排版等长链路工作流。（2）Video Agent：视频内容深度理解、智能视频剪辑/合成、多媒体流实时分析与交互。（3）场景扩展：数据分析与可视化、创意设计工作流自动化等，持续拓宽 Agent 的生产力边界。

描述

Qwen Computer Use & Multimodal Productivity Agent 实习/校招。 1. 环境搭建（Environment）：构建高保真、可扩展的训练和测试环境。 2. 数据构造（Data）：设计多模态Agent轨迹采集与合成 Pipeline，构建高质量数据集。 3. 奖励系统（Reward）：针对长程任务设计细粒度、多维度奖励信号。 4. RL 算法研究（Algorithm）：深入研究RL算法在 Agent 场景下的优化。邮件请注明“Qwen CU & Productivity Agent应聘 - [姓名]”并附上最新建立。

要求

1. 熟悉 Agent 框架与生态，深度使用或研究过 Claude Code、OpenClaw 等主流框架。 2. 具备扎实的 RL 算法功底与大模型后训练经验。 3. 拥有复杂/大规模交互环境搭建经验。 4. 拥有扎实的多模态技术积累，熟悉 VLM架构。加分项 1. 有Computer Use / CLI+GUI Hybrid Agent 的完整项目或开源贡献经验。 2. 思维严谨，表达清晰，逻辑闭环能力强； 3. Ego 小，善于跨团队协作，能在快速迭代中持续交付高质量结果。