生数
视频生成大模型 Infra / 系统优化· 2026-05-06
介绍
模型架构与算法部门负责人赵敏介绍,岗位聚焦视频生成大模型 Infra / 系统优化方向,深入模型设计 + 系统工程 + 硬件优化三位一体的「大模型 Infra 天花板级岗位」,做系统 + 算法 + 硬件 co-design,适合想做大模型底层、喜欢优化与榨性能、对 GPU/系统有执念的人。邮件标题请标注:[实习类型] + 姓名 + 学校。
描述
- 和视频 foundation model 算法团队一起,从源头设计更高效的架构(如 Linear DiT、Sparse Attention) - 在复杂数据场景(多模态交互、超长视频)下探索 RLHF / MoE / 超长上下文、FP8 / BF16 混合训练、INT4 / FP4 / NF4 低比特推理 - 搭建和维护高性能视频生成训练框架 - 工程与系统挑战:千卡规模训练 + PB 级数据;深入 GPU + 网络(NVLink / InfiniBand / RoCE);用 NSight 做端到端 profiling - 进行通信-计算 overlap、动态 batching、异构卸载等极致优化,目标是把集群算力榨干
要求
- 深度学习基础扎实,不仅会用,还要理解本质 - 对性能优化有感觉 - 熟悉 PyTorch + 分布式 - Python / C++ 都要能打 - 会写 kernel(Triton / CUTLASS / TileLang 等) - 熟悉新一代 GPU 特性(TMA / cluster CTA / tcgen05)