生数科技
2 个岗位· 2026-06-22
团队介绍
生数科技(Vidu 团队)招募 Video World Model 与视频基础模型预训练方向的 Research Intern / 正式员工
01
Video World Model Research 实习
描述
研究方向:Interactive Video Generation / Long-horizon Video Generation。探索下一代视频世界模型与自回归视频生成。
要求
熟悉 Image / Video Diffusion 相关工作;有视频生成模型训练、微调或复现经验;熟悉经典 Forcing 系列工作优先(例如 Self Forcing / Causal Forcing / LongLive 等);对 Video World Model、Autoregressive Video Generation 等方向有浓厚兴趣;有论文、开源项目或相关研究经历优先。
02
Video Foundation Model Pretraining 实习/正式
描述
参与大规模视频基础模型预训练与能力提升。三个研究方向: (1) 模型架构:视频 VAE 设计与优化、MoE 架构探索与训练稳定性、Scaling Law 分析、分布式训练系统; (2) Data / Caption:Video Caption 与 Recaption、数据质量评估与优化、VLM 数据构建与筛选、数据驱动的视频模型能力提升; (3) Post-training:Video Refiner、蒸馏。
要求
对大规模视频预训练 / 视频基础模型有浓厚兴趣;在模型架构、数据 / Caption 或 Post-training 等方向有相关研究或工程经验者优先。