Lovart

内容安全运营· 2026-06-18

组内直招 北京 · 上海 正式

1. 负责平台国内外全内容场景的内容安全运营,全面覆盖用户输入prompt、图像/视频/音频/文本等生成内容、模型资产上传及社区互动场景,搭建全链路风险识别、巡查与闭环治理体系,保障平台内容生态合规安全。 2. 制定并持续迭代内容安全规则、风险分级标准、安全护栏及整体运营策略,通过精细化策略运营,持续压降平台违规漏放率、用户负面反馈,合理管控内容误杀率、模型拒答率,精准平衡平台安全合规与用户产品体验。 3. 主导平台红蓝对抗专项工作,负责大模型越狱、Prompt注入、对抗样本、规则绕过等攻击用例的挖掘与库体建设;结合数据大盘常态化风险巡检、违规案例深度复盘、风险专项治理及治理效果量化评估,推动各类模型安全问题全流程闭环优化。 4. 针对生成式AI平台核心高危风险开展专项治理工作,涵盖NSFW违规内容、深度伪造与换脸风险、名人肖像侵权、暴恐违禁内容、IP及版权侵权等重点风险场景;建立完善的风险应急响应、违规内容申诉回收、重大风险上报机制,适配海外合规治理通道与标准。 5. 联动审核团队、算法、产品、研发及第三方服务团队,推进AI审核模型、大模型安全对齐能力的持续迭代优化,将一线治理经验、对抗案例、专项方案沉淀为标准化、可复用的运营策略与SOP流程,搭建常态化治理体系。

1. 本科及以上学历,5年及以上内容安全、平台生态治理、风控运营相关工作经验。 2. 精通AIGC各类内容风险特征与常见违规类型,对图像、视频等多模态生成内容的风险识别具备敏锐的判断力和实战经验。 3. 具备扎实的数据分析、策略优化、风险闭环及跨部门协同推进能力,能够依托漏放率、误杀率、用户负反馈、响应时效等核心指标,驱动治理工作精细化落地与持续优化。 4. 熟悉国内大模型行业监管政策与合规框架,拥有出海产品Trust & Safety运营、多语种内容审核、海外平台合规治理经验者优先。 5. 有AIGC产品、内容社区、社交平台风控、AI红蓝对抗专项实战经验者优先。

在 Offer岛 浏览更多 AI 岗位 →