内容安全运营· 2026-06-18

组内直招北京 · 上海正式

描述

1. 负责平台国内外全内容场景的内容安全运营，全面覆盖用户输入prompt、图像/视频/音频/文本等生成内容、模型资产上传及社区互动场景，搭建全链路风险识别、巡查与闭环治理体系，保障平台内容生态合规安全。 2. 制定并持续迭代内容安全规则、风险分级标准、安全护栏及整体运营策略，通过精细化策略运营，持续压降平台违规漏放率、用户负面反馈，合理管控内容误杀率、模型拒答率，精准平衡平台安全合规与用户产品体验。 3. 主导平台红蓝对抗专项工作，负责大模型越狱、Prompt注入、对抗样本、规则绕过等攻击用例的挖掘与库体建设；结合数据大盘常态化风险巡检、违规案例深度复盘、风险专项治理及治理效果量化评估，推动各类模型安全问题全流程闭环优化。 4. 针对生成式AI平台核心高危风险开展专项治理工作，涵盖NSFW违规内容、深度伪造与换脸风险、名人肖像侵权、暴恐违禁内容、IP及版权侵权等重点风险场景；建立完善的风险应急响应、违规内容申诉回收、重大风险上报机制，适配海外合规治理通道与标准。 5. 联动审核团队、算法、产品、研发及第三方服务团队，推进AI审核模型、大模型安全对齐能力的持续迭代优化，将一线治理经验、对抗案例、专项方案沉淀为标准化、可复用的运营策略与SOP流程，搭建常态化治理体系。

要求

1. 本科及以上学历，5年及以上内容安全、平台生态治理、风控运营相关工作经验。 2. 精通AIGC各类内容风险特征与常见违规类型，对图像、视频等多模态生成内容的风险识别具备敏锐的判断力和实战经验。 3. 具备扎实的数据分析、策略优化、风险闭环及跨部门协同推进能力，能够依托漏放率、误杀率、用户负反馈、响应时效等核心指标，驱动治理工作精细化落地与持续优化。 4. 熟悉国内大模型行业监管政策与合规框架，拥有出海产品Trust & Safety运营、多语种内容审核、海外平台合规治理经验者优先。 5. 有AIGC产品、内容社区、社交平台风控、AI红蓝对抗专项实战经验者优先。