OpenAI推出了人工智能的新标准:如何负责任地管理成人内容

在2024年5月,OpenAI公布了一份名为Model Spec的详细指南,定义了现代人工智能系统的运作原则。该文件为虚拟助手(包括ChatGPT)在与用户互动时应遵循的行为奠定了基础。特别值得关注的是公司在敏感问题上的创新方法:正式开始研究在符合年龄限制的场景中负责任地生成NSFW内容的方法。

这一决定象征着在人工智能技术快速发展和大规模应用阶段,管理策略的演变。

OpenAI行为管理哲学的三大支柱

Model Spec的基础建立在三个核心原则之上。首先,人工智能算法应提供有用的回答,符合开发者和最终用户的明确指示。其次,这些系统必须造福人类,充分考虑其积极影响和潜在风险。第三,模型的行为应反映OpenAI的企业价值观,尊重不同司法管辖区内的社会规范和法律框架。

这些原则为面向AI技术应用开发者的具体指导提供了基础。

色情内容与AI:从禁止到受控使用

Model Spec中包含了对AI系统行为的详细规范。其中包括遵守命令层级、遵循各国法律、保护版权和个人隐私的要求。特别指出,系统默认不得提供NSFW内容。

但这正是OpenAI方法中的创新元素。公司提出了一种概念,允许企业和最终用户“切换”AI模型生成内容的级别。其中最受关注的例子之一是对色情内容的管理。

根据OpenAI的官方声明,实验室“正在研究在年龄限制范围内,通过API和ChatGPT界面安全提供此类内容生成功能的可能性”。这意味着,成人用户在符合当地法律的情况下,可以访问此类内容,而未成年人则会自动受到保护,避免接触此类材料。

默认优先级:AI应如何思考和行动

文件还定义了AI助手在与用户互动中应表现出的标准行为。建议系统假设对话参与者的善意,积极提出澄清性问题以更好理解任务,尊重用户的个人界限,并在分析信息时保持客观。

此外,还强调应避免煽动仇恨,不试图强加自身立场,并在不确定答案的情况下坦率表达不确定性。

当前实施状态:从规划到落地

值得注意的是,新的Model Spec目前尚未影响OpenAI已发布的产品,如GPT-4和DALL-E 3。这些系统将继续在现有使用政策框架下运行。公司产品经理Joan Jang表示,Model Spec被设计为一个动态、持续更新的文件,欢迎反馈。

OpenAI正积极征求来自政府官员、权威机构和专业领域专家的建议,这些人士使用或研究公司的服务。然而,仍有未解之谜:哪些意见会被采纳,谁将决定最终的变更清单,以及第二版文件何时发布——目前尚未公布相关信息。

此举彰显了OpenAI在管理AI系统方面设定新标准的雄心,包括对敏感问题如色情内容监管的伦理和法律考量,力求全面预估和应对各种挑战。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论