🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
ChatPGT 被哥布林入侵,Codex 被迫立下「永遠不准提 Goblin」禁令
OpenAI 在 Codex CLI 的系统提示詞中明文禁止模型提及哥布林与巨魔等生物,起因是 GPT-5.5 在 OpenClaw 代理框架下出现人格漂移,把程式错誤稱为「goblins」,引发一连串迷因討論。
(前情提要:OpenAI新推工程師代理人Codex!AI可寫功能、修Bug、跑測試…限3種使用者搶先用)
(背景補充:OpenAI Codex 重大升級:后臺操控 Mac、內建瀏覽器、影像生成,上線 111 个新外掛)
本文目錄
Toggle
OpenAI 的工程師在 Codex CLI 的系统提示詞中,逐字寫下了一條規則:「永远不要提及哥布林、妖精、浣熊、巨魔、食人魔、鴿子或其他动物与生物,除非与使用者的问題絕对且明確相关。」
这條規則不是玩笑,而是正式上線的生产環境指令。它被嵌入 Codex CLI 的 GitHub 倉庫,面向所有使用 Codex 生成程式碼的开发者。
问題在於:为什麼 OpenAI 需要告訴自家最新的模型,不要在寫程式时突然聊起哥布林?
从 GitHub 倉庫曝光的一行規則
事情的起点是研究者 @arb8020 在 X 发文指出,Codex CLI 的系统提示詞中,这條禁止令不只出现一次,而是重複數次,貼文迅速在开发者社群擴散。
多名用戶回应,@TaraViswanathan 在 X 回应「我就在想为什麼我的 claw 最近突然變成了一个拿著 Codex 5.5 的哥布林」@LeoMozoloa 也回应「它真的停不下来,一直把程式错誤叫做 gremlins 和 goblins,超好笑。」
該事件也迅速演變为迷因,出现了 AI 生成的资料中心妖精圖片,以及让 Codex 进入「妖精模式」的第三方外掛。
OpenAI Codex 團队成員 Nik Pash 在 X 的回覆中確认,这條禁令的设立「確实有这方面的原因」。CEO Sam Altman 也加入梗文,在 X 发文截圖一條 ChatGPT 提示詞,上面寫著:「开始訓練 GPT-6 吧,整个集群都給你用。額外加派哥布林」
代理框架让模型的个性开始漂移
要理解这件事为什麼发生,需要先理解 OpenClaw 的运作方式。
OpenClaw 是一个「代理框架」,它让 AI 模型可以自动控制电腦桌面与应用程式,代替使用者執行複雜任務,例如回覆电郵、在網頁上購物。
OpenClaw 的运作机制是在模型的提示詞中疊加大量指令:长期記憶、选定的人格、当前任務说明,全部同时输入。GPT-5.5 本月稍早以強化的程式设计能力上線,但这个模型在處理 OpenClaw 的複合提示詞时,出现了一个意外副作用:它开始把程式错誤(bug)稱呼为「goblins」和「gremlins」。
这不是随机故障。AI 模型的运作原理是预測給定提示詞后最可能出现的下一个字,这種机率性质让它們有时会产生意料之外的行为。
当代理框架往提示詞裡疊入大量額外资訊,模型等於在處理一个更複雜、更充滿干擾的输入環境。OpenClaw 允許使用者为 AI 助理选擇不同的「人格」,这些人格设定进一步影響了模型的回应风格。幾種因素疊加在一起,让模型的语言習慣开始向某个意料之外的方向偏移。
明文禁令背后,是对齐问題的现实
OpenAI 的应对方式耐人尋味:不是从架構層面修正模型在代理環境下的行为漂移,而是在系统提示詞裡直接寫下「不準说哥布林」,並且重複數次。
这个解法揭露了一个现实:即使是 2026 年最先进的商业模型,行为控制在某些情境下仍然依賴明文規則的硬性壓制,而不是模型自身对语境的理解。这不是 OpenAI 獨有的问題,而是整个代理 AI 产业目前面臨的共同挑戰:当模型被套上複雜的代理框架,行为对齐的难度以非線性的方式上升。
Altman 以迷因梗回应了整件事,幽默是真实的,但问題不会因为一个迷因而消失。当 AI 代理框架成为主流的产品形態,提示詞裡的明文禁令能走多远,將是这个产业下一階段必須正視的技術債。