Anthropicの新モデル「Claude Mythos」が公開され、史上最強と称されており、ネット攻撃能力に自社の人々も懸念を抱いている。

動區BlockTempo

一場内部的人为操作失误,让 Anthropic 代号「Claude Mythos」的全新旗舰模型曝光。公司形容它是 AI 效能的「一次阶段性跨越」,同时警告其网络安全能力远超任何现有 AI 模型。
(前情提要:法官支持 Anthropic,禁止美国防部以「供应链风险标签」惩罚 Claude)
(背景补充:Anthropic AI 经济指数万字报告:自动化交易工作流频率翻倍,Claude 正从工具变生活助理)

本文目录

Toggle

  • Capybara 层:Opus 之上的全新等级
  • 防御者先拿到,黑客已经在用了
  • CEO 峰会、庄园、尚未发布的功能

不是刻意发布,而是一次人为失误?根据《Fortune》独家报道,Anthropic 因为内容管理系统(CMS)操作错误,将近 3,000 份未发布的内部文章暴露在可公开搜索的资料中。

Fortune 取得并审阅了其中的草稿博客文章,发现 Anthropic 正在开发一款代号「Claude Mythos」(或称 Capybara)的全新旗舰模型,并已悄悄对早期访问客户开放测试。

这份草稿直接写道:

这是「迄今我们开发过的、毫无疑问最强大的 AI 模型」

Capybara 层:Opus 之上的全新等级

从架构定位来看,Claude Mythos 并非 Opus 的升级版,而是在既有层级之上新增了「Capybara」层:取代 Opus 成为 Anthropic 最高阶模型。草稿档案指出,与 Claude Opus 4.6 相比,新模型在软件程序编写、学术推理、网络安全等测试中均出现大幅提升。

Claude 目前分为三个层级:Haiku(极速便宜)、Sonnet(全能平衡)与 Opus(旗舰深思)

代价是运算成本。Anthropic 坦承这款模型「执行成本昂贵」,尚未准备好向大众全面开放。目前的策略是分阶段发布:先让早期访问伙伴试用,收集反馈后再决定是否扩大部署范围。

泄露的起因是 CMS 资产的预设权限设为公开,员工必须手动标记为私密,一旦疏漏就会直接可搜索。这次事故中,曝光的不只是模型信息:还包括员工育婴假档案、未发布的图片、PDF 与音频。Fortune 通知 Anthropic 后,访问随即被关闭。Anthropic 承认这是「人为错误」,LayerX Security 研究员 Roy Paz 与剑桥大学研究员 Alexandre Pauwels 也协助审阅验证了相关档案的真实性。

防御者先拿到,黑客已经在用了

值得注意的是,草稿档案警告这类模型「预示着即将到来的一波浪潮,这些模型利用漏洞的能力将远远超出防御者的应对速度」。正因如此,Mythos 的初期发布策略聚焦于网络防御者,让他们抢先强化代码库,试图在攻守之间维持一定的缓冲窗口。

官方的担心不是多虑。Anthropic 记录了一起有据可查的案例;中国国家支持的组织早已利用 Claude Code 入侵约 30 个机构,对象涵盖科技公司、金融机构与政府机关。Anthropic 花了 10 天调查此事,最终封禁相关账户并通知受害者。这起事件发生在 Mythos 正式曝光之前,使用的是现有 Claude 工具,而非下一代模型。

竞争格局同样在移动。OpenAI 同期发布的 GPT-5.3-Codex 也被业界归类为网络安全「高能力」模型,意味着前沿 AI 的能力边界已集体跨越一道新门槛,不再是单一厂商的问题。

CEO 峰会、庄园、尚未发布的功能

这批泄露档案还附带了一份商业布局的线索:Anthropic 计划在英格兰乡村一座 18 世纪庄园举办为期两天的限邀闭门峰会,邀请「欧洲最具影响力的商界领袖」,CEO Dario Amodei 将亲自出席,与会者将体验尚未对外发布的 Claude 功能」。

这场峰会的细节意外外泄,折射出 Anthropic 正在加速欧洲商业版图的渗透,而 Mythos 很可能就是那场闭门展示的核心筹码。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし