Anthropic旗下AI模型Mythos遭黑客入侵事件始末

2026-04-27 11:17

北京

这对一家将AI安全作为核心品牌形象的公司而言，实属难堪。

Anthropic对Claude Mythos的严格管控推出计划，近日出现了令人尴尬的转折。该公司此前数周一再强调，这款AI模型在网络安全领域的能力过于强大，危险性过高，因此不宜向公众开放。然而讽刺的是，该模型最终还是落入了未经授权人员的手中。

据报道，自Anthropic宣布计划向少数企业提供Mythos测试访问权限当天起，一个"小规模未授权用户群体"便已获得了该模型的访问途径——而Mythos的存在本身，最初也是通过一次信息泄露才得以曝光。目前Anthropic表示正在调查此事。对于一家以认真对待AI安全为立身之本、同时大力宣传其最新模型网络安全能力的公司来说，这无疑是相当难堪的局面。

从技术角度来看，此次Mythos泄露事件令人尴尬的原因在于其入侵手段极为低级。报道称，该群体是通过对模型在线位置进行"有根据的猜测"而获得访问权限的。他们利用了AI培训数据公司Mercor遭受数据泄露后暴露的Anthropic其他模型相关信息，加上其中一名成员此前曾以合同工身份参与Anthropic模型评估工作而获得的内部权限。整个入侵过程结合了内部知识与运气成分，而非依赖某种复杂的技术手段或对模型的全面窃取。

Anthropic未能预防"完全可以预见"的安全漏洞

安全漏洞在所难免，且向黑客提供关键信息的是Mercor，而非Anthropic本身。英国皇家联合军种研究所（RUSI）研究员皮娅·许施告诉我，没有任何公司能做到万无一失，人为因素往往是最薄弱的环节，尽管此次事件"初看之下确实带有一定运气成分"，未造成严重后果。

然而这并非纯粹的运气问题。此类有根据的猜测是极为常见的黑客攻击手段，而Mercor的数据泄露在Mythos发布之前便已是公开的事实。安全研究员卢卡什·奥列伊尼克在接受我采访时将其描述为一种"完全可以预见"的失误——网络安全行业在过去20年里已对此类攻击司空见惯。因此，Anthropic本应预判到这一风险并做好相应准备，尤其是在已知自身信息遭到泄露的情况下，更应如此。

奥列伊尼克还指出，Anthropic原本具备发现此次入侵的技术手段。该公司能够对模型使用情况进行"日志记录与追踪"，这本应使其能够阻止未授权或恶意访问——尤其是考虑到Mythos的推出范围原本应极为有限。显然，Anthropic的监控力度远远不够。鉴于该公司一再强调这款模型的危险性，外界有理由追问：为何监管如此松懈？

据报道，该群体并未将Mythos用于网络安全攻击任务，部分原因是他们只是想探索这款新模型，另一部分原因则是这样做可能会惊动Anthropic。如果Anthropic围绕Mythos发出的警示值得认真对待，那么这算是不幸中的万幸。该公司将Mythos定位为"网络安全领域的里程碑"，声称其发现了"所有主流操作系统和网络浏览器"中的安全漏洞，并表示其发布必须经过统筹协调，以留出时间"强化全球网络防御体系"。

Anthropic惯于使用戏剧性的、听起来令人警觉的措辞，这类表述有时难以得到清晰验证，甚至包括暗示其Claude模型可能具有意识的说法。尽管如此，来自有权访问该模型各方的早期报告显示，Mythos在网络安全领域确实表现出色。Mozilla首席技术官博比·霍利表示，该模型在Firefox 150中发现了数百个漏洞，或许能让防御方在对抗攻击者的博弈中首次取得全面胜利。不出意外，世界各地的政府机构和金融机构都对其趋之若鹜。据报道，尽管Anthropic被列为供应链风险，美国国家安全局及其他美国机构仍获得了访问权限，但此次推出似乎尚未将美国网络安全和基础设施安全局（CISA）纳入其中。

"Anthropic声称自己站在这些技术的绝对最前沿，同时也将自己定位为这一切中负责任的行为者。"

此次入侵事件由记者而非Anthropic自身发现，这一事实不禁令人追问：这是否只是一起孤立事件？许施表示，这"真实地揭示了潜在实施者群体的规模有多广泛，即便他们并不具备高度复杂的技术手段"。Anthropic很可能会对其供应链展开全面排查，弄清事件原委并堵塞漏洞，但她指出，想要获取此类模型访问权限的行为者范围极广，其中不乏资金雄厚者。没有理由假设其他可能已获得访问权限的人，会像报道中提及的那个群体一样保持克制。

某种程度上，Anthropic是在自食其果。该公司的品牌形象建立在比竞争对手更认真对待AI安全的基础之上，这为其模型安全树立了极高的预期标准，而此次明显的疏忽与之形成了强烈反差；尤其是Mythos竟通过如此基础且可预见的漏洞遭到入侵，更加凸显了这一落差。更糟糕的是，Anthropic将Mythos大力渲染为一款能力非凡、危险性过高而不宜公开发布的工具，这反而使其成为了众矢之的——无论是对恶意攻击者，还是对那些单纯寻求挑战的黑客而言，皆是如此。

这甚至不是Mythos首次陷入安全尴尬。该模型的存在此前曾在正式发布前，通过其网站内容所在中央系统上的一处"不安全数据存储"意外泄露。如今，该模型又通过一个完全可以预见、Anthropic却未想到予以修补的漏洞遭到秘密访问。完美固然无从企及，但对于一家自诩为AI安全领域先锋的公司而言，如此基础性的失误实难辩解，即便考虑到其所遭遇的部分运气不佳因素，亦是如此。

在许施看来，整件事可以用一个词来概括：羞耻。"Anthropic声称自己站在这些技术的绝对最前沿，同时也将自己定位为这一切中负责任的行为者，"她说，"而如今，该模型竟在如此短的时间内通过未授权手段、以如此低级的尝试遭到访问，这对他们而言是真正的羞耻。"

Q&A

Q1：Claude Mythos是什么模型？为什么不对外公开发布？

A：Claude Mythos是Anthropic开发的一款AI模型，该公司声称其在网络安全领域能力极强，曾发现所有主流操作系统和浏览器中的漏洞。正因如此，Anthropic认为公开发布风险过高，仅向少数经过筛选的企业提供测试访问权限，并表示需要统筹协调发布时间，以留出强化全球网络防御体系的准备时间。

Q2：黑客是如何入侵Mythos的？技术手段复杂吗？

A：入侵手段并不复杂。未授权群体通过对模型在线位置进行"有根据的猜测"获得访问权限，所利用的信息来自AI培训数据公司Mercor此前遭受的数据泄露，加上一名成员曾以合同工身份评估Anthropic模型时获得的内部知识。安全研究员将其描述为网络安全行业20年来已司空见惯的"完全可以预见"的攻击方式。

Q3：Anthropic此次安全事故暴露了哪些管理问题？

A：主要暴露了两方面问题：一是风险预判不足，Mercor数据泄露在Mythos发布前便已公开，Anthropic理应提前预判并修补相关漏洞；二是监控缺位，该公司本具备对模型使用情况进行日志记录与追踪的技术能力，却未能及时发现未授权访问，最终还是由媒体记者而非公司自身披露了这一事件。

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。