Anthropic旗下AI模型Mythos遭黑客入侵事件始末

2026-04-27 11:17
北京

这对一家将AI安全作为核心品牌形象的公司而言,实属难堪。

Anthropic对Claude Mythos的严格管控推出计划,近日出现了令人尴尬的转折。该公司此前数周一再强调,这款AI模型在网络安全领域的能力过于强大,危险性过高,因此不宜向公众开放。然而讽刺的是,该模型最终还是落入了未经授权人员的手中。

据报道,自Anthropic宣布计划向少数企业提供Mythos测试访问权限当天起,一个"小规模未授权用户群体"便已获得了该模型的访问途径——而Mythos的存在本身,最初也是通过一次信息泄露才得以曝光。目前Anthropic表示正在调查此事。对于一家以认真对待AI安全为立身之本、同时大力宣传其最新模型网络安全能力的公司来说,这无疑是相当难堪的局面。

从技术角度来看,此次Mythos泄露事件令人尴尬的原因在于其入侵手段极为低级。报道称,该群体是通过对模型在线位置进行"有根据的猜测"而获得访问权限的。他们利用了AI培训数据公司Mercor遭受数据泄露后暴露的Anthropic其他模型相关信息,加上其中一名成员此前曾以合同工身份参与Anthropic模型评估工作而获得的内部权限。整个入侵过程结合了内部知识与运气成分,而非依赖某种复杂的技术手段或对模型的全面窃取。

Anthropic未能预防"完全可以预见"的安全漏洞

安全漏洞在所难免,且向黑客提供关键信息的是Mercor,而非Anthropic本身。英国皇家联合军种研究所(RUSI)研究员皮娅·许施告诉我,没有任何公司能做到万无一失,人为因素往往是最薄弱的环节,尽管此次事件"初看之下确实带有一定运气成分",未造成严重后果。

然而这并非纯粹的运气问题。此类有根据的猜测是极为常见的黑客攻击手段,而Mercor的数据泄露在Mythos发布之前便已是公开的事实。安全研究员卢卡什·奥列伊尼克在接受我采访时将其描述为一种"完全可以预见"的失误——网络安全行业在过去20年里已对此类攻击司空见惯。因此,Anthropic本应预判到这一风险并做好相应准备,尤其是在已知自身信息遭到泄露的情况下,更应如此。

奥列伊尼克还指出,Anthropic原本具备发现此次入侵的技术手段。该公司能够对模型使用情况进行"日志记录与追踪",这本应使其能够阻止未授权或恶意访问——尤其是考虑到Mythos的推出范围原本应极为有限。显然,Anthropic的监控力度远远不够。鉴于该公司一再强调这款模型的危险性,外界有理由追问:为何监管如此松懈?

据报道,该群体并未将Mythos用于网络安全攻击任务,部分原因是他们只是想探索这款新模型,另一部分原因则是这样做可能会惊动Anthropic。如果Anthropic围绕Mythos发出的警示值得认真对待,那么这算是不幸中的万幸。该公司将Mythos定位为"网络安全领域的里程碑",声称其发现了"所有主流操作系统和网络浏览器"中的安全漏洞,并表示其发布必须经过统筹协调,以留出时间"强化全球网络防御体系"。

Anthropic惯于使用戏剧性的、听起来令人警觉的措辞,这类表述有时难以得到清晰验证,甚至包括暗示其Claude模型可能具有意识的说法。尽管如此,来自有权访问该模型各方的早期报告显示,Mythos在网络安全领域确实表现出色。Mozilla首席技术官博比·霍利表示,该模型在Firefox 150中发现了数百个漏洞,或许能让防御方在对抗攻击者的博弈中首次取得全面胜利。不出意外,世界各地的政府机构和金融机构都对其趋之若鹜。据报道,尽管Anthropic被列为供应链风险,美国国家安全局及其他美国机构仍获得了访问权限,但此次推出似乎尚未将美国网络安全和基础设施安全局(CISA)纳入其中。

"Anthropic声称自己站在这些技术的绝对最前沿,同时也将自己定位为这一切中负责任的行为者。"

此次入侵事件由记者而非Anthropic自身发现,这一事实不禁令人追问:这是否只是一起孤立事件?许施表示,这"真实地揭示了潜在实施者群体的规模有多广泛,即便他们并不具备高度复杂的技术手段"。Anthropic很可能会对其供应链展开全面排查,弄清事件原委并堵塞漏洞,但她指出,想要获取此类模型访问权限的行为者范围极广,其中不乏资金雄厚者。没有理由假设其他可能已获得访问权限的人,会像报道中提及的那个群体一样保持克制。

某种程度上,Anthropic是在自食其果。该公司的品牌形象建立在比竞争对手更认真对待AI安全的基础之上,这为其模型安全树立了极高的预期标准,而此次明显的疏忽与之形成了强烈反差;尤其是Mythos竟通过如此基础且可预见的漏洞遭到入侵,更加凸显了这一落差。更糟糕的是,Anthropic将Mythos大力渲染为一款能力非凡、危险性过高而不宜公开发布的工具,这反而使其成为了众矢之的——无论是对恶意攻击者,还是对那些单纯寻求挑战的黑客而言,皆是如此。

这甚至不是Mythos首次陷入安全尴尬。该模型的存在此前曾在正式发布前,通过其网站内容所在中央系统上的一处"不安全数据存储"意外泄露。如今,该模型又通过一个完全可以预见、Anthropic却未想到予以修补的漏洞遭到秘密访问。完美固然无从企及,但对于一家自诩为AI安全领域先锋的公司而言,如此基础性的失误实难辩解,即便考虑到其所遭遇的部分运气不佳因素,亦是如此。

在许施看来,整件事可以用一个词来概括:羞耻。"Anthropic声称自己站在这些技术的绝对最前沿,同时也将自己定位为这一切中负责任的行为者,"她说,"而如今,该模型竟在如此短的时间内通过未授权手段、以如此低级的尝试遭到访问,这对他们而言是真正的羞耻。"

Q&A

Q1:Claude Mythos是什么模型?为什么不对外公开发布?

A:Claude Mythos是Anthropic开发的一款AI模型,该公司声称其在网络安全领域能力极强,曾发现所有主流操作系统和浏览器中的漏洞。正因如此,Anthropic认为公开发布风险过高,仅向少数经过筛选的企业提供测试访问权限,并表示需要统筹协调发布时间,以留出强化全球网络防御体系的准备时间。

Q2:黑客是如何入侵Mythos的?技术手段复杂吗?

A:入侵手段并不复杂。未授权群体通过对模型在线位置进行"有根据的猜测"获得访问权限,所利用的信息来自AI培训数据公司Mercor此前遭受的数据泄露,加上一名成员曾以合同工身份评估Anthropic模型时获得的内部知识。安全研究员将其描述为网络安全行业20年来已司空见惯的"完全可以预见"的攻击方式。

Q3:Anthropic此次安全事故暴露了哪些管理问题?

A:主要暴露了两方面问题:一是风险预判不足,Mercor数据泄露在Mythos发布前便已公开,Anthropic理应提前预判并修补相关漏洞;二是监控缺位,该公司本具备对模型使用情况进行日志记录与追踪的技术能力,却未能及时发现未授权访问,最终还是由媒体记者而非公司自身披露了这一事件。

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。