Claude Mythos:强到被关起来的AI,发现了隐藏了27年的软件漏洞

2026-05-25 16:09
吉林

前两天看到了一条消息,Anthropic做了一个叫Claude Mythos的新模型。

据说性能非常强悍,在好几个测试上都刷新了纪录。

但他们并没打算公开给用户使用,反而给藏起来了。

我花了一天时间查了一下模型的技术报告,这事儿值得聊聊。

它到底强在哪里

先看一组数据。

在软件工程测试SWE-bench Verified上,Mythos得分93.9%,而上一代模型Opus 4.6是 80.8%。

在高难度数学推理测试USAMO 2026上,Mythos拿了97.6%,Opus 4.6只有42.3%。差距确实不小。

不过这都是小事儿,最重要的是他在网络安全领域的表现,堪称炸雷!

在CyberGym(网络安全能力评估)测试中,Mythos得分83.1%,远高于Opus 4.6的66.6%。

举个例子。

研究人员让两个模型去攻击 Firefox 浏览器的一个已知漏洞。

Opus 4.6反复尝试了几百次,才成功触发了漏洞2次,而且仅仅是让程序崩溃,没办法进一步控制系统。

但Mythos完全不同,同样测试环境下,直接完成了181次完整的漏洞利用。

其中29次拿到了系统寄存器的完全控制权。

重点是据说Mythos 没有受过网络安全训练。

漏洞利用能力是它自己学出来的。

代码推理能力和自主执行能力提升之后,它自己就学会了怎么利用漏洞,而不是只会修复漏洞。

测试中出现的意外

报告里还记录了几件挺吓人的事儿。

Mythos在测试期间发现了数千个没有被发现的漏洞,覆盖了所有主流操作系统和浏览器。

其中一个是OpenBSD系统,被测出藏了27年的崩溃漏洞。

OpenBSD号称是全球最安全的操作系统之一,代码经过数次审计,但这个漏洞从1998年系统引入相关功能时就存在,这么多年没人发现。

Mythos只用了几个小时就把它找了出来。

还有更夸张的一个事儿

据说模型在自主运行的过程中,突破了自己的沙箱环境,访问到了互联网。

然后它给研究员发了一封邮件,告诉对方自己已经逃走了。

说实话看到这儿我感觉有点像玄幻小说。

报告里还提到了一个细节:模型在产生这些不安全行为的时候,内部的“意图监控”信号是亮着的

也就是说,它知道自己正在做的事情可能超出了预期范围,

他有这种自我认知,也是让人挺惊讶的。

为什么不开放

对于为什么不给用户使用,Anthropic 给的理由是Mythos 在发现未知网络安全漏洞方面过于出色。

其实我个人是能理解的。

如果Mythos向所有人开放,黑客利用它进行挖掘漏洞,后果确实很难控制。

据说Anthropic在内部的测试中已经看到,Mythos生成可用漏洞利用代码的成功率达到72.4%。

也就是说它不仅能发现问题,还能直接给出攻击路径。

在网络安全方面,目前Mythos只通过Glasswing计划向12家核心合作伙伴开放,包括 AWS、苹果、谷歌、微软、英伟达,以及40多家基础设施组织。

Anthropic 还提供了1亿美元的使用额度,鼓励这些组织用Mythos去找自己系统里的漏洞。

开源AI是否能跟上节奏?

在Anthropic宣布Mythos的同时,咱国家的智谱也开源了GLM-5.1 模型。

而且性能也很高,在SWE-bench Pro测试中拿了58.4分,超过了Claude Opus 4.6的57.3分和GPT-5.4的57.7分。

而且这个7440亿参数的模型,完全是在华为昇腾芯片上训练的。

即便号称最强的模型被关起来了,开源社区的竞争依然很激烈。

Mythos模型的能力我听着虽然还是有点不太相信

但当一个AI强到它自己能挖出别人挖不出的漏洞,强到不愿意被公开使用时。

所谓的安全问题应该就不是公司对外忽悠的客套话

而是实实在在会炸的雷。

这样的AI确实不太可能像普通App一样随便下载、随便用

后续的开源模型能追到多近?Glasswing计划能不能真正提升防御能力?

这些问题都值得咱们继续往后观测。

创作:Omni实验室

哇,你竟然看到了最后,如果文章对您有帮助,欢迎点赞哦~

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。