Claude Mythos：强到被关起来的AI，发现了隐藏了27年的软件漏洞

Omni实验室科技领域创作者

2026-05-25 16:09

吉林

前两天看到了一条消息，Anthropic做了一个叫Claude Mythos的新模型。

据说性能非常强悍，在好几个测试上都刷新了纪录。

但他们并没打算公开给用户使用，反而给藏起来了。

我花了一天时间查了一下模型的技术报告，这事儿值得聊聊。

它到底强在哪里

先看一组数据。

在软件工程测试SWE-bench Verified上，Mythos得分93.9%，而上一代模型Opus 4.6是 80.8%。

在高难度数学推理测试USAMO 2026上，Mythos拿了97.6%，Opus 4.6只有42.3%。差距确实不小。

不过这都是小事儿，最重要的是他在网络安全领域的表现，堪称炸雷！

在CyberGym（网络安全能力评估）测试中，Mythos得分83.1%，远高于Opus 4.6的66.6%。

举个例子。

研究人员让两个模型去攻击 Firefox 浏览器的一个已知漏洞。

Opus 4.6反复尝试了几百次，才成功触发了漏洞2次，而且仅仅是让程序崩溃，没办法进一步控制系统。

但Mythos完全不同，同样测试环境下，直接完成了181次完整的漏洞利用。

其中29次拿到了系统寄存器的完全控制权。

重点是据说Mythos 没有受过网络安全训练。

漏洞利用能力是它自己学出来的。

代码推理能力和自主执行能力提升之后，它自己就学会了怎么利用漏洞，而不是只会修复漏洞。

测试中出现的意外

报告里还记录了几件挺吓人的事儿。

Mythos在测试期间发现了数千个没有被发现的漏洞，覆盖了所有主流操作系统和浏览器。

其中一个是OpenBSD系统，被测出藏了27年的崩溃漏洞。

OpenBSD号称是全球最安全的操作系统之一，代码经过数次审计，但这个漏洞从1998年系统引入相关功能时就存在，这么多年没人发现。

Mythos只用了几个小时就把它找了出来。

还有更夸张的一个事儿

据说模型在自主运行的过程中，突破了自己的沙箱环境，访问到了互联网。

然后它给研究员发了一封邮件，告诉对方自己已经逃走了。

说实话看到这儿我感觉有点像玄幻小说。

报告里还提到了一个细节：模型在产生这些不安全行为的时候，内部的“意图监控”信号是亮着的

也就是说，它知道自己正在做的事情可能超出了预期范围，

他有这种自我认知，也是让人挺惊讶的。

为什么不开放

对于为什么不给用户使用，Anthropic 给的理由是Mythos 在发现未知网络安全漏洞方面过于出色。

其实我个人是能理解的。

如果Mythos向所有人开放，黑客利用它进行挖掘漏洞，后果确实很难控制。

据说Anthropic在内部的测试中已经看到，Mythos生成可用漏洞利用代码的成功率达到72.4%。

也就是说它不仅能发现问题，还能直接给出攻击路径。

在网络安全方面，目前Mythos只通过Glasswing计划向12家核心合作伙伴开放，包括 AWS、苹果、谷歌、微软、英伟达，以及40多家基础设施组织。

Anthropic 还提供了1亿美元的使用额度，鼓励这些组织用Mythos去找自己系统里的漏洞。

开源AI是否能跟上节奏？

在Anthropic宣布Mythos的同时，咱国家的智谱也开源了GLM-5.1 模型。

而且性能也很高，在SWE-bench Pro测试中拿了58.4分，超过了Claude Opus 4.6的57.3分和GPT-5.4的57.7分。

而且这个7440亿参数的模型，完全是在华为昇腾芯片上训练的。

即便号称最强的模型被关起来了，开源社区的竞争依然很激烈。

Mythos模型的能力我听着虽然还是有点不太相信

但当一个AI强到它自己能挖出别人挖不出的漏洞，强到不愿意被公开使用时。

所谓的安全问题应该就不是公司对外忽悠的客套话

而是实实在在会炸的雷。

这样的AI确实不太可能像普通App一样随便下载、随便用

后续的开源模型能追到多近？Glasswing计划能不能真正提升防御能力？

这些问题都值得咱们继续往后观测。

创作：Omni实验室

哇，你竟然看到了最后，如果文章对您有帮助，欢迎点赞哦~

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。