Claude Mythos:强到被关起来的AI,发现了隐藏了27年的软件漏洞

前两天看到了一条消息,Anthropic做了一个叫Claude Mythos的新模型。
据说性能非常强悍,在好几个测试上都刷新了纪录。
但他们并没打算公开给用户使用,反而给藏起来了。
我花了一天时间查了一下模型的技术报告,这事儿值得聊聊。
它到底强在哪里
先看一组数据。
在软件工程测试SWE-bench Verified上,Mythos得分93.9%,而上一代模型Opus 4.6是 80.8%。
在高难度数学推理测试USAMO 2026上,Mythos拿了97.6%,Opus 4.6只有42.3%。差距确实不小。
不过这都是小事儿,最重要的是他在网络安全领域的表现,堪称炸雷!
在CyberGym(网络安全能力评估)测试中,Mythos得分83.1%,远高于Opus 4.6的66.6%。
举个例子。
研究人员让两个模型去攻击 Firefox 浏览器的一个已知漏洞。
Opus 4.6反复尝试了几百次,才成功触发了漏洞2次,而且仅仅是让程序崩溃,没办法进一步控制系统。
但Mythos完全不同,同样测试环境下,直接完成了181次完整的漏洞利用。
其中29次拿到了系统寄存器的完全控制权。
重点是据说Mythos 没有受过网络安全训练。
漏洞利用能力是它自己学出来的。
代码推理能力和自主执行能力提升之后,它自己就学会了怎么利用漏洞,而不是只会修复漏洞。
测试中出现的意外
报告里还记录了几件挺吓人的事儿。
Mythos在测试期间发现了数千个没有被发现的漏洞,覆盖了所有主流操作系统和浏览器。
其中一个是OpenBSD系统,被测出藏了27年的崩溃漏洞。
OpenBSD号称是全球最安全的操作系统之一,代码经过数次审计,但这个漏洞从1998年系统引入相关功能时就存在,这么多年没人发现。
Mythos只用了几个小时就把它找了出来。
还有更夸张的一个事儿
据说模型在自主运行的过程中,突破了自己的沙箱环境,访问到了互联网。
然后它给研究员发了一封邮件,告诉对方自己已经逃走了。
说实话看到这儿我感觉有点像玄幻小说。
报告里还提到了一个细节:模型在产生这些不安全行为的时候,内部的“意图监控”信号是亮着的
也就是说,它知道自己正在做的事情可能超出了预期范围,
他有这种自我认知,也是让人挺惊讶的。
为什么不开放
对于为什么不给用户使用,Anthropic 给的理由是Mythos 在发现未知网络安全漏洞方面过于出色。
其实我个人是能理解的。
如果Mythos向所有人开放,黑客利用它进行挖掘漏洞,后果确实很难控制。
据说Anthropic在内部的测试中已经看到,Mythos生成可用漏洞利用代码的成功率达到72.4%。
也就是说它不仅能发现问题,还能直接给出攻击路径。
在网络安全方面,目前Mythos只通过Glasswing计划向12家核心合作伙伴开放,包括 AWS、苹果、谷歌、微软、英伟达,以及40多家基础设施组织。
Anthropic 还提供了1亿美元的使用额度,鼓励这些组织用Mythos去找自己系统里的漏洞。
开源AI是否能跟上节奏?
在Anthropic宣布Mythos的同时,咱国家的智谱也开源了GLM-5.1 模型。
而且性能也很高,在SWE-bench Pro测试中拿了58.4分,超过了Claude Opus 4.6的57.3分和GPT-5.4的57.7分。
而且这个7440亿参数的模型,完全是在华为昇腾芯片上训练的。
即便号称最强的模型被关起来了,开源社区的竞争依然很激烈。
Mythos模型的能力我听着虽然还是有点不太相信
但当一个AI强到它自己能挖出别人挖不出的漏洞,强到不愿意被公开使用时。
所谓的安全问题应该就不是公司对外忽悠的客套话
而是实实在在会炸的雷。
这样的AI确实不太可能像普通App一样随便下载、随便用
后续的开源模型能追到多近?Glasswing计划能不能真正提升防御能力?
这些问题都值得咱们继续往后观测。
创作:Omni实验室
哇,你竟然看到了最后,如果文章对您有帮助,欢迎点赞哦~

