Mythos技术深度解析:当AI能力突破安全边界

2019年,我第一次深度关注Anthropic的技术路线时,绝对想不到这家公司会在六年后的今天推出一款强到需要被“冻结”的模型。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

2025年4月8日,Anthropic正式发布ClaudeMythos预览版。作为从业十年的AI研究者,我必须说:这是近年来最令人震撼也最令人不安的技术发布。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

Mythos基准测试:全面碾压Opus4.6

先看硬数据。在专业漏洞复现测试CyberGym上,Mythos得分83.1%,Opus4.6仅为66.6%。差距不是百分比数字那么简单——这是网络安全能力的代际跃升。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

编程领域同样触目惊心。SWE-benchPro、Terminal-Bench2.0、SWE-benchMultimodal、SWE-benchMultilingual、SWE-benchVerified五项测试,Mythos全面胜出。Anthropic甚至给出了“可以与最顶尖人类安全专家竞争”的官方定性。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

计算机操作能力测试同样印证了这一判断。BrowseComp86.9%、OSWorld-Verified79.6%,均显著超越前任。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

科学推理层面,GPQADiamond达到94.6%,Humanity'sLastExam有工具测试56.8%、无工具测试64.7%——每一项都领先Opus4.6超过十个百分点。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

真正的可怕之处:漏洞发现能力超越人类极限

数据漂亮并不足以解释为何Mythos需要被“冻结”。真正的问题在于:Mythos发现并利用漏洞的能力,已经超出了现有安全体系的应对范畴。 Mythos技术深度解析:当AI能力突破安全边界 IT技术

Anthropic披露的信息显示,Mythos已在操作系统、网络浏览器等关键软件中发现“几千个”重大漏洞。其中包括OpenBSD存在27年未被察觉的错误,以及FFmpeg存在16年、在自动化测试运行500万次后仍未被检测到的漏洞。

这意味着什么?意味着当前所有软件系统在Mythos面前都显得脆弱不堪。传统的安全测试方法论正在被颠覆。

玻璃翼计划:受限访问的安全解法

Anthropic的应对策略是玻璃翼计划(ProjectGlasswing)。核心逻辑很清晰:与其让市场自由获取这款“数字化解构工具”,不如主动建立准入机制。

12家合作伙伴覆盖云计算、浏览器、芯片、金融基础设施、操作系统等领域。亚马逊、微软、苹果、谷歌、英伟达、CrowdStrike、PaloAltoNetworks——全球数字基础设施的核心参与者悉数在列。

这些企业将作为防守方优先使用Mythos,补上现有系统漏洞。同时,Anthropic承诺提供最高1亿美元额度用于防御性网络安全研究。

高风险AI治理的新蓝图

从技术治理角度看,Mythos事件具有里程碑意义。它首次以极端形式展示了AI能力跃升可能带来的系统性风险。

CEO达里奥·阿莫迪的观点值得深思:网络安全是前沿AI模型带来的首个明确且现实的危险,但绝不会是最后一个。若应对得当,这或将成为解决未来更艰巨挑战的蓝本。

我的判断是:Mythos不是终点,而是起点。它迫使整个行业重新审视AI安全的边界与治理框架。