Mythos技术深度解析:当AI能力突破安全边界
2019年,我第一次深度关注Anthropic的技术路线时,绝对想不到这家公司会在六年后的今天推出一款强到需要被“冻结”的模型。
2025年4月8日,Anthropic正式发布ClaudeMythos预览版。作为从业十年的AI研究者,我必须说:这是近年来最令人震撼也最令人不安的技术发布。
Mythos基准测试:全面碾压Opus4.6
先看硬数据。在专业漏洞复现测试CyberGym上,Mythos得分83.1%,Opus4.6仅为66.6%。差距不是百分比数字那么简单——这是网络安全能力的代际跃升。
编程领域同样触目惊心。SWE-benchPro、Terminal-Bench2.0、SWE-benchMultimodal、SWE-benchMultilingual、SWE-benchVerified五项测试,Mythos全面胜出。Anthropic甚至给出了“可以与最顶尖人类安全专家竞争”的官方定性。
计算机操作能力测试同样印证了这一判断。BrowseComp86.9%、OSWorld-Verified79.6%,均显著超越前任。
科学推理层面,GPQADiamond达到94.6%,Humanity'sLastExam有工具测试56.8%、无工具测试64.7%——每一项都领先Opus4.6超过十个百分点。
真正的可怕之处:漏洞发现能力超越人类极限
数据漂亮并不足以解释为何Mythos需要被“冻结”。真正的问题在于:Mythos发现并利用漏洞的能力,已经超出了现有安全体系的应对范畴。
Anthropic披露的信息显示,Mythos已在操作系统、网络浏览器等关键软件中发现“几千个”重大漏洞。其中包括OpenBSD存在27年未被察觉的错误,以及FFmpeg存在16年、在自动化测试运行500万次后仍未被检测到的漏洞。
这意味着什么?意味着当前所有软件系统在Mythos面前都显得脆弱不堪。传统的安全测试方法论正在被颠覆。
玻璃翼计划:受限访问的安全解法
Anthropic的应对策略是玻璃翼计划(ProjectGlasswing)。核心逻辑很清晰:与其让市场自由获取这款“数字化解构工具”,不如主动建立准入机制。
12家合作伙伴覆盖云计算、浏览器、芯片、金融基础设施、操作系统等领域。亚马逊、微软、苹果、谷歌、英伟达、CrowdStrike、PaloAltoNetworks——全球数字基础设施的核心参与者悉数在列。
这些企业将作为防守方优先使用Mythos,补上现有系统漏洞。同时,Anthropic承诺提供最高1亿美元额度用于防御性网络安全研究。
高风险AI治理的新蓝图
从技术治理角度看,Mythos事件具有里程碑意义。它首次以极端形式展示了AI能力跃升可能带来的系统性风险。
CEO达里奥·阿莫迪的观点值得深思:网络安全是前沿AI模型带来的首个明确且现实的危险,但绝不会是最后一个。若应对得当,这或将成为解决未来更艰巨挑战的蓝本。
我的判断是:Mythos不是终点,而是起点。它迫使整个行业重新审视AI安全的边界与治理框架。

