Mythos技术深度解析：当AI能力突破安全边界

admin666ss2026-04-13IT技术0

2019年，我第一次深度关注Anthropic的技术路线时，绝对想不到这家公司会在六年后的今天推出一款强到需要被“冻结”的模型。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

2025年4月8日，Anthropic正式发布ClaudeMythos预览版。作为从业十年的AI研究者，我必须说：这是近年来最令人震撼也最令人不安的技术发布。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

Mythos基准测试：全面碾压Opus4.6

先看硬数据。在专业漏洞复现测试CyberGym上，Mythos得分83.1%，Opus4.6仅为66.6%。差距不是百分比数字那么简单——这是网络安全能力的代际跃升。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

编程领域同样触目惊心。SWE-benchPro、Terminal-Bench2.0、SWE-benchMultimodal、SWE-benchMultilingual、SWE-benchVerified五项测试，Mythos全面胜出。Anthropic甚至给出了“可以与最顶尖人类安全专家竞争”的官方定性。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

计算机操作能力测试同样印证了这一判断。BrowseComp86.9%、OSWorld-Verified79.6%，均显著超越前任。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

科学推理层面，GPQADiamond达到94.6%，Humanity'sLastExam有工具测试56.8%、无工具测试64.7%——每一项都领先Opus4.6超过十个百分点。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

真正的可怕之处：漏洞发现能力超越人类极限

数据漂亮并不足以解释为何Mythos需要被“冻结”。真正的问题在于：Mythos发现并利用漏洞的能力，已经超出了现有安全体系的应对范畴。 Mythos技术深度解析：当AI能力突破安全边界 IT技术

Anthropic披露的信息显示，Mythos已在操作系统、网络浏览器等关键软件中发现“几千个”重大漏洞。其中包括OpenBSD存在27年未被察觉的错误，以及FFmpeg存在16年、在自动化测试运行500万次后仍未被检测到的漏洞。

这意味着什么？意味着当前所有软件系统在Mythos面前都显得脆弱不堪。传统的安全测试方法论正在被颠覆。

玻璃翼计划：受限访问的安全解法

Anthropic的应对策略是玻璃翼计划（ProjectGlasswing）。核心逻辑很清晰：与其让市场自由获取这款“数字化解构工具”，不如主动建立准入机制。

12家合作伙伴覆盖云计算、浏览器、芯片、金融基础设施、操作系统等领域。亚马逊、微软、苹果、谷歌、英伟达、CrowdStrike、PaloAltoNetworks——全球数字基础设施的核心参与者悉数在列。

这些企业将作为防守方优先使用Mythos，补上现有系统漏洞。同时，Anthropic承诺提供最高1亿美元额度用于防御性网络安全研究。

高风险AI治理的新蓝图

从技术治理角度看，Mythos事件具有里程碑意义。它首次以极端形式展示了AI能力跃升可能带来的系统性风险。

CEO达里奥·阿莫迪的观点值得深思：网络安全是前沿AI模型带来的首个明确且现实的危险，但绝不会是最后一个。若应对得当，这或将成为解决未来更艰巨挑战的蓝本。

我的判断是：Mythos不是终点，而是起点。它迫使整个行业重新审视AI安全的边界与治理框架。

标签：Anthropic ClaudeMythos AI安全玻璃翼计划