非公开AI模型Mythos：是网络安全破坏者还是一场“恐惧营销”？

美国人工智能（AI）企业Anthropic本月披露其研发的最新大模型“Claude Mythos”，不到两周时间内，其高风险和非公开化引发广泛关注和警惕。OpenAI首席执行官山姆·奥特曼将Mythos比作“一边投炸弹，一边兜售价值1亿美元的防空洞”。

Anthropic声称，Mythos具有不可思议的能力，可以发现并利用全球银行、电网和政府机构运行软件中的隐藏漏洞。这意味着，该模型可能成为一个地缘政治筹码，而且掌握在一家美国公司手中。加拿大财长将其威胁比作霍尔木兹海峡的关闭。

据新华社报道，Anthropic表示，Claude Mythos能够自主识别主流软件系统中大量此前未被发现的安全漏洞，并能开发出相应攻击手段。国际货币基金组织总裁克里斯塔利娜·格奥尔基耶娃12日警告说，全球货币体系尚未做好应对AI风险快速升级的准备。

不过也有专家指出，即使Mythos在大型操作系统和浏览器中可以发现数千个“零日（zero-day）”漏洞（注：已经被发现、但软件开发者尚未获知或尚未发布修复补丁的安全漏洞），这也并非革命性的，其他价格低廉得多的模型也能够发现此类漏洞，只是能力差异。

《纽约时报》称，Mythos是全球AI鸿沟日益扩大的最新迹象。“对于中国来说，我认为这是继ChatGPT之后的第二个警钟。”卡内基国际和平基金会高级研究员麦特·希恩表示。

Mythos是革命还是炒作？

Anthropic在4月7日宣布了AI模型Mythos的存在，但表示不会公开发布，因为它能够识别IT系统中未知的缺陷。理论上，这些缺陷可能被黑客利用。

Anthropic表示，如果用户提出要求，Mythos可以识别并利用每个重要IT操作系统和网络浏览器中的“零日”漏洞。之所以被称为“零日”，是因为组织和开发人员对其完全不知情，在攻击者出击之前没有时间进行修补。

据《卫报》报道，英国AI安全研究所（AISI）已对Mythos进行了观察，认为Mythos是先进AI破坏能力的切实证据，并表示就其对网络安全的威胁而言，是对以往模型的一次“升级”。其危险信号包括执行涉及多个步骤的攻击能力，以及在没有人类指导的情况下识别IT缺陷。

在AISI看来，Mythos还实现了一项首创：在研究所创建的一项测试中，成功完成了一次包含32个步骤的网络攻击模拟。它可以攻击薄弱、小型的IT系统，尽管该机构无法对防御良好的系统给出定论。该研究所在评估结束时提出了一项在别处也经常被提及的观察：AI系统从现在起只会变得更好。

Anthropic在Forge Global等未上市企业股权交易平台上的估值已升至1万亿美元左右，超过OpenAI的8800亿美元。据悉，由于买家正在竞相抢购Anthropic日益减少的二级市场股票，使得这家人工智能初创公司的估值迅速攀升。

一些专家认为，Anthropic关于Mythos的主张，以及这家估值约8000亿美元公司的呈现方式中存在炒作成分。Mythos无疑是一个能力强大的模型，但戏剧性的声明为其赢得了大量关注，并将其产品置于关于AI如何促成网络风险的更广泛的行业讨论中心。

4月21日，摩根大通上调标普500指数目标价，认为随着Mythos模型的发布，AI交易将推动标普500指数再创新高。

谁参与其中？

Anthropic在4月早些时候表示，由于担心Mythos过于擅长识别网络安全漏洞，不会向公众发布。该公司创建了“透明翼计划”（Project Glasswing），只有包括谷歌、微软、亚马逊云服务（AWS）、英伟达和摩根大通在内的11家机构获得了该模型的访问权限。这些公司全部来自美国，承诺协助为该模型识别出的漏洞开发安全修复程序。

Anthropic还将其提供给了40多家公司和组织，他们目前正在测试该技术并努力加强其系统。

英国是唯一获得访问权限的其他国家。其政府支持的英国AI安全研究所对Mythos进行测试后，在上周发布了一份独立评估报告。“这代表了AI网络能力的提升。”英国AI国务大臣卡尼什卡·纳拉扬上周在社交媒体上表示，该国正在采取措施保护“关键国家基础设施”。

据《纽约时报》报道，一位欧盟官员表示，自Mythos发布以来，欧洲委员会已与Anthropic至少会面了三次。但由于双方尚未就如何共享模型达成一致，该公司未提供访问权限。而且，美国网络安全和基础设施安全局（CISA）也不在Mythos的访问权限名单上。

Anthropic表示，已收到大量来自各国政府、公司和其他机构要求获取权限和信息的电话，但这些机构在安全评估如此强大的AI模型方面可能具备不同水平的专业知识。该公司补充说，预计其他团队将在至少18个月内发布具有类似网络能力的AI模型并进行更广泛的推广，这使得各机构进行必要安全修复的时间非常有限。

“这种营销方式显然令人难以置信：‘我们造了一枚炸弹，正准备把它扔到你头上。我们会以1亿美元的价格卖给你一个防空洞，让它在你的所有设施中运行，但前提是我们选择你作为客户。”奥特曼在21日发布的播客节目Core Memory中说，Anthropic正在利用“基于恐惧的营销”来推销Mythos。

国际AI合作缺失，风险多大？

英格兰银行行长近日公开警告称，Anthropic可能已经找到了一种“破解整个网络风险世界”的方法。欧洲中央银行开始询问各银行的防御情况。

由于担心Mythos的预期威胁，美国财政部长斯科特·贝森特本月初在华盛顿召集了包括高盛和花旗在内的美国大银行负责人开会。英国监管机构本周已将Mythos列入跨市场运营弹性小组会议的议程，这使其进入了资深银行家以及来自财政部、英格兰银行、金融行为监管局和国家网络安全中心官员之间的高层讨论。

尽管Mythos未向公众发布，但外界普遍担忧它仍可能落入坏人之手。彭博社21日报道称，在Anthropic首次宣布计划向少数公司开放该模型进行测试的同一天，一个私密在线论坛中的几名用户便获得了Mythos的访问权，他们未经授权，但一直在定期使用。

乔治·华盛顿大学政治学教授杰弗里·丁对《纽约时报》表示，中国的一些AI研究人员私下表达了担忧。中国驻美国大使馆发言人刘鹏宇表示，中方对Mythos的具体细节并不熟悉，但支持和平、安全、开放的网络空间。

围绕Mythos的争议发生在一个缺乏国际AI合作的时期，随着各公司竞相超越对手，各国政府正带着怀疑审视彼此。目前还没有等同于《核不扩散条约》的AI条约，没有共同的检查机制，也没有针对如何处理像Mythos这样事物的公认规则。

去年，在上海召开的2025世界人工智能大会暨人工智能全球治理高级别会议上，中国政府发出倡议，成立世界人工智能合作组织，初步考虑总部设在上海。近日，中国16家科技社团共同发布《全球人工智能治理科技社团倡议》，倡导以人为本、智能向善，推动建立开放、公正、包容、有效的全球人工智能治理体系。