Anthropic 正在通过 Project Glasswing 扩大对其 Claude Mythos AI 模型的访问范围,该计划旨在让技术和安全公司以及政府在强大的模型公开发布之前发现并修复错误和潜在的漏洞。
在周二的博客帖子中,Anthropic 表示,随着该公司准备更广泛地发布这一有争议的模型,它将在其受控计划中添加大约 150 个组织。
Anthropic 表示,一旦完成额外的保障措施,预计将在“未来几周内”向客户提供 Mythos 级模型,之后进行了扩张。这一消息发布之际,Anthropic 周一向美国证券交易委员会秘密提交首次公开募股,准备上市。
“经过几周与我们的 Glasswing 项目合作伙伴、安全行业、开源软件维护者和美国政府的密切合作,我们正在将合作伙伴关系扩展到大约 150 个新组织,”Anthropic 写道。 “每个人在获得访问权限之前都需要满足我们的安全要求。”
最新的 Project Glasswing 扩展增加了来自关键基础设施行业的组织,包括电力、水、医疗保健、通信和硬件。 Anthropic 表示,许多新组织维护政府和数亿人使用的软件。
“每个合作伙伴的共同点是,对其代码库的成功攻击可能是灾难性的,”Anthropic 写道。 “对于大多数合作伙伴来说,我们估计一次重大攻击可能会影响超过 1 亿人,并对全球和国家安全产生重要影响。”
在人类材料草稿在网上泄露后,克劳德·神话于三月份公开露面。据 Anthropic 称,之前获得访问权限的组织已经使用 Mythos Preview 识别了超过 10,000 个高严重性或关键严重性软件漏洞。合作伙伴还使用该模型来编写补丁、进行安全审查以及在发布前测试软件。
该模型的功能引起了研究人员和政府机构的担忧,他们认为功能日益强大的人工智能系统可能会使网络攻击更容易执行。
英国人工智能安全研究所报告,Mythos 在测试过程中自主完成了 32 步的模拟企业网络攻击。 Mozilla 表示,该模型发现了 Firefox 网络浏览器中修复的 271 个漏洞,而安全初创公司 Calif 声称预览版本帮助研究人员开发了针对 Apple M5 计算机芯片的漏洞链。
Anthropic 表示,它正在扩大对 Mythos 的访问,因为它认为,在攻击者获得类似功能之前,防御者需要功能越来越强大的人工智能工具。该公司表示,预计其他开发商将在 6 到 12 个月内发布 Mythos 级模型,可能没有类似的保护措施,从而增加了更频繁和更难以预测的网络攻击的可能性。
“未来,前沿模型的发布将变得越来越高风险。所有领域的功能都将继续改进,包括许多可以为攻击者和防御者提供支持的领域(例如网络安全),”Anthropic 写道。 “如果我们成功了,我们希望能够为防御者带来永久的优势。”
Anthropic 没有立即回复 Decrypt 的置评请求。
随着私人访问权限的扩大,Myriad(由 Decrypt 母公司 Dastan 运营的预测市场平台)上的用户对 Claude Mythos 将于 6 月底向公众发布失去了信心。截至撰写本文时,他们的预测仅为 26.5% 的可能性,低于上周 58.5% 的峰值。
