Anthropic 周四表示,预计“在未来几周内”扩大对其 Claude Mythos AI 模型的访问范围,这表明该公司可能很快就会摆脱围绕网络安全系统的严格限制。
“我们在开发这些保护措施方面正在迅速取得进展,并期望能够在未来几周内为我们的所有客户带来 Mythos 级模型,”Anthropic 在宣布其新的 Opus 4.8 模型发布时说道。
该声明是 Anthropic 迄今为止最明确的信号,表明在研究人员、政府和网络安全专家几个月来对该模型的功能发出警告之后,Mythos 的更广泛可用性正在酝酿之中。
Anthropic 没有说明在 Mythos 得到更广泛的推广之前还需要完成哪些保障措施,也没有说明一旦该模型变得更广泛可用,所有客户是否都将获得相同级别的访问权限。
Anthropic 没有立即回复 Decrypt 的置评请求。
Myriad(由 Decrypt 母公司 Dastan 运营的预测市场平台)上的用户越来越相信该模型将在 6 月底发布,截至本文撰写时,这种可能性有 44% 的可能性。这比今天早上的 17.5% 有所上升。
Claude Mythos 于 3 月份在 Anthropic 博客材料草稿在网上泄露后首次出现。当时,Anthropic 将 Mythos 描述为“我们开发过的最强大的人工智能模型”,并将其定位为高于公司尖端 Opus 模型的新层级。
“虽然 Mythos 目前在网络能力方面远远领先于任何其他人工智能模型,但它预示着即将到来的一波模型,这些模型可以以远远超过防御者的方式利用漏洞,”该公司写道。
此后,Anthropic 通过 Glasswing 项目限制了对 Mythos 的访问,该项目允许特定技术公司、安全研究人员和政府合作伙伴在受控条件下访问该模型。
该公司认为,Mythos 可以帮助防御者在攻击者利用软件漏洞之前识别并修补软件漏洞。然而,安全研究人员和政府机构警告说,同样的功能可能会加速网络攻击。
英国人工智能安全研究所发现 Mythos 在测试过程中可以自主完成 32 步模拟企业网络攻击后,这些担忧进一步加剧。 4 月份,Mozilla 表示 Mythos 在内部安全评估期间发现了 Firefox 中的 271 个漏洞。本月早些时候,安全初创公司 Calif 声称 Mythos 模型的预览版帮助研究人员开发了一个针对 Apple M5 Mac 芯片的漏洞利用链。
该模型也成为人工智能行业内部更广泛辩论的一部分,讨论的主题是如何发布先进的系统,以及人工智能开发人员是否利用对人工智能末日的恐惧来推销他们的产品。
在上个月接受“Core Memory”播客的采访期间,OpenAI 首席执行官 Sam Altman 指责 Anthropic 使用“基于恐惧的营销”,认为有关网络安全风险的警告可能成为限制访问强大人工智能系统的理由。
