根据 Anthropic 的一项新研究,人工智能在编写代码和研究方面已经变得非常有效,以至于开发新人工智能系统的最大限制现在可能是监督它们的人类。
在周四发布的《当人工智能构建自身时》报告中,Anthropic 指出,Claude 已经通过编写代码、运行实验和协助研究来帮助构建未来的人工智能系统,该公司表示,这一趋势最终可能导致递归的自我改进,即人工智能系统帮助设计自己的继任者。
Anthropic 表示,现在超过 80% 的代码都是由 Claude 编写并合并到其代码库中的,自 2024 年以来,已帮助工程师将代码输出增加了大约八倍。
“在 Claude Code 于 2025 年 2 月推出研究预览版之前,这个数字只有低个位数,”Anthropic 写道,并补充说这种转变也体现在每个工程师的产出量上。 “在 Anthropic 的前四年(2021-2024 年)中,每个工程师每天合并的代码行数保持不变,然后在 2025 年开始攀升,当时 Claude 开始运行代码,而不仅仅是建议工程师复制和粘贴代码。”
Anthropic 表示,未来可能会以多种方式展开:人工智能的进步可能会放缓,人类可能会继续掌控一切,而人工智能会自动化大部分工作,或者人工智能系统最终可能会开始改进自己的继任者。
“如果考虑得足够远,并提供足够的计算能力,这一趋势表明人工智能系统能够完全自主地设计和开发自己的继任者,”Anthropic 写道。 “这就是所谓的递归自我完善。我们还没有做到这一点,递归自我完善并不是不可避免的。但它可能会比大多数机构准备的更早到来。”
该公司表示,现在判断哪种结果最有可能还为时过早,但认为人工智能已经在帮助构建人工智能,并承认代码行数并不是衡量生产力的不完美标准。
None of this guarantees recursive self-improvement is on the horizon. It’s not yet clear that Claude is capable of research judgment—of choosing the right problems to work on.
But if these trends continue, AI systems designing and building their own successors is plausible. This…
— Anthropic (@AnthropicAI) June 4, 2026
“所有这些都不能保证递归的自我改进即将到来,”Anthropic 后来 在 X 上写道。“目前尚不清楚克劳德是否有能力进行研究判断,即选择正确的问题来解决。”
该报告发布之际,人工智能公司越来越多地将其模型定位为研究合作者,而不是简单的聊天机器人。尽管如此,Anthropic 表示,代码输出的增加反映了由能力日益增强的人工智能代理推动的软件开发的更广泛加速。
上个月,Anthropic 将其旗舰 Claude 模型升级至 Opus 4.8,继续源源不断地发布旨在提高编码、推理和自主任务性能的版本。与此同时,竞争对手开发商 OpenAI 也对其前沿模型采取了类似的策略,于 4 月份推出了 GPT-5.5 和 GPT-Rosalind 。
5 月份,Google 发布了 Gemini Spark,这是一款不等被询问的个人 AI 代理。它跨应用程序管理任务,标记需要注意的项目,并在后台完成作业。
该报告发布之际,Anthropic 在准备上市时越来越强调能够以更大自主性运行的人工智能系统。近几个月来,Anthropic 展示了在编码、代理工作流程和长期任务性能方面的进步,同时宣传 Claude Mythos 识别软件漏洞和进行复杂网络安全研究的能力。
该公司表示:“人类在其发展中发挥的作用大大减弱,我们的大部分精力可能会转移到对人工智能系统运行的不断扩大的‘虚拟实验室’的监督、验证和验证上。” “我们期望能够进行自动化人工智能研究和开发的系统将拥有能够转移到其他科学领域的技能,从而使它们能够开始彻底改变其他领域。”