导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

著名 iPhone、索尼黑客称 AI 编码代理是一场等待发生的灾难

黑客乔治·霍茨 (George Hotz) 在 17 岁时首次破解了 iPhone,并在索尼起诉他之前对 PlayStation 3 进行了逆向工程。周日发表了一篇博文,认为人工智能编码代理的大规模采用将以灾难告终,或者至少接近灾难。

“我现在称之为,在软件开发中采用人工智能代理将是该领域历史上代价最高的错误之一,”霍茨写道。 “代理无法编程,并且需要越来越长时间才能意识到他们无法编程。”

“输出已损坏,但其方式越来越难以检测。这正是您对日益准确的统计模型所期望的。”

这篇题为“永恒的 Sloptember”的帖子是在 AI 最著名的研究人员之一 Andrej Karpathy 加入 Anthropic 的预训练团队五天后发布的,他明确表示 AI 代理已经改变了软件开发。这两个人现在代表了行业尚未解决的争论的对立两极,而且两人都具有表明立场的实际可信度。

Hotz 并没有在场外得出结论。他花了六个月的时间在实际项目中使用代理:Tinygrad、他的开源深度学习框架的一部分,以及 USB-PCIe 芯片的完整固件逆向工程。 “代理预先加载所有进度,”他写道,然后递给你他所描述的老虎机杠杆 - 你拉动它并希望完成工作完成。

事实并非如此。

与自我无关

Hotz 预见到了明显的阻力:通过自己的技术定义自己部分身份的程序员自然会抵制威胁要取代他的工具。他认真对待这一反对意见,并根据其实质内容予以驳回。

“​​我更多地考虑了自我价值保护的问题。 Google 的 AFL 发现的错误比 LLM 还多,但没有人对此有这样的感觉。霍茨写道:“国际象棋和围棋比以往任何时候都更受欢迎。”他是对的,因为国际象棋人工智能已经统治人类数十年,而且这项游戏只会变得越来越受欢迎。

所以,他担心的不是被取代。这是关于当每个人同时使用这些工具时,尤其是当大型科技公司和华尔街不断推动这些工具的大规模使用时,代码质量会发生什么变化。

“我几乎认为这是某种出售特工的心理战,”霍茨辩称。 “对损失的恐惧是促使大公司采取行动的唯一方法之一。尽管我认为他们在这种恐惧中犯了一个大错误。”

他的中心论点是组织性的。高绩效者拥有足够紧密的反馈循环,可以在发货前发现代理产生的问题。他们阅读代码,发现错误,并校准何时信任该工具。 “表现最差的人不会进行自我检查,”他写道,而他们是那些使用代理来生产比以前多 10 倍的人。在一家大公司,这种数学计算会产生一些特定的东西:平均代码质量下降得更快,但被巨大的数量所掩盖。

他认为,结果将是“一桶又一桶污水的黄金时代,以及优质宝石的黑暗时代。”作为一个具体的例子,他指出苹果正在其整个工程组织中推广人工智能编码工具的报道,然后简单地问道:“你认为 macOS 在未来 2 年内会变得更好还是更糟?”

营地所在地

Hotz 现在将自己置于他所谓的“LeCun/Marcus 阵营”中——指的是 Meta 的首席人工智能科学家 Yann LeCun 和长期对 LLM 持怀疑态度的 Gary Marcus。两人都认为语言模型从根本上来说是复杂的模式匹配器:它们可以模仿现有代码的分布,但无法从第一原理中推理出真正的新问题。

Vibe 编码(用简单的语言描述您想要的内容并让 AI 生成实现)在过去一年中呈爆炸式增长,主要实验室已将基于代理的编码定位为旗舰产品。微软在 2025 年 GitHub Copilot 转变为一个完整的代理系统,首席执行官 Satya Nadella 将其描述为类似于迁移到云的平台级转变。

对霍茨立场的抵制并不是抽象的。 Karpathy 在 2025 年初对智能体持怀疑态度,在新模型发布后改变了立场,并于 5 月 19 日(Hotz 发布的前五天)加入了 Anthropic 的预训练团队。他将接下来的几年描述为“特别具有成长性的”。

Anthropic 首席执行官 Dario Amodei 在达沃斯表示,一些 Anthropic 工程师已经停止自己编写代码,让模型在审查输出时处理代码。 Hotz 则表示,他尝试做同样的事情,但发现自己每次都需要手动修复。