记者 马可
5月19日晚,人工智能领域的一则官宣引发了广泛关注:OpenAI联合创始人、特斯拉前AI总监、被誉为“Vibe Coding之父”的安德烈·卡帕西(Andrej Karpathy)在社交媒体X上宣布,正式加入AI公司Anthropic。
在推文中,卡帕西写道:“LLM前沿的未来几年‘尤其具有塑造性’。”他同时强调,自己将“回归研发”,并且“仍然热爱教育”。
这是两年内第三位从OpenAI阵营投奔Anthropic的核心人物。此前,OpenAI前对齐负责人扬·莱克(Jan Leike)于2024年5月加入,联合创始人约翰·舒尔曼(John Schulman)于同年8月加入。顶级人才的单向流动,正在重塑AI竞赛的格局。
“回归研发”:Karpathy在Anthropic的角色
据TechCrunch报道及Anthropic官方确认,卡帕西已加入由尼克·约瑟夫(Nick Joseph)领导的预训练团队,该团队负责Claude系列模型的大规模训练。卡帕西将组建一个新的子团队,专注于一个极具野心的方向:使用Claude自身来加速预训练研究。
Anthropic发言人向TechCrunch表示:“卡帕西是少数能在LLM理论与大规模训练实践之间架起桥梁的研究者之一。”这一定位直接指向了Anthropic的核心战略。
在同一天,网络安全专家克里斯·罗尔夫(Chris Rohlf)也宣布加入Anthropic,而xAI创始成员罗斯·诺丁(Ross Nordeen)已于本月早些时候加盟。市场预测平台Polymarket的数据显示,交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,远高于OpenAI的4%。
定义者的轨迹:从Hinton到Anthropic
要理解卡帕西加入的重量,必须回顾他独特的职业生涯。他不仅仅是一位顶级研究者,更是一位屡次定义行业范式的人。
1986年生于斯洛伐克,15岁移民加拿大。在多伦多大学本科期间,他选修了“深度学习教父”杰弗里·辛顿(Geoffrey Hinton)的课程,成为最早被深度学习复兴浪潮影响的年轻人之一。随后,他在斯坦福大学师从计算机视觉先驱李飞飞,其博士期间创建的CS231n课程已成为全球计算机视觉领域最著名的公开课。
2015年,他成为OpenAI的创始研究科学家。2017年,他被埃隆·马斯克招至特斯拉,担任AI高级总监,推动了自动驾驶的纯视觉方案。同年,他发表了影响深远的《Software 2.0》一文,提出“神经网络权重即新代码”的理念,重塑了行业对编程的认知。
2022年离开特斯拉后,他创办了广受欢迎的“神经网络:从零到英雄”(Neural Networks: Zero to Hero)YouTube课程系列。2025年2月,他创造的“Vibe Coding”一词被柯林斯词典选为年度词汇。同年6月,他提出“Software 3.0”和“Agent的十年”框架,再次引领行业讨论。
从辛顿和李飞飞的学生,到奥特曼的同事,再到马斯克的直接下属,卡帕西的每一步都踏在技术浪潮之巅。他的稀缺性在于其定义和框架能力,能用一个概念改变整个行业的思考方式。
为何甘当“-2”?追逐最前沿的实验场
在Anthropic的组织架构中,卡帕西的直接上级是预训练负责人尼克·约瑟夫,而约瑟夫则向公司联合创始人兼CEO达里奥·阿莫代(Dario Amodei)汇报。这意味着卡帕西处于公司的第三层。
对于一位功成名就、财务自由、曾身居高位的技术领袖而言,这是一个不同寻常的选择。但纵观其职业生涯,驱动卡帕西的核心动力始终是“参与当下最具塑造性的实验”。
2017年加入特斯拉,是因为自动驾驶是当时Software 2.0理念最大的试验场。2022年离开,是因为架构已定,挑战性减弱。2023年短暂回归OpenAI,是因为ChatGPT带来的爆发期是新的前沿。2024年创办Eureka Labs,是想探索AI原生教育。如今加入Anthropic,是因为他看到了下一个前沿——“用AI研究AI”的预训练革命。
对于像卡帕西这样的研究者而言,OpenAI的战略重心已从纯研究转向平台化与收购(如收购Chat.com、io Products等),正在转变为“AI时代的消费巨头”。而Anthropic坚持的“以研究质量取胜”路线,以及其最新发布的、展现出惊人自主推理能力的Mythos模型,为“AI自我改进预训练”提供了绝佳的实验场。
Anthropic的算盘:技术、信号与范式
Anthropic对卡帕西的渴求,同样出于多重考量。
首先是技术需求。在由微软(支持OpenAI)和谷歌主导的算力军备竞赛中,Anthropic需要找到一条更高效的路径。卡帕西的任务——用Claude加速自身预训练——正是旨在以更少的算力训练出更强大的模型。他兼具预训练理论深度、大规模工程经验和AI辅助研究的直觉,是执行这一战略的极少数人选之一。
其次是人才信号。连续吸纳OpenAI的核心人物,强化了“顶级研究者正向Anthropic聚集”的叙事。每一次高调加入,都在降低下一个顶尖人才加盟的心理门槛,形成人才吸引人才的飞轮效应。
第三是品牌与战略价值。据报道,Anthropic正以约9000亿美元估值进行巨额融资,并推进IPO。卡帕西作为拥有百万YouTube订阅者、定义年度词汇的行业标志性人物,其加盟为Anthropic带来了无可比拟的公众影响力和技术信誉,这无疑是一笔宝贵的资产。
最深层的,或许是范式定义权。卡帕西不仅是一位建设者,更是一位叙事者。他在Anthropic进行的任何探索,都可能通过他的推文、博客或视频课程被公开阐述和定义。当他为其工作赋予一个像“Software 2.0”这样响亮的名字时,Anthropic便可能成为那个新范式的代名词。
临界点:当AI开始改进AI
卡帕西的加入,标志着一个可能的技术拐点。
2026年4月,Anthropic发布了Mythos Preview模型,它被证实能够自主发现并利用软件中积存多年的安全漏洞,其能力被评估为“当前最强大的AI模型”。更重要的是,这些能力并非专门训练的结果,而是模型通用推理能力提升后“涌现”出的下游表现。
卡帕西的使命,正是利用Mythos/Claude这把目前最强大的“锤子”,去改进制造“锤子”本身的工艺。目标是让模型改进的速度脱离人类研究者的线性节奏,启动“AI改进AI”的进化飞轮。
如果这个飞轮成功转动,当前以算力堆砌和数据壁垒为核心的竞争维度可能会被彻底改写。这不仅是Anthropic对抗巨头的关键路径,也可能成为通往更高级人工智能(AGI/ASI)的加速通道。
卡帕西选择在此时放下自由身份回归一线,正是因为他相信这个关键的窗口期已经到来。他的选择,或许不仅是个人职业生涯的转折点,更是整个AI竞赛进入新阶段的注脚。
