“告诉每个人AI能造出更好的AI,这恐怕是写得不错的筹款演示文稿。”在Anthropic发布公开信呼吁暂停前沿AI研发后,一位网友这样评论。
这封公开信之所以引发如此两极分化的反应,与其发布的时间点不无关系。就在6月1日,Anthropic秘密提交S-1草案启动IPO,而5月28日他们刚完成650亿美元融资,估值高达9650亿美元,一举超越OpenAI。有人因此质疑:这究竟是真诚的风险警示,还是为天文数字估值造势的营销手段?
但也有程序员表达了截然不同的看法。“对于实际使用这些模型交付产品的开发者来说,仅今年在生产环境中看到的Claude版本之间的能力飞跃,就已经足够疯狂了。”他认为,Anthropic一向是对时间线预测偏保守的实验室,当他们说出“比我们预想的更快”时,分量远比其他机构更重。
那么,Anthropic究竟在信中说了什么?
核心观点是:AI正在学习“造”AI。过去人类主导着AI开发的每个环节,但现在他们正越来越多地把这些工作交给AI系统自己完成。如果这一趋势持续,加上足够的算力,AI系统最终可能完全自主地设计并迭代出自身的新版本。该公司承认尚未实现这一目标,但认为它的到来很可能比大多数人预想的要早。
数据支撑了这一判断。如今Anthropic工程师每季度的代码交付量是2021至2025年平均水平的8倍,AI能独立完成的任务时长大约每四个月翻一番。截至2026年5月,其代码库中超过80%的代码由Claude生成,在最高难度的任务中,Claude的成功率已达到76%,半年内提升了50个百分点。无论在工程还是研究领域,Claude的表现已能媲美经验丰富的人类开发者。不过在目标选择的判断力上,它与人类仍有显著差距——Anthropic认为,这正是当前AI与未来能自主迭代的AI之间的核心差异所在。
如果继续发展,一百人的公司可能完成万人级别的工作量。但风险同样巨大:如今模型中尚属罕见的偏差,可能在一次次自主迭代中被不断放大,人类理解越来越少,直到彻底失控。
因此,Anthropic建议全球放慢甚至暂停前沿AI研发,为价值观对齐研究留出缓冲时间,并主张建立类似“核武器协议”的全球机制。但他们也承认核查并不容易——AI训练项目远比导弹发射井更难发现,当别人暂停时,谁继续前进谁就可能取得领先。
据悉,Anthropic此前已多次发布AI风险预警,其联合创始人曾预测到2028年底递归自我改进概率约为60%。当时就有声音质疑:AI是否真会在2027年前后迎来一次突然的重大突破?
这场关于“该不该暂停”的争论,或许才刚刚开始。