OpenClaw创造者自曝！AI代码正在淹没世界

你好，我是郑工长。

华尔街日报爆了一条让人脊背发凉的消息。

OpenClaw的两位明星工程师——就是那个让券商路演场场爆满的AI编程神器背后的创造者——发出严正警告。原话很重：AI智能体正在源源不断输出"氛围垃圾"，低质量甚至危险的代码正在污染整个软件生态。

你品一下这件事的分量。这不是AI的黑粉在唱衰，这是创造者在喊"我造的怪物失控了"。

同一天，另一条新闻在狂欢：28.9万亿Token，全球AI大模型周调用量五连涨，DeepSeek登顶全球调用榜。

一条曲线往上冲，另一条曲线往下掉。调用量在狂飙，质量在塌方。今天我就把这两条线拉在一起看。

"氛围垃圾"到底是什么

先解释一下这个词。"氛围垃圾"（Vibe Slop）是AI编程圈最近流行的一个概念——代码看起来像那么回事，运行起来也没报错，但经不起细看。变量命名混乱、逻辑冗余、边界条件没处理、安全漏洞藏着——这些代码通过了表面测试，但在生产环境里就是一个个定时炸弹。

为什么叫"氛围"？因为AI写代码的时候不是在"思考"，是在"模仿氛围"。它见过无数代码的模式和风格，所以它写出来的代码"氛围"很对——看起来专业、规范、能跑。但"氛围对"不等于"逻辑对"，就像一个人穿西装打领带坐在会议室里，不一定真的懂业务。他只是看起来像懂业务的人。

OpenClaw的工程师说的"氛围垃圾"，就是这种"氛围对但逻辑错"的代码。它们以万亿Token的速度涌入全球代码库，审查机制完全跟不上。

调用量狂飙的另一面

28.9万亿Token，连续五周上涨。DeepSeek-V4-Flash登顶全球调用榜第一。国产AI整体调用量连续4周超过美国。

这些数字越漂亮，"氛围垃圾"的警告就越刺耳。

为什么？因为调用量和代码产出量是正相关的。AI被调用得越多，生成的代码就越多。而生成的代码越多，需要审查的量就越大。但人类的审查速度是固定的——一个资深工程师一天能认真审查多少行代码？500行？1000行？AI一天能生成多少？几十万行。

调用量可以五连涨，但代码审查的速度涨不了五倍。

当输出速度远超审查速度，结果只有两个：要么审查变水，走马观花看个大概；要么干脆不审查，直接上线。两种结果都指向同一个终点——低质量代码进入生产环境。

为什么创造者自己先慌了

OpenClaw的工程师不是第一个警告AI代码质量的人，但他们是最有分量的——因为这个"怪物"就是他们亲手造的。

他们的警告不是"AI不够好"，是"AI写代码的速度已经远超人类审查的速度"。这不是质量可不可以接受的问题，是审查机制本身已经跟不上输出速度。

就像一条高速公路没有限速也没有交警。车越多越快，出事只是时间问题。你不是在问"这些车好不好"，你是在问"这条路上还有没有人在管"。

更深层的问题是：当几十万开发者用AI写生产级代码，输出质量的下限决定了整个软件生态的安全水位。一个人的"氛围垃圾"只影响一个项目，但几十万人同时往代码库里灌"氛围垃圾"，整个生态的信任基础就在塌方。

便宜的代价

还有一层很少有人注意到：价格战正在加剧这个问题。

DeepSeek登顶全球调用榜，杀手锏是性价比——用美国模型十分之一的价格提供接近的能力。当API便宜到"不用白不用"，开发者就倾向于让AI多生成几版、多试几次。每次生成都可能在代码库里留下"氛围垃圾"。

便宜不是问题，问题是便宜让"随便试"变成了默认行为。以前你请一个外包写代码，一天几千块，你会认真审核每一行。现在AI写代码一分钱不到，你的审核习惯不知不觉就松了——"反正便宜，大不了重新生一份"。但"重新生成"不等于"旧的那份被删了"。很多"氛围垃圾"就是这么留在代码库里的。没人清理，没人审查，就那么躺着，等着哪天出事。

Shopify点名大语言模型推理成本上升拉低利润。美国公司被成本压得喘不过气，中国公司用价格战抢份额。但这轮换挡的副作用就是：当所有人都卷"便宜"，"靠谱"成了最先被牺牲的变量。

这不是AI的问题，是系统的问题

我想把问题再往上提一层。

"氛围垃圾"的根源不是AI能力不够，是整个软件工程体系还没有适应AI时代的产出速度。过去，代码的产出速度受限于人类写代码的速度——人写多快，审查就跟多快，两者是匹配的。现在AI把产出速度拉到了人类审查速度的几十倍甚至几百倍，但审查流程还是按人的节奏设计的。

这就像工厂的流水线突然提速了10倍，但质检岗位还是原来那几个人。不是质检员不努力，是系统设计没有跟上变化。

解决方案不是让AI写得更慢——那违背技术发展规律。解决方案是重新设计审查体系：AI审AI、自动化测试覆盖、代码质量门禁、可信代码标注。当产出是AI的速度时，审查也必须是AI的速度。

我的判断

OpenClaw工程师的警告应该被刻在每个AI创业者的工位上。

调用量登顶是中国AI的一个重要里程碑，但不能被这个数字冲昏头。DeepSeek赢了调用量，但下一场仗不是调用量——是谁的AI在真实场景里不出事。

调用量是面子，可靠性是里子。面子可以靠价格战赢，里子只能靠质量赢。

当AI代码以万亿Token为单位涌入生产环境，我们需要的不只是更快的AI，是更快的审查、更严的标准、更透明的质量标注。

否则，28.9万亿Token不是成就，是债务。每一行未经审查的"氛围垃圾"代码，都是一笔迟早要还的技术债。而技术债的利息，是用生产事故来付的。

还有一个角度值得展开："氛围垃圾"不只是代码的问题，是整个AI内容生态的问题。

代码有"氛围垃圾"，AI生成的文案有没有？有。AI生成的图片有没有？有。AI生成的视频有没有？有。它们看起来都对，但经不起专业审视。文案的逻辑是编的，图片的细节是错的，视频的物理规律是不对的。

当AI把内容生成的成本降到接近零，人类的注意力就成了新的稀缺资源。你一天能看多少篇AI生成的文章？能审查多少行AI生成的代码？能辨别多少张AI生成的图片？注意力是固定的，但AI的产出是无限的。这个剪刀差，才是"氛围垃圾"危机的底层原因。

这不是某一个AI工具的问题，是整个AI时代内容治理的系统性挑战。我们需要的不只是更好的AI，是更好的内容过滤机制、更透明的质量标注、更严格的发布门槛。否则互联网会变成一个巨大的垃圾场——每一寸空间都被AI生成的内容填满，但真正的价值信号被完全淹没。

最后说一个现实的建议。如果你是一个技术团队的负责人，你现在可以做一件事：给AI生成的代码加一个标记。每一段AI生成的代码，都在提交时标注"AI generated"。这不是歧视AI代码，是让审查者知道这段代码需要更仔细地看。

当一辆车没有经过质检就出厂，你至少得在车窗上贴个标签："此车未经质检"。让开这辆车的人知道风险。AI代码也应该有同样的标签。这不是增加工作量，是增加透明度。而透明度，是信任的前提。没有透明度，28.9万亿Token就只是一个不断膨胀的气球。你不知道它什么时候会爆，但你知道它一定会爆。而爆的那一刻，代价不是任何一家公司能承受的。这不是危言耸听，这是正在发生的事。每一个用AI写代码的人，都应该问问自己：我审查了吗？