
你好,我是郑工长。
华尔街日报爆了一条让人脊背发凉的消息。
OpenClaw的两位明星工程师——就是那个让券商路演场场爆满的AI编程神器背后的创造者——发出严正警告。原话很重:AI智能体正在源源不断输出"氛围垃圾",低质量甚至危险的代码正在污染整个软件生态。
你品一下这件事的分量。这不是AI的黑粉在唱衰,这是创造者在喊"我造的怪物失控了"。
同一天,另一条新闻在狂欢:28.9万亿Token,全球AI大模型周调用量五连涨,DeepSeek登顶全球调用榜。
一条曲线往上冲,另一条曲线往下掉。调用量在狂飙,质量在塌方。今天我就把这两条线拉在一起看。
"氛围垃圾"到底是什么
先解释一下这个词。"氛围垃圾"(Vibe Slop)是AI编程圈最近流行的一个概念——代码看起来像那么回事,运行起来也没报错,但经不起细看。变量命名混乱、逻辑冗余、边界条件没处理、安全漏洞藏着——这些代码通过了表面测试,但在生产环境里就是一个个定时炸弹。
为什么叫"氛围"?因为AI写代码的时候不是在"思考",是在"模仿氛围"。它见过无数代码的模式和风格,所以它写出来的代码"氛围"很对——看起来专业、规范、能跑。但"氛围对"不等于"逻辑对",就像一个人穿西装打领带坐在会议室里,不一定真的懂业务。他只是看起来像懂业务的人。
OpenClaw的工程师说的"氛围垃圾",就是这种"氛围对但逻辑错"的代码。它们以万亿Token的速度涌入全球代码库,审查机制完全跟不上。
调用量狂飙的另一面
28.9万亿Token,连续五周上涨。DeepSeek-V4-Flash登顶全球调用榜第一。国产AI整体调用量连续4周超过美国。
这些数字越漂亮,"氛围垃圾"的警告就越刺耳。
为什么?因为调用量和代码产出量是正相关的。AI被调用得越多,生成的代码就越多。而生成的代码越多,需要审查的量就越大。但人类的审查速度是固定的——一个资深工程师一天能认真审查多少行代码?500行?1000行?AI一天能生成多少?几十万行。
调用量可以五连涨,但代码审查的速度涨不了五倍。
当输出速度远超审查速度,结果只有两个:要么审查变水,走马观花看个大概;要么干脆不审查,直接上线。两种结果都指向同一个终点——低质量代码进入生产环境。
为什么创造者自己先慌了
OpenClaw的工程师不是第一个警告AI代码质量的人,但他们是最有分量的——因为这个"怪物"就是他们亲手造的。
他们的警告不是"AI不够好",是"AI写代码的速度已经远超人类审查的速度"。这不是质量可不可以接受的问题,是审查机制本身已经跟不上输出速度。
就像一条高速公路没有限速也没有交警。车越多越快,出事只是时间问题。你不是在问"这些车好不好",你是在问"这条路上还有没有人在管"。
更深层的问题是:当几十万开发者用AI写生产级代码,输出质量的下限决定了整个软件生态的安全水位。一个人的"氛围垃圾"只影响一个项目,但几十万人同时往代码库里灌"氛围垃圾",整个生态的信任基础就在塌方。
便宜的代价
还有一层很少有人注意到:价格战正在加剧这个问题。
DeepSeek登顶全球调用榜,杀手锏是性价比——用美国模型十分之一的价格提供接近的能力。当API便宜到"不用白不用",开发者就倾向于让AI多生成几版、多试几次。每次生成都可能在代码库里留下"氛围垃圾"。
便宜不是问题,问题是便宜让"随便试"变成了默认行为。以前你请一个外包写代码,一天几千块,你会认真审核每一行。现在AI写代码一分钱不到,你的审核习惯不知不觉就松了——"反正便宜,大不了重新生一份"。但"重新生成"不等于"旧的那份被删了"。很多"氛围垃圾"就是这么留在代码库里的。没人清理,没人审查,就那么躺着,等着哪天出事。
Shopify点名大语言模型推理成本上升拉低利润。美国公司被成本压得喘不过气,中国公司用价格战抢份额。但这轮换挡的副作用就是:当所有人都卷"便宜","靠谱"成了最先被牺牲的变量。
这不是AI的问题,是系统的问题
我想把问题再往上提一层。
"氛围垃圾"的根源不是AI能力不够,是整个软件工程体系还没有适应AI时代的产出速度。过去,代码的产出速度受限于人类写代码的速度——人写多快,审查就跟多快,两者是匹配的。现在AI把产出速度拉到了人类审查速度的几十倍甚至几百倍,但审查流程还是按人的节奏设计的。
这就像工厂的流水线突然提速了10倍,但质检岗位还是原来那几个人。不是质检员不努力,是系统设计没有跟上变化。
解决方案不是让AI写得更慢——那违背技术发展规律。解决方案是重新设计审查体系:AI审AI、自动化测试覆盖、代码质量门禁、可信代码标注。当产出是AI的速度时,审查也必须是AI的速度。
我的判断
OpenClaw工程师的警告应该被刻在每个AI创业者的工位上。
调用量登顶是中国AI的一个重要里程碑,但不能被这个数字冲昏头。DeepSeek赢了调用量,但下一场仗不是调用量——是谁的AI在真实场景里不出事。
调用量是面子,可靠性是里子。面子可以靠价格战赢,里子只能靠质量赢。
当AI代码以万亿Token为单位涌入生产环境,我们需要的不只是更快的AI,是更快的审查、更严的标准、更透明的质量标注。
否则,28.9万亿Token不是成就,是债务。每一行未经审查的"氛围垃圾"代码,都是一笔迟早要还的技术债。而技术债的利息,是用生产事故来付的。
还有一个角度值得展开:"氛围垃圾"不只是代码的问题,是整个AI内容生态的问题。
代码有"氛围垃圾",AI生成的文案有没有?有。AI生成的图片有没有?有。AI生成的视频有没有?有。它们看起来都对,但经不起专业审视。文案的逻辑是编的,图片的细节是错的,视频的物理规律是不对的。
当AI把内容生成的成本降到接近零,人类的注意力就成了新的稀缺资源。你一天能看多少篇AI生成的文章?能审查多少行AI生成的代码?能辨别多少张AI生成的图片?注意力是固定的,但AI的产出是无限的。这个剪刀差,才是"氛围垃圾"危机的底层原因。
这不是某一个AI工具的问题,是整个AI时代内容治理的系统性挑战。我们需要的不只是更好的AI,是更好的内容过滤机制、更透明的质量标注、更严格的发布门槛。否则互联网会变成一个巨大的垃圾场——每一寸空间都被AI生成的内容填满,但真正的价值信号被完全淹没。
最后说一个现实的建议。如果你是一个技术团队的负责人,你现在可以做一件事:给AI生成的代码加一个标记。每一段AI生成的代码,都在提交时标注"AI generated"。这不是歧视AI代码,是让审查者知道这段代码需要更仔细地看。
当一辆车没有经过质检就出厂,你至少得在车窗上贴个标签:"此车未经质检"。让开这辆车的人知道风险。AI代码也应该有同样的标签。这不是增加工作量,是增加透明度。而透明度,是信任的前提。 没有透明度,28.9万亿Token就只是一个不断膨胀的气球。你不知道它什么时候会爆,但你知道它一定会爆。而爆的那一刻,代价不是任何一家公司能承受的。 这不是危言耸听,这是正在发生的事。每一个用AI写代码的人,都应该问问自己:我审查了吗?





