郑工长

郑工长·AI洞察|2026.05.31·5亿Token白送!智能体账单谁在算

发布于 2026年5月31日 | 分类: AI洞察日报

郑工长·AI洞察|2026.05.31·5亿Token白送!智能体账单谁在算

郑工长观点

朋友们好,我是郑工长。

5亿。

这是今天一家AI主机厂商给出的白送Token数量。5亿Tokens,听着像是够一个开发者烧好一阵子了。同一天,Anthropic被传出估值冲向万亿,但Claude 4.8被媒体评价为「没那么惊艳」。再翻一页,华尔街的分析师们正在集体上调内存股目标价——理由是AI智能体正在「重写需求曲线」。

三条消息分开看,都是行业日常。放在一起,指向同一个被刻意回避的问题:AI越来越便宜,但用AI的人越来越贵。

反差在哪?厂商们争相降价、白送Token,营造出一种「AI已经白菜价了」的氛围。但真正把AI智能体部署到生产环境的企业正在发现另一个现实——智能体不是用一次就停,是7×24小时不停地跑。一次对话几百Token,一天上万次对话——Token账单是按月算的,不是按次算的。5亿Token听着多,一个中等规模的企业智能体集群,可能两周就烧完了。

更隐蔽的问题藏在Token质量里。清华翟季冬教授今天丢出一个数字:部分服务商的慢响应比例接近20%。翻译一下:每五次调用就有一次在「卡壳」。当智能体在自动执行任务时遇到慢响应,它不会抱怨——它只会反复重试,每一次重试都在烧Token。一个本来1000 Token能搞定的任务,因为响应慢、反复重试,最终烧掉3000 Token。这部分成本,没有任何厂商会在「白送5亿」的广告里告诉你。

这就是今天AI行业最拧巴的地方:模型能力在提升、单价在下降,但智能体时代的Token消耗总量在以指数级增长。华尔街上调内存股目标价,不是因为AI不烧钱了,恰恰是因为太烧钱了——HBM、DRAM、NAND三条线同步走强,背后是智能体集群对内存的饥渴需求。每一条需求曲线都在向上拐,而拐点的驱动力正是「让AI一直跑」。

我的判断:Token定价模型是为「人机对话」设计的,不是为「智能体自主运行」设计的。当AI从「你问一句我答一句」进化到「你睡了我还在干活」,按量计费的模型会在某个节点突然变得不划算。这不是厂商降价能解决的问题——降价只会让更多人把智能体跑起来,Token消耗总量继续暴涨,底层硬件需求继续扩张。价格螺旋下降,用量螺旋上升,总成本是一条不确定的曲线。对厂商来说,这是增长飞轮。对用户来说,这是预算黑洞。

问题来了:你觉得AI智能体的Token计费模式,是按量计费合理,还是该改成「包月无限跑」?你公司的AI账单,现在是你在看,还是财务在看?

我每天都在关注AI圈的新闻动态,看看今天AI圈都有哪些新动态:

核心趋势摘要

  • Token白送与Token焦虑同时拉满:AI的「免费午餐」正在变成「自助餐陷阱」:5亿Token白送的广告满天飞,但清华教授揭底——近20%调用慢响应,智能体反复重试烧掉的Token没人报账。厂商的定价模型为「人机对话」设计,智能体7×24跑起来后,成本公式彻底失效
  • 中国AI编程闯入全球第二,前面只剩Claude:Qwen3.7-Max在Claude Code、OpenClaw、Qwen Code多个框架里表现稳定,没有出现「换框架就拉胯」的通病。国产模型在编程这个硬核赛道上的存在感,正在从「能打」变成「能争第一」
  • 红杉对话AI原生先锋:你入职时以为的工作,80%都是不该存在的流程:Serval创始人戳破企业软件最大的幻觉——大部分IT流程不是解决业务问题,是解决「上一个流程创造出来的问题」。AI原生不是给旧流程套AI壳,是把流程本身吃掉

技术突破与基础设施

  • Qwen3.7-Max编程能力全球第二,国产模型从「能打」升级到「能争第一」:在多个主流编程框架中表现稳定,解决了此前国产模型「换框架就拉胯」的适配性问题。不是单点突破,是系统性追上

  • 微软开源PyRIT和Rampart:AI智能体安全检测从「事后救火」推到「写代码时就查」:PyRIT面向安全研究员做黑盒发现,Rampart面向工程师在构建过程中做自动化测试。当智能体开始自主操作数据库和API,安全检测前置不是可选项,是必选项

  • 面壁智能押注端侧AI:大模型塞进手机,不靠云端也能跑:当行业集体往更大参数方向卷时,面壁在走另一条路——把模型压缩到端侧设备本地运行。端侧AI的竞争,比的不再是参数规模,是推理效率和信息密度

  • 唯元智创双平台发布:AI算力管理+大模型聚合,企业级一站式底座来了:唯一网络旗下AI子公司揭牌,同步推出算力管理调度平台和大模型聚合平台。从「建机房」到「搭平台」,算力基建的思路正在从卖资源转向卖服务

产业落地加速

  • 360全国百城招募「训虾工匠」:AI落地的最后一公里,缺的不是模型,是能把模型嵌进业务的人:面向全国大规模招募懂AI、懂业务、能落地的新型技术人才。大模型能力再强,没有「翻译官」把业务需求转译成AI指令,企业买回来的模型就是一堆API文档

  • 红杉对话Serval创始人:AI原生不是给旧流程套AI壳,是直接吃掉流程:双Agent架构+请求驱动范式替代传统工单系统,核心逻辑不是自动化旧流程,而是判定哪些流程根本不该存在。「80%的工作流程是冗余的」——这句话值得每一个在做AI落地的团队贴在墙上

  • 抖音「AI求真」大模型治理谣言满一年:谣言被处置时平均浏览量下降62%:把大模型用于谣言识别和辟谣运营,不是事后删帖,是在传播链早期截断。62%的降幅意味着AI不是在「补漏」,是在「改流」

  • 银行打响AI人才争夺战:国有大行和股份制银行集体下场抢大模型研发岗:本轮招聘聚焦大模型研发、AI场景落地、技术架构规划。当最保守的行业开始用最激进的姿势抢人,说明AI已不是「试试看」的实验项目,而是数字化生死局

  • 海信CEO于芝涛:数字化转型正经历两个根本性转变:从流程驱动转向数据驱动,从经验决策转向智能决策。当千亿级制造企业一把手亲自谈AI转型,比任何智库报告都更能说明产业端的真实水温

资本与市场

  • Blackbaud股价暴跌44%:市场正在用脚给「AI利润率故事」打分:这家SaaS公司一季度营收2.81亿美元,产品嵌入70多项AI功能、推出发展代理,但股价半年跌掉44.8%。AI功能加得越多,市场越担心利润率被吃掉——功能堆叠不等于商业回报

  • 华尔街集体上调内存股目标价:智能体AI重写需求曲线的逻辑被验证:DRAM、HBM、NAND三条主线同步走强,分析机构认为AI智能体浪潮正在从底层重构全球内存需求结构。智能体跑得越多,硬件需求越刚性——这不再是短期炒作,是结构性趋势

  • 「财务智能体」入选2026年会计行业十大技术:AI智能体从概念热词变成行业标配:上海国家会计学院评选结果揭晓,智能体技术首次强势上榜。当最保守的财务行业开始把智能体列入「十大技术」,Agent不再是科技圈的内部黑话

  • 2026中国AI智能体大会7月登陆杭州:阿里、美团、腾讯同台切磋智能体落地:从单点Agent到多智能体编排,从实验室Demo到生产环境实战,头部大厂的集体亮相意味着智能体赛道正在从「各自探索」进入「互相对标」阶段


相关新闻源