郑工长·AI洞察｜2026.05.31·5亿Token白送！智能体账单谁在算

郑工长观点

朋友们好，我是郑工长。

5亿。

这是今天一家AI主机厂商给出的白送Token数量。5亿Tokens，听着像是够一个开发者烧好一阵子了。同一天，Anthropic被传出估值冲向万亿，但Claude 4.8被媒体评价为「没那么惊艳」。再翻一页，华尔街的分析师们正在集体上调内存股目标价——理由是AI智能体正在「重写需求曲线」。

三条消息分开看，都是行业日常。放在一起，指向同一个被刻意回避的问题：AI越来越便宜，但用AI的人越来越贵。

反差在哪？厂商们争相降价、白送Token，营造出一种「AI已经白菜价了」的氛围。但真正把AI智能体部署到生产环境的企业正在发现另一个现实——智能体不是用一次就停，是7×24小时不停地跑。一次对话几百Token，一天上万次对话——Token账单是按月算的，不是按次算的。5亿Token听着多，一个中等规模的企业智能体集群，可能两周就烧完了。

更隐蔽的问题藏在Token质量里。清华翟季冬教授今天丢出一个数字：部分服务商的慢响应比例接近20%。翻译一下：每五次调用就有一次在「卡壳」。当智能体在自动执行任务时遇到慢响应，它不会抱怨——它只会反复重试，每一次重试都在烧Token。一个本来1000 Token能搞定的任务，因为响应慢、反复重试，最终烧掉3000 Token。这部分成本，没有任何厂商会在「白送5亿」的广告里告诉你。

这就是今天AI行业最拧巴的地方：模型能力在提升、单价在下降，但智能体时代的Token消耗总量在以指数级增长。华尔街上调内存股目标价，不是因为AI不烧钱了，恰恰是因为太烧钱了——HBM、DRAM、NAND三条线同步走强，背后是智能体集群对内存的饥渴需求。每一条需求曲线都在向上拐，而拐点的驱动力正是「让AI一直跑」。

我的判断：Token定价模型是为「人机对话」设计的，不是为「智能体自主运行」设计的。当AI从「你问一句我答一句」进化到「你睡了我还在干活」，按量计费的模型会在某个节点突然变得不划算。这不是厂商降价能解决的问题——降价只会让更多人把智能体跑起来，Token消耗总量继续暴涨，底层硬件需求继续扩张。价格螺旋下降，用量螺旋上升，总成本是一条不确定的曲线。对厂商来说，这是增长飞轮。对用户来说，这是预算黑洞。

问题来了：你觉得AI智能体的Token计费模式，是按量计费合理，还是该改成「包月无限跑」？你公司的AI账单，现在是你在看，还是财务在看？

我每天都在关注AI圈的新闻动态，看看今天AI圈都有哪些新动态：

核心趋势摘要

Token白送与Token焦虑同时拉满：AI的「免费午餐」正在变成「自助餐陷阱」：5亿Token白送的广告满天飞，但清华教授揭底——近20%调用慢响应，智能体反复重试烧掉的Token没人报账。厂商的定价模型为「人机对话」设计，智能体7×24跑起来后，成本公式彻底失效
中国AI编程闯入全球第二，前面只剩Claude：Qwen3.7-Max在Claude Code、OpenClaw、Qwen Code多个框架里表现稳定，没有出现「换框架就拉胯」的通病。国产模型在编程这个硬核赛道上的存在感，正在从「能打」变成「能争第一」
红杉对话AI原生先锋：你入职时以为的工作，80%都是不该存在的流程：Serval创始人戳破企业软件最大的幻觉——大部分IT流程不是解决业务问题，是解决「上一个流程创造出来的问题」。AI原生不是给旧流程套AI壳，是把流程本身吃掉

技术突破与基础设施

Qwen3.7-Max编程能力全球第二，国产模型从「能打」升级到「能争第一」：在多个主流编程框架中表现稳定，解决了此前国产模型「换框架就拉胯」的适配性问题。不是单点突破，是系统性追上
微软开源PyRIT和Rampart：AI智能体安全检测从「事后救火」推到「写代码时就查」：PyRIT面向安全研究员做黑盒发现，Rampart面向工程师在构建过程中做自动化测试。当智能体开始自主操作数据库和API，安全检测前置不是可选项，是必选项
面壁智能押注端侧AI：大模型塞进手机，不靠云端也能跑：当行业集体往更大参数方向卷时，面壁在走另一条路——把模型压缩到端侧设备本地运行。端侧AI的竞争，比的不再是参数规模，是推理效率和信息密度
唯元智创双平台发布：AI算力管理+大模型聚合，企业级一站式底座来了：唯一网络旗下AI子公司揭牌，同步推出算力管理调度平台和大模型聚合平台。从「建机房」到「搭平台」，算力基建的思路正在从卖资源转向卖服务

产业落地加速

360全国百城招募「训虾工匠」：AI落地的最后一公里，缺的不是模型，是能把模型嵌进业务的人：面向全国大规模招募懂AI、懂业务、能落地的新型技术人才。大模型能力再强，没有「翻译官」把业务需求转译成AI指令，企业买回来的模型就是一堆API文档
红杉对话Serval创始人：AI原生不是给旧流程套AI壳，是直接吃掉流程：双Agent架构+请求驱动范式替代传统工单系统，核心逻辑不是自动化旧流程，而是判定哪些流程根本不该存在。「80%的工作流程是冗余的」——这句话值得每一个在做AI落地的团队贴在墙上
抖音「AI求真」大模型治理谣言满一年：谣言被处置时平均浏览量下降62%：把大模型用于谣言识别和辟谣运营，不是事后删帖，是在传播链早期截断。62%的降幅意味着AI不是在「补漏」，是在「改流」
银行打响AI人才争夺战：国有大行和股份制银行集体下场抢大模型研发岗：本轮招聘聚焦大模型研发、AI场景落地、技术架构规划。当最保守的行业开始用最激进的姿势抢人，说明AI已不是「试试看」的实验项目，而是数字化生死局
海信CEO于芝涛：数字化转型正经历两个根本性转变：从流程驱动转向数据驱动，从经验决策转向智能决策。当千亿级制造企业一把手亲自谈AI转型，比任何智库报告都更能说明产业端的真实水温

资本与市场

Blackbaud股价暴跌44%：市场正在用脚给「AI利润率故事」打分：这家SaaS公司一季度营收2.81亿美元，产品嵌入70多项AI功能、推出发展代理，但股价半年跌掉44.8%。AI功能加得越多，市场越担心利润率被吃掉——功能堆叠不等于商业回报
华尔街集体上调内存股目标价：智能体AI重写需求曲线的逻辑被验证：DRAM、HBM、NAND三条主线同步走强，分析机构认为AI智能体浪潮正在从底层重构全球内存需求结构。智能体跑得越多，硬件需求越刚性——这不再是短期炒作，是结构性趋势
「财务智能体」入选2026年会计行业十大技术：AI智能体从概念热词变成行业标配：上海国家会计学院评选结果揭晓，智能体技术首次强势上榜。当最保守的财务行业开始把智能体列入「十大技术」，Agent不再是科技圈的内部黑话
2026中国AI智能体大会7月登陆杭州：阿里、美团、腾讯同台切磋智能体落地：从单点Agent到多智能体编排，从实验室Demo到生产环境实战，头部大厂的集体亮相意味着智能体赛道正在从「各自探索」进入「互相对标」阶段

相关新闻源

多重检测市场规模、份额 |增长预测 [2034]
全球多重检测市场规模预计将从2026 年的25.6 亿美元增长到2034 年的94.8 亿美元，预测期内复合年增长率为17.77%
来源：Fortune Business Insights
自动化与智能科学学院（物联网学院）举行预备党员转正答辩会
为严格落实党员发展工作规范，切实提高学生党员发展质量，推动学院党建工作标准化、规范化建设，严格执行《江南大学大学生发展党员工作“三投票三公示一答辩”实施办法》，...
来源：江南大学新闻网
詹森40万亿美元的机器人投资建议：买入相关工具、铲子和控制系统类股票
GlobalData预计，机器人市场规模将从2024年约900亿美元增至2030年2050亿美元，涵盖仓库自动化等多领域。首批收益来自计算等基础设施，软件和芯片率先吸纳价值，企业工作流...
来源：Sina finance
5亿Tokens白送！全球首个商用AI主机发布，终于能放开烧Token了
2026年，AI从对话迈向自主执行，“超级个体”与一人公司（OPC）加速涌现。然而，随着AI Agent自动化运行时间延长，按量计费的Token成本激增，带来显著经济压力。用户兴奋消退后，...
来源：智源社区
红杉对话Serval创始人：入职时你以为的工作，80%都是不该存在的流程：AI 原生思维如何吃掉企业软件
本文编译自红杉资本与Serval创始人Jake Stauch的对话，探讨AI原生企业IT自动化平台如何通过双Agent架构和请求驱动范式替代传统工单系统，解放IT人员创造力，...
来源：虎嗅
微软开源两款工具，将AI智能体安全检测前置于开发流程
两者的核心区别在于：PyRIT面向安全研究人员，用于系统构建完成后的黑盒发现；而Rampart面向工程师，在系统构建过程中使用，支持将红队发现转化为可重复的自动化测试，...
来源：搜狐网
Anthropic估值万亿，但Claude 4.8没那么惊艳
AIX财经（AIXcaijing）原创. 作者| 王璐. 编辑| 魏佳. Claude再次成为焦点。 5月29日凌晨，AI行业又上演了一场“深夜突袭”。美国大模型公司Anthropic正式发布Claude最新...
来源：ThePaper.cn
打通AI落地的“最后一公里”：360在全国百城招募“训虾工匠”|OpenClaw|AI智能|底层技术|智能体|工程师_手机新浪网
（来源：上游新闻）近日，360集团正式启动“AI工程师（训虾工匠）全国上岗计划”，面向全国百城大规模招募懂AI、懂业务、能落地的新型技术人才。
来源：新浪财经
Blackbaud股价暴跌44%，被解读为人工智能利润率故事
黑巴德过去六个月股价跌44.8%，进入调整阶段引投资者分歧。一季度营收2.811亿美元，经常性收入占比98.3%，重申2026年业绩指引。产品嵌入70多项新AI功能、推出“发展代理”。
来源：Sina finance
中捷资源2025年研发投入3318万研发团队扩张新品与数字化成果显著
中捷资源（002021）近日发布2025年年度财务报告，数据显示公司全年研发投入达3318.21万元，较上年增长4.13%，占营业收入比重提升至3.97%。近五年研发投入复合增长率保持...
来源：天脉网
AI求真大模型助力抖音谣言治理：谣言被处置时平均浏览量下降62%
（来源：上观新闻）将AI大模型技术应用于谣言治理和辟谣运营工作一年之际，抖音公布最新数据：自“AI求真”大模型上线以来，谣言被处置时的平均浏览量下降62%...
来源：新浪财经
刘庆峰：软硬一体协同，大模型正在向行业纵深发展
新京报贝壳财经讯5月28日至31日，2026世界智能产业博览会（以下简称智博会）在国家会展中心（天津）开幕。科大讯飞董事长刘庆峰在智博会上发表演讲，表示AI大模型正在从对话...
来源：新京报
中国AI闯入全球编程前二，前面只剩Claude
这解释了一个反直觉的现象，Qwen3.7-Max在Claude Code、OpenClaw、Qwen Code这几个框架里的表现都很稳，没有出现「在自家框架里很强、换一个就拉胯」的情况。四个模型...
来源：CSDN博客
姚顺宇：大模型学东西的能力正变得越来越强
澎湃，澎湃新闻，澎湃新闻网，新闻与思想，澎湃是植根于中国上海的时政思想类互联网平台，以最活跃的原创新闻与最冷静的思想分析为两翼，是互联网技术创新与新闻价值传承的...
来源：ThePaper.cn
上海交通大学：AI赋能教育变革，自智网络护航智慧校园
[中国，上海，2026年5月28日]华为数据通信创新峰会2026.中国期间，上海交通大学信息中心网络业务部主任谢锐应邀发表主题演讲，系统分享了“基于网络大模型打造AI'大运维'，...
来源：同花顺
端侧AI的大模型时代，从面壁智能开始
人类历史上最厉害的压缩技术，不是ZIP或JPEG，而是文字。一个“火”字，就能把燃烧、温度、颜色、危险、能量等复杂的元素浓缩进一个符号。几笔写成，信息密度极高，...
来源：风闻
『观察』银行争抢高端AI人才 “竞速”数智化转型
本轮AI专项招聘覆盖国有大行及股份制银行，岗位聚焦大模型研发、AI场景落地、技术架构规划等核心领域，是推动银行智能化转型的关键岗位。展望未来，南开大学金融学教授...
来源：搜狐网
唯元智创重磅发布两大AI产品，打造企业级AI算力与模型一站式底座
智算为基，词元为翼。5月28日，唯一网络旗下AI及智算全资子公司深圳市唯元智创科技有限公司正式揭牌成立，同步发布AI大模型聚合平台、AI算力管理调度平台两大核心产品。
来源：六安新闻网
日均Token调用量增长专家建言AI时代“水电煤”高效流通
中新网北京5月30日电(记者张素)“Token质量参差不齐，一些服务商的模型很'笨'。”清华大学计算机系长聘教授翟季冬近日在一场活动上说，部分服务商的慢响应比例接近20%，这...
来源：Sina finance
MiniMax启动A股上市辅导，距刷新“最快IPO”AI公司仅4个月
（来源：上观新闻）中国证监会今天（30）披露，AI大模型公司MiniMax（上海稀宇科技有限公司）在上海证监局办理辅导备案登记，拟发行A股上市...
来源：新浪财经
千亿光储龙头，推出首个能源全域AI智能体
5月29日，思格新能源线上发布能源行业首个全域AI智能体SigenAgent。该公司2022年成立，今年4月港交所上市，截至5月29日收盘，股价485.00港元，总市值超1200亿港元。
来源：Sina finance
AI记忆顶咖与AI芯片大牛领衔！Agent最火的九个方向，阿里美团腾讯7月同台切磋
2026中国AI智能体大会7月2-3日将在杭州举办～
来源：智东西
解锁暴雨背后武汉AI治理的三层密码
本月接连多轮强降雨来袭，可大雨之下城市未见明显积水，《湖北新闻》节目为大家揭开这份防汛保障背后的“三层密码”。两轮强降雨，两次发布暴雨红色预警！本月，武汉遭遇入汛...
来源：武汉市数据局
AI浪潮下，如何培养青少年的思维能力？
人工智能与教育的深度融合已势不可挡。
来源：人民日报-有品质的新闻
网易智企 IM 研发多智能体中心建设与实践：从单点 Agent 到研发基础设施｜AICon 上海
本次分享结合云信IM 研发多智能体中心的真实建设实践，介绍如何从单点Agent 试验出发逐步构建一套面向企业研发场景的智能体平台.
来源：Infoq.cn
“江苏省职业发展AI赋能联盟”成立，发布首个标志性成果“我职我业”AI智能体
5月29日上午，“江苏省职业发展AI赋能联盟”成立大会暨“我职我业”AI智能体发布会在江苏开放大学举行。江苏省教育厅二级巡视员张鲤鲤，省工商业联合会党组成员、副主席郭...
来源：ThePaper.cn
海信集团CEO于芝涛：海信的数字化转型正经历两个根本性转变
5月29日，2026年青岛新一代信息技术及人工智能产业对接大会在青岛举办。此次大会以“向新·向智·向未来”为主题，汇聚政府、产业、资本等各方智慧，搭建思想碰撞、资源互通、...
来源：证券时报
开元云受邀出席2026世界智能大会
在AI浪潮涌动之际，5月28日，以“智行天下能动未来”为主题的2026世界智能产业博览会在国家会展中心（天津）盛大启幕。开元云作为天津滨海高新区重点引进的全球AI智能体服务...
来源：搜狐网
华尔街上调内存目标价：智能体AI正在重写需求曲线机构最新深度分析显示，AI智能体浪潮正在从底层重构全球内存需求结...
华尔街上调内存目标价：智能体AI正在重写需求曲线机构最新深度分析显示，AI智能体浪潮正在从底层重构全球内存需求结构——DRAM、HBM、NAND三条主线同步走强，受益标的目标价...
来源：Moomoo
2026年影响中国会计行业的十大信息技术评选揭晓！智能体技术强势崛起
“十年甄选铸标杆会计科技赋未来”主题论坛暨2026年影响中国会计行业的十大信息技术评选结果发布会昨天在上海国家会计学院国际会议中心举行。评选结果显示，“财务智能体和...
来源：上观新闻