郑工长

郑工长·AI洞察|2026.05.12·翁荔亮剑!企业算账撞上模型狂奔

发布于 2026年5月12日 | 分类: AI洞察日报

郑工长·AI洞察|2026.05.12·翁荔亮剑!企业算账撞上模型狂奔

郑工长观点

朋友们好,我是郑工长。

今天AI圈出现了两条截然不同的轨迹,在同一天撞到了一起。

一条来自模型层。翁荔的Thinking Machines Lab发布了首款模型,正式告别"120亿美元估值、0个模型"的标签。这个模型的核心卖点不是参数规模,而是把实时交互做成了模型原生能力——翁荔亲自出镜演示,强调AI不再是"回合制"。同一天,小米宣布自研MiMo的Hermes Agent登顶OpenRouter全球调用量榜首,日Token调用量2910亿;Agnes发布全模态新模型,定义"超低价性价比"。

另一条来自落地端。大河财立方的报道标题直白得刺眼——"企业买AI,从'尝鲜'变成'算账'"。以前AI预算归在创新科目,主打一个"试试看";现在企业开始追问:ROI多少?省了几个人?降了多少成本?同一天,GitLab宣布裁员,省出的钱不是填财报,而是全部砸向AI智能体业务。还有一条被很多人忽略的新闻——雷峰网起底了大模型"最后一公里"的工程难题:当一家企业的技术栈里躺着五到十个不同厂商的API密钥,谁来统一调度?出了故障谁背锅?

两条路径的核心冲突不在于"该不该做AI",而在于一个更残酷的问题:AI行业现在应该继续卷模型能力天花板,还是应该停下来把落地的账算清楚?

"卷模型"派的底层假设很清晰:能力天花板就是最好的护城河。TML把实时交互写进模型原生能力、小米用Agent调用量证明需求真实存在、Agnes把价格打到让对手没法跟——谁先在模型层建立不可替代性,谁就能在生态层通吃。

"算账"派的逻辑同样锋利:没有ROI就没有续费,没有续费就没有一切。GitLab裁员的信号很明确——不是AI不重要,而是AI重要到值得用人来换。当企业开始用"省了几个人、多赚了多少钱"来评估AI采购,所有还在烧钱做免费模型的玩家都会被架在火上烤。

我明确站"算账"这一边。

理由只有一个:模型能力的天花板在可预见的未来还会持续被捅破,但企业客户的耐心天花板已经快到了。2025年企业买AI是"怕错过",2026年是"怕买错"。当企业CIO开始把AI预算从"创新科目"挪到"常规IT支出"里接受ROI考核,模型能力再强,过不了算账这一关,就是实验室里的展品。

TML首秀、小米登顶都在证明一件事——中国AI模型层不缺创新。但GitLab裁员、企业算账、最后一公里工程难题也在证明另一件事——创新离收钱,中间还隔着一条很宽的河。

问题来了:如果你是AI创业公司的CEO,接下来半年你会把80%的资源砸在模型能力上,还是砸在帮客户"算清楚账"上?模型能力和客户ROI,到底哪个才是当前AI行业最该补的短板?

郑工长每天都在关注AI圈的新闻动态,下面进入今日要点:

核心趋势摘要

  • 模型层与落地端同日"分道扬镳":翁荔TML首秀+小米Agent登顶,对上企业"算账"采购+GitLab裁人投Agent——两条轨迹揭示AI行业正在从"统一狂奔"进入"路径分化":卷模型的和卷落地的,过去是先后关系,现在变成了并行关系。这意味着行业不再是所有人都走同一条路,而是有人在往前冲天花板,有人蹲下来铺地板
  • 智能体"身份证"进入倒计时:三部委《实施意见》之后首个互联国标将落地:国家网信办等三部门联合发文一周后,具体国标方案浮出水面——AI智能体将拥有统一的身份标识和互联互通标准。这不是远景规划,是即将实施的工程规范
  • 大模型工程化"最后一公里"被起底:企业的API密钥抽屉里躺着五到十个厂商,没人管调度、没人管排错:模型能力越来越强,但企业实际部署中的工程复杂度也在指数级上升。这不是技术问题,是"谁对结果负责"的组织问题

技术突破与基础设施

  • 翁荔TML首秀:告别"回合制AI",实时交互写进模型原生能力:Thinking Machines Lab发布首个模型,联合创始人翁荔亲自演示。核心突破在于让模型在对话中实时响应、即时打断、并行处理——不再是你说完我等、我说完你等。对一家估值120亿美元却迟迟未发布模型的公司而言,这一步既是亮剑,也是回应
  • 小米MiMo Agent登顶全球调用量榜首:日Token调用2910亿,消费电子厂商的AI牌开始打出:OpenRouter最新数据中,小米Hermes Agent全球调用量第一,周调用超1.75万亿。手机厂商做AI不是玩票——当调用量超过大多数纯模型厂商,终端厂商的入口优势开始兑现
  • Claw-Eval-Live提出"活的"Benchmark:Agent评测从"看分数"进化到"盯过程":传统评测是让Agent做固定题库,Claw-Eval-Live追踪Agent真实执行任务的每一步——调了什么数据、绕了多少弯路、出了几次错。评测标准从"答对了没"变成"干活靠不靠谱"
  • 开源"赫尔墨斯":把鼠标点击变成可控自动化助理:赫尔墨斯AIOS把用户日常操作当作"教材",将一次性操作变成可复用的自动化技能。技术上走通了"长期记忆+可复用技能+本地优先"三条路线——但便利的另一面是信任问题
  • 国光量子驱动AI智能体实现量子计算实验全流程自动化:实验从"数小时"缩到"几分钟":AI自己跑完量子计算实验全流程——不是自动化设备替人操作,是AI自己做实验设计、执行和数据分析。Agent正在从"辅助科研"进化为"自主科研"

产业落地加速

  • 法大大发布桌面级法律智能体睿契:律师行业终于等来了AI不是"替代"而是"提效"的产品:不是让AI替律师打官司,而是把合同审查、案件检索、文书起草这些耗时环节自动化。法律AI终于从"吓唬律师"变成了"帮律师多接案、多赚钱"
  • 券商密集路演OpenClaw:金融投研领域正在经历AI工具的"重新分工":OpenClaw投研应用主题路演场场火爆,金融圈对AI的态度从观望变成了"谁不用谁落后"。分析师的工作内容正在被Agent重新切分——盯数据的归Agent,做判断的归人
  • 嵌入式智能重构工程设计:AI开始理解物理约束、安全标准和硬件限制:不是让AI天马行空地生成方案,而是在严格工程边界内做可信助手。未来的工程师不再被编码、建模、配置等重复性工作束缚——但前提是AI先学会"守规矩"
  • 张江"AI应用商店"开业:普通人零距离触摸AI智能体的第一个线下入口:翻译、宠物看护、健康监测——应用商店模式让AI智能体从"开发者玩具"变成"普通人日用品"。当AI开始像手机App一样被挑选和安装,一个全新的分发渠道正在成形
  • 中南股份联手宝信软件推进AI智能体开发:钢铁行业的智能化改造不是喊口号,已经开始落地产线:设备管理部与AI专家团队视频连线研讨,AI智能体被部署到真实的设备管理场景。传统制造业的AI改造正在从"展示样板"变成"生产线标配"

资本与市场

  • GitLab裁员重组押注AI智能体:不是砍成本,是换跑道:CEO Bill Staples明确表示裁员不是为了降本,节省的资金全部用于AI智能体业务再投入。当一家300亿美元市值的DevOps巨头选择用"人"换"Agent",信号已经足够明确——智能体不是未来,是现在
  • Agnes新模型以全模态+超低价冲击全球AI Lab前十:中国AI创业公司开始在全球牌桌上定义性价比标准:不是参数最大、不是能力最强,而是"够好用+够便宜"——这条路线正在被中国创业公司走通。全球AI竞争格局正在出现新的变量
  • OpenAI Pre-IPO深度研究出炉:8980亿美元估值只反映"可见收入",13亿MAU正在形成人类历史上最有价值的消费者入口:用户每天主动打开、深度嵌入工作流、迁移成本极高。这个估值逻辑比任何模型榜单都更能说明AI的商业价值——订阅+API只是冰山露出水面的部分
  • Strategy软件业务Q1营收增长12%,云收入增59%:AI数据基建从"故事"变成"财报":当一家以比特币持仓闻名的公司开始用AI数据基建撑起增长曲线,说明AI的市场需求已经硬到可以变成收入。云业务近六成的增速,比任何行业报告都有说服力
  • 智能体开发工程师证书正式发布:一个新的职业资格在行业还在争论"Agent有没有用"的时候已经落地:2026年AI智能体涌入千行百业生产一线,对应的职业认证体系开始建立。这意味着Agent从一个技术概念变成了一个就业方向——而且是官方盖章的那种

相关新闻源