郑工长·AI洞察｜2026.05.12·翁荔亮剑！企业算账撞上模型狂奔

郑工长观点

朋友们好，我是郑工长。

今天AI圈出现了两条截然不同的轨迹，在同一天撞到了一起。

一条来自模型层。翁荔的Thinking Machines Lab发布了首款模型，正式告别"120亿美元估值、0个模型"的标签。这个模型的核心卖点不是参数规模，而是把实时交互做成了模型原生能力——翁荔亲自出镜演示，强调AI不再是"回合制"。同一天，小米宣布自研MiMo的Hermes Agent登顶OpenRouter全球调用量榜首，日Token调用量2910亿；Agnes发布全模态新模型，定义"超低价性价比"。

另一条来自落地端。大河财立方的报道标题直白得刺眼——"企业买AI，从'尝鲜'变成'算账'"。以前AI预算归在创新科目，主打一个"试试看"；现在企业开始追问：ROI多少？省了几个人？降了多少成本？同一天，GitLab宣布裁员，省出的钱不是填财报，而是全部砸向AI智能体业务。还有一条被很多人忽略的新闻——雷峰网起底了大模型"最后一公里"的工程难题：当一家企业的技术栈里躺着五到十个不同厂商的API密钥，谁来统一调度？出了故障谁背锅？

两条路径的核心冲突不在于"该不该做AI"，而在于一个更残酷的问题：AI行业现在应该继续卷模型能力天花板，还是应该停下来把落地的账算清楚？

"卷模型"派的底层假设很清晰：能力天花板就是最好的护城河。TML把实时交互写进模型原生能力、小米用Agent调用量证明需求真实存在、Agnes把价格打到让对手没法跟——谁先在模型层建立不可替代性，谁就能在生态层通吃。

"算账"派的逻辑同样锋利：没有ROI就没有续费，没有续费就没有一切。GitLab裁员的信号很明确——不是AI不重要，而是AI重要到值得用人来换。当企业开始用"省了几个人、多赚了多少钱"来评估AI采购，所有还在烧钱做免费模型的玩家都会被架在火上烤。

我明确站"算账"这一边。

理由只有一个：模型能力的天花板在可预见的未来还会持续被捅破，但企业客户的耐心天花板已经快到了。2025年企业买AI是"怕错过"，2026年是"怕买错"。当企业CIO开始把AI预算从"创新科目"挪到"常规IT支出"里接受ROI考核，模型能力再强，过不了算账这一关，就是实验室里的展品。

TML首秀、小米登顶都在证明一件事——中国AI模型层不缺创新。但GitLab裁员、企业算账、最后一公里工程难题也在证明另一件事——创新离收钱，中间还隔着一条很宽的河。

问题来了：如果你是AI创业公司的CEO，接下来半年你会把80%的资源砸在模型能力上，还是砸在帮客户"算清楚账"上？模型能力和客户ROI，到底哪个才是当前AI行业最该补的短板？

郑工长每天都在关注AI圈的新闻动态，下面进入今日要点：

核心趋势摘要

模型层与落地端同日"分道扬镳"：翁荔TML首秀+小米Agent登顶，对上企业"算账"采购+GitLab裁人投Agent——两条轨迹揭示AI行业正在从"统一狂奔"进入"路径分化"：卷模型的和卷落地的，过去是先后关系，现在变成了并行关系。这意味着行业不再是所有人都走同一条路，而是有人在往前冲天花板，有人蹲下来铺地板
智能体"身份证"进入倒计时：三部委《实施意见》之后首个互联国标将落地：国家网信办等三部门联合发文一周后，具体国标方案浮出水面——AI智能体将拥有统一的身份标识和互联互通标准。这不是远景规划，是即将实施的工程规范
大模型工程化"最后一公里"被起底：企业的API密钥抽屉里躺着五到十个厂商，没人管调度、没人管排错：模型能力越来越强，但企业实际部署中的工程复杂度也在指数级上升。这不是技术问题，是"谁对结果负责"的组织问题

技术突破与基础设施

翁荔TML首秀：告别"回合制AI"，实时交互写进模型原生能力：Thinking Machines Lab发布首个模型，联合创始人翁荔亲自演示。核心突破在于让模型在对话中实时响应、即时打断、并行处理——不再是你说完我等、我说完你等。对一家估值120亿美元却迟迟未发布模型的公司而言，这一步既是亮剑，也是回应
小米MiMo Agent登顶全球调用量榜首：日Token调用2910亿，消费电子厂商的AI牌开始打出：OpenRouter最新数据中，小米Hermes Agent全球调用量第一，周调用超1.75万亿。手机厂商做AI不是玩票——当调用量超过大多数纯模型厂商，终端厂商的入口优势开始兑现
Claw-Eval-Live提出"活的"Benchmark：Agent评测从"看分数"进化到"盯过程"：传统评测是让Agent做固定题库，Claw-Eval-Live追踪Agent真实执行任务的每一步——调了什么数据、绕了多少弯路、出了几次错。评测标准从"答对了没"变成"干活靠不靠谱"
开源"赫尔墨斯"：把鼠标点击变成可控自动化助理：赫尔墨斯AIOS把用户日常操作当作"教材"，将一次性操作变成可复用的自动化技能。技术上走通了"长期记忆+可复用技能+本地优先"三条路线——但便利的另一面是信任问题
国光量子驱动AI智能体实现量子计算实验全流程自动化：实验从"数小时"缩到"几分钟"：AI自己跑完量子计算实验全流程——不是自动化设备替人操作，是AI自己做实验设计、执行和数据分析。Agent正在从"辅助科研"进化为"自主科研"

产业落地加速

法大大发布桌面级法律智能体睿契：律师行业终于等来了AI不是"替代"而是"提效"的产品：不是让AI替律师打官司，而是把合同审查、案件检索、文书起草这些耗时环节自动化。法律AI终于从"吓唬律师"变成了"帮律师多接案、多赚钱"
券商密集路演OpenClaw：金融投研领域正在经历AI工具的"重新分工"：OpenClaw投研应用主题路演场场火爆，金融圈对AI的态度从观望变成了"谁不用谁落后"。分析师的工作内容正在被Agent重新切分——盯数据的归Agent，做判断的归人
嵌入式智能重构工程设计：AI开始理解物理约束、安全标准和硬件限制：不是让AI天马行空地生成方案，而是在严格工程边界内做可信助手。未来的工程师不再被编码、建模、配置等重复性工作束缚——但前提是AI先学会"守规矩"
张江"AI应用商店"开业：普通人零距离触摸AI智能体的第一个线下入口：翻译、宠物看护、健康监测——应用商店模式让AI智能体从"开发者玩具"变成"普通人日用品"。当AI开始像手机App一样被挑选和安装，一个全新的分发渠道正在成形
中南股份联手宝信软件推进AI智能体开发：钢铁行业的智能化改造不是喊口号，已经开始落地产线：设备管理部与AI专家团队视频连线研讨，AI智能体被部署到真实的设备管理场景。传统制造业的AI改造正在从"展示样板"变成"生产线标配"

资本与市场

GitLab裁员重组押注AI智能体：不是砍成本，是换跑道：CEO Bill Staples明确表示裁员不是为了降本，节省的资金全部用于AI智能体业务再投入。当一家300亿美元市值的DevOps巨头选择用"人"换"Agent"，信号已经足够明确——智能体不是未来，是现在
Agnes新模型以全模态+超低价冲击全球AI Lab前十：中国AI创业公司开始在全球牌桌上定义性价比标准：不是参数最大、不是能力最强，而是"够好用+够便宜"——这条路线正在被中国创业公司走通。全球AI竞争格局正在出现新的变量
OpenAI Pre-IPO深度研究出炉：8980亿美元估值只反映"可见收入"，13亿MAU正在形成人类历史上最有价值的消费者入口：用户每天主动打开、深度嵌入工作流、迁移成本极高。这个估值逻辑比任何模型榜单都更能说明AI的商业价值——订阅+API只是冰山露出水面的部分
Strategy软件业务Q1营收增长12%，云收入增59%：AI数据基建从"故事"变成"财报"：当一家以比特币持仓闻名的公司开始用AI数据基建撑起增长曲线，说明AI的市场需求已经硬到可以变成收入。云业务近六成的增速，比任何行业报告都有说服力
智能体开发工程师证书正式发布：一个新的职业资格在行业还在争论"Agent有没有用"的时候已经落地：2026年AI智能体涌入千行百业生产一线，对应的职业认证体系开始建立。这意味着Agent从一个技术概念变成了一个就业方向——而且是官方盖章的那种

相关新闻源

深耕法律实务，桌面级法律智能体正式发布
摘要：法大大发布睿契（Richee.ai）桌面智能体，直击律师及法务工作低效、案源难增等痛点，兼顾实务提效与品牌拓客，让律师专注更有成效的创造。
来源：中华网
全球AI Lab前十！Agnes新模型发布，以全模态+超低价定义模型性价比
Agnes的连续上榜，则意味着全球AI 竞争格局正在出现新的变量。
来源：品玩
券商密集路演OpenClaw，场场火热，将如何影响金融投研？
财联社3月12日讯（记者王晨）金融投研领域迎来大变革，以OpenClaw为核心的智能投研工具成为券商研究所近期焦点。 OpenClaw投研应用主题路演和电话会议异常火爆，据统计，...
来源：财联社
Agent评测的下半场：为什么需要一个「活的」Benchmark？
Claw-Eval-Live提出「活的」benchmark概念，通过信号采集与任务筛选，确保评测内容紧跟企业实际痛点，而非固定不变的题库。评测不仅关注结果，还追踪执行过程，从数据调用到...
来源：51CTO
Strategy CEO：软件业务 Q1 营收增长 12%，与比特币财库形成协同效应
ChainCatcher 消息，Strategy 首席执行官Phong Le 在X 平台发文称，公司软件业务2026 年一季度实现近十年来最强劲季度表现，营收增长12%，其中云业务收入增长59%，...
来源：CryptoRank
AI Agent评测进入下半场：从“看答案”到“看行动”，Claw-Eval如何防止系统放水？
今天的AI Agent 越来越像能真正干活的数字员工：可以调用API、查询数据库、撰写邮件、修改代码、安排日程、生成报表。但真正的难题并非它“会不会说”，而是两个更实际的...
来源：https://www.itsolotime.com/
OpenAI Pre-IPO 深度研究
OpenAI 的13 亿MAU 正在形成人类历史上最有价值的消费者入口——用户每天主动打开、深度嵌入工作流、迁移成本极高。当前$898B 定价仅反映订阅+ API "可见收入"的外推，...
来源：Bitget
开源“赫尔墨斯”究竟如何读懂你的一天：把鼠标点击变成可控自动化助理的技术与实践
赫尔墨斯把这些琐碎动作当作“教材”，试图把一次性操作变成可复用的自动化技能——这既是便利，也带来信任问题。要点速读：赫尔墨斯AIOS 把“长期记忆+可复用技能+本地优先”...
来源：搜狐网
从“数小时”缩短至“几分钟” 国光量子驱动AI智能体实现量子计算实验全流程自动化
科技日报记者马爱平. 近日，北京中科国光量子科技有限公司（以下简称“国光量子”）成功使用AI智能体驱动自动化量子计算实验，让AI自己跑完了一场量子计算实验。
来源：中国科技网
嵌入式智能：重构工程设计的“确定性”新范式
嵌入式智能的终极方向，是让AI在严格遵循物理约束、安全标准、硬件限制的前提下，成为工程师的可信智能助手。未来的工程师将不再被编码、建模、配置等重复性工作束缚，...
来源：电子工程专辑
谁来解决大模型的“最后一公里”工程难题？_手机新浪网
（来源：雷峰网） 2026年的AI行业正陷入一种集体焦虑——DeepSeek、Kimi、Qwen……当一家企业的技术栈里躺着五到十个不同厂商的API密钥时...
来源：新浪财经
津云客户端：专注工业AI 这家天开园企业为产业升级提供数字决策能力
近日，在天开园核心区6号楼的天津汲智科技有限公司（以下简称汲智科技），记者见到了创立这家天开园企业的南开大学人工智能学院机器智能研究所所长、教授刘杰，他向记者介绍...
来源：南开大学新闻网
企业买AI，从“尝鲜”变成“算账”
【大河财立方记者陈薇】以前企业采购人工智能大模型，大多只是抱着试一试的心态：这笔费用归在创新预算里，简单做个测试、打造展示样板，只在少数零散场景使用，主打一个...
来源：大河财立方
AI推理专题研讨会成功举办，共研智能体时代存算协同新路径- 行业动态- 新闻动态
当前，人工智能产业正处于从基础模型研发向规模化应用落地的关键转折。随着大模型在对话问答、工具调用、多智能体协作等场景的快速渗透，推理环节在AI全链条中的战略地位...
来源：开放数据中心委员会
翁荔创业大模型首秀，告别“120亿美元估值0模型”
AI再也不是“回合制”了。 Thinking Machines Lab（以下简称TML）发布首个模型，让实时交互能力成为模型原生能力。联合创始人翁荔出镜演示。从“人说完→AI答→人再说→AI再...
来源：36Kr
探索GEO优化新境界，大模型服务商实力展现
在AI搜索时代，大模型GEO优化正成为品牌增长的新利器。通过深度学习与自然语言处理技术，大模型能够更精准地理解用户意图与需求，为企业提供更高效的GEO优化服务。
来源：Jiemian.com
小米自研AI大模型！Xiaomi MiMo再次登顶全球第一
快科技5月12日消息，小米官方今天发文宣布，小米技术官方宣布，在OpenRouter平台最新数据中，Hermes Agent登顶全球调用量榜首，日Token调用量达2910亿，周调用量超1.75万亿。
来源：新浪财经
兰州石化：“毒”眼同事出圈记
5月6日上午，在兰州石化3.5万吨/年特种丁腈橡胶装置生产A线上，一块崭新的橡胶产品刚刚下线。传送带上，一名特殊的质检操作工即时开启工作模式：拍照、翻转、识别、记录...
来源：甘肃日报
央视财经走进宁波制造标杆得力：全链路AI激活中国智造新动能
近期，央视财经频道《与经济学家一起旅行》栏目走进浙江宁波，开启一场智能经济新形态的体验之旅。作为文教行业智能制造代表企业，得力集团受邀参与专题拍摄。
来源：中华网
明显感觉嵌入式开发的面试已经变了！！
不夸张的说，未来5年程序员最好的技术发展方向，一定是AI大模型！华为全面布局Agent，覆盖80%新业务系统；美团新招50%技术岗，明确要求掌握微调或应用开发技能；阿里、字...
来源：电子工程专辑
从“数小时”缩短至“几分钟” 国光量子驱动AI智能体实现量子计算实验全流程自动化
科技日报记者马爱平. 近日，北京中科国光量子科技有限公司（以下简称“国光量子”）成功使用AI智能体驱动自动化量子计算实验，让AI自己跑完了一场量子计算实验。
来源：中国科技网
国家队出手！AI智能体要发「身份证」，首个互联国标将落地
（来源：新智元）新智元报道编辑：YHluck 【新智元导读】2026年5月8日，国家网信办、国家发展改革委、工业和信息化部联合发布《智能体规范应用与创新发展实施意见》（以...
来源：新浪财经
AI推理专题研讨会成功举办，共研智能体时代存算协同新路径- 行业动态- 新闻动态
当前，人工智能产业正处于从基础模型研发向规模化应用落地的关键转折。随着大模型在对话问答、工具调用、多智能体协作等场景的快速渗透，推理环节在AI全链条中的战略地位...
来源：开放数据中心委员会
三部门发文规范AI智能体发展规范与创新并举
支持落实新一代智能终端、智能体等应用普及率超70%的阶段性目标.
来源：财新
中南股份设备管理部与宝信软件携手推进AI智能体开发
为加速设备管理智能化转型，近日，宝武集团中南股份设备管理部与宝信软件专家团队以视频连线方式召开专题研讨会，围绕AI智能体开发应用展开深度协同。
来源：中国钢铁新闻网
“AI应用商店”来了，在张江零距离触摸“未来生活”
爸妈出国旅行，不会外语沟通不方便怎么办？上班族无法24小时关注家里毛孩子的身体状况，怎么解决？热爱...
来源：上海浦东
每日互动：打造安全、实用、普惠的AI智能体标杆 | 2026全球数据周
数据智能领军企业每日互动深度参与本次大会，总裁刘宇受邀参加“AI Agent全球产业生态论坛”并发表《仝行共创——让AI用得起、用得起来》的主题演讲，公司主推的实用级AI应用...
来源：搜狐网
再出新证！智能体开发工程师证书正式发布
2026年，随着AI智能体从概念验证的实验室全面涌入千行百业的生产一线，这一技术正成为企业数字化转型与新质生产力构建的核心引擎。
来源：51CTO
GitLab宣布裁员并重投资金布局AI智能体时代
2026年5月11日，GitLab首席执行官Bill Staples发布内部备忘录，宣布将进行裁员。此举旨在为抢占AI智能体市场机遇腾出资金，而非单纯降本。节省资金将主要用于业务再投入，...
来源：DoNews
利用AI 他22天再造了工作流程
从多款开源人工智能模型引发广泛关注，到智能机器人在春晚舞台惊艳亮相，再到新一代AI视频生成技术风靡全球、开源人工智能（AI）智能体工具掀起互动热潮——一个又一个热点，...
来源：中华网