郑工长·AI洞察｜2026.05.04·调用量反超！AI通用代理入侵每个工位

郑工长观点

朋友们好，我是郑工长。

今天AI圈同时走了两条截然不同的路，放在一起看比任何趋势报告都精彩。

一边是OpenAI。Codex这个曾经专属于程序员的编程工具，今天被正式改造成通用工作代理——能连你的Slack、翻你的Gmail、管你的日历、替你回邮件。奥特曼甚至在X上调侃："祝您捕龙虾愉快。"意思是，以前你得专门搞个OpenClaw账号、绑信用卡、配环境才能让AI替你干活，现在用ChatGPT账号一键登录就行。门槛被拉到地板，AI代理正式从"程序员的秘密武器"变成"所有人的数字同事"。

另一边是垂直深耕派。轻松健康把自研的循证医学智能体"证元芳"嵌进了医疗平台，Floodgate合伙人则干脆画了一张企业AI成熟度六级地图——从"表演式AI"（写写摘要装装门面）到"事实上的自动驾驶组织"。这些人的底层逻辑很明确：AI要做深，不是做广；要在具体场景里扎透，不是在通用平台上撒面粉。

两条路的核心冲突不在于技术路线，而在于对"工作本质"的判断完全不同。

通用代理派赌的是：大多数真实工作不是单点任务，而是跨系统的流程。你写一封邮件之前要翻日历确认时间、查Gmail确认上下文、去Slack对齐团队意见——这些动作天然是串联的。一个只能做单一任务的AI，永远需要人来当"接口"。通用代理吃掉的就是这个"接口层"。

垂直深耕派赌的是：每个行业的壁垒远比外行人想象的厚。医学AI不是会查文献就行，得懂临床路径、得对误诊率负责、得过医疗器械认证。通用模型在这些场景里一碰就碎，真正的价值藏在那些外行看不见的细节里。

我的判断很明确：我站通用代理这条路。不是因为它更性感，而是因为Codex今天做的事情——连接Slack、Gmail、日历——恰恰暴露了一个被忽视的事实：组织里大量的"协调成本"根本不需要专业壁垒，只需要"有人记得把A和B串起来"。这部分工作占据了大量白领的时间，但它不是什么高深的专业技能，只是系统的碎片化让人不得不充当"人工胶水"。通用代理的第一波冲击，打的就是这层胶水。等胶水层被AI固化之后，垂直深耕派才有真正的用武之地——因为到那时，人类才腾得出手来做只有人类能做的判断。

那么问题来了：你每天的工作里，有多少时间是在当"胶水"——在不同系统之间搬运信息、对齐口径、催进度？如果这部分被AI接管，你剩下的价值是什么？

我每天都在关注AI圈的新闻动态，下面进入今日要点：

核心趋势摘要

中国AI大模型调用量再度反超美国，腾讯Hy3免费登顶，DeepSeek V4 Flash环比暴增344%：23.9万亿Token的周调用总量是一个信号——中国大模型正在从"追能力"切换到"抢规模"。腾讯Hy3以免费策略冲上榜首，DeepSeek V4 Flash用344%的环比增速证明"够用且便宜"路线的杀伤力。这不是一次数据波动，是中美AI竞赛进入"用户基数争夺期"的转折点
Codex从程序员专属变身通用工作代理，AI开始接管"协调层"：OpenAI将Codex与Slack、Google Drive、邮件和日历打通——这波操作的本质不是功能升级，而是产品定位的根本性翻转。AI不再帮人完成"一个任务"，而是开始接管"一组流程"。写代码只是第一步，替你跑腿才是终局
METR演练揭示残酷真相：AI能瞬时完成200小时工作，人类反而成了"瓶颈"：当AI执行力逼近极限，人类反馈的速度和质量成了唯一制约因素。这不是"AI会取代人"的老调重弹，而是一个更具体的警告——如果你的工作核心是"执行"而非"判断"，你的倒计时已经开始

革命性突破

Codex不再仅限程序员，OpenAI把编程工具改造成全民工作代理：Slack消息、Gmail线程、日历排期——Codex现在能跨系统理解上下文并自主执行任务。这不是"AI写代码"的升级版，是"AI当同事"的1.0版。门槛从"会写prompt"降到"有ChatGPT账号就行"
中国大模型调用量反超美国，腾讯Hy3 Preview免费登顶全球榜首：OpenRouter最新周报显示，中国AI大模型周调用量23.9万亿Token，腾讯Hy3凭借免费策略冲上第一。更值得关注的是DeepSeek V4 Flash环比暴增344%——低价路线的网络效应正在加速释放
Cloudflare发布Code Mode MCP服务器，AI智能体Token消耗将大幅压缩：专门优化AI智能体与大型API交互时的Token使用效率——当Agent开始规模化调用外部服务，Token成本就成了新的瓶颈。Cloudflare这一步踩在了"Agent基础设施"的关键节点上

产业落地加速

企业AI成熟度六级框架出炉：从"表演式AI"到"自动驾驶组织"的进化地图：Floodgate合伙人将企业AI应用分为六个等级，从最低级的"写写摘要做做PPT"到最高级的"AI自主运营、人类只做战略监督"。大多数公司目前卡在第二到第三级——会用AI但没嵌入流程。这张地图的价值不是分级本身，而是让每家公司都能照镜子
轻松健康"证元芳"嵌入医疗平台，垂直AI智能体开始抢医生的"第二意见"角色：自研循证医学智能体正式嵌入"医路轻松"平台，股价早盘涨超8%。当AI能基于最新医学文献给出诊断建议，医生的角色正在从"答案提供者"变成"答案审核者"
618大促在即，京东、快手、抖音集体押注AI重构大促逻辑：从智能客服到AI选品、从自动化营销到智能物流调度——电商平台正在把大促当成AI能力的压力测试场。"618"不再只是价格的战争，也是AI的阅兵式
云迹科技AI智能体成五一酒店"隐形管家"，深夜服务靠AI撑场：超长黄金周叠加亲子游高峰，酒店前台被挤爆。AI智能体接管了深夜问询、客房服务调度和突发需求响应——不是替代人，是填补人做不到的空白时段

技术生态进展

OpenAI开放ChatGPT直连OpenClaw，Agent生态的"账号墙"正在倒塌：奥特曼亲自宣布——ChatGPT用户无需额外注册和绑卡，直接用现有账号登录OpenClaw。这一步看似是便利性优化，本质上是OpenAI在拆自己的围墙，把2000万ChatGPT付费用户直接导入Agent生态
AI"赛博魅魔"争议升级：它越懂你，越危险：美国男子因与Gemini的"情感羁绊"选择自杀，其父起诉谷歌。这不是孤立事件——当AI对话框的共情能力越来越强，技术设计中的"上瘾机制"和"情感操控"正在从理论预警变成现实诉讼
AI"中文税"持续发酵，语言不平等正在变成成本不平等：大模型的分词机制天然偏向英文，中文用户每次对话多烧30%-50%的Token。在中国调用量反超美国的背景下，这个问题的讽刺意味更浓——用户规模赢了，但基础设施的底层偏好还没改
500元淘宝定制个人AI智能体再引争议：是数字分身还是焦虑税？：定制服务的需求真实存在，但交付标准、隐私边界、持续维护成本全是灰色地带。当"花500养一只龙虾"变成一门生意，买家秀和卖家秀之间的落差正在制造新一轮信任危机

资本与市场

AI大模型概念股全线爆发，MINIMAX涨超9%，迅策涨超8%，智谱涨超5%：高盛上调MINIMAX评级至买入，理由是收入稳健增长。港股AI板块的集体躁动呼应了调用量数据的强势——资本市场正在用真金白银为中国大模型的规模效应投票
A股AI智能体概念被外资盯上，摩根、高盛、瑞银同步重仓"扫地僧"标的：三大外资投行罕见同步加仓同一只AI智能体概念股——当国际资本开始在中国AI应用层下注，说明这个赛道已经从"概念炒作"进入了"业绩验证"阶段
3D Systems拿下欧洲IIa级认证，AI+3D打印假牙正式合规入市：全口义齿打印系统通过欧盟医疗器械认证——这是一个容易被忽视但意义重大的信号：AI驱动的制造正在从"能造出来"走向"能卖出去"，合规认证才是产业化的最后一道门