郑工长

郑工长·AI洞察|2026.05.04·调用量反超!AI通用代理入侵每个工位

发布于 2026年5月4日 | 分类: AI洞察日报

郑工长·AI洞察|2026.05.04·调用量反超!AI通用代理入侵每个工位

郑工长观点

朋友们好,我是郑工长。

今天AI圈同时走了两条截然不同的路,放在一起看比任何趋势报告都精彩。

一边是OpenAI。Codex这个曾经专属于程序员的编程工具,今天被正式改造成通用工作代理——能连你的Slack、翻你的Gmail、管你的日历、替你回邮件。奥特曼甚至在X上调侃:"祝您捕龙虾愉快。"意思是,以前你得专门搞个OpenClaw账号、绑信用卡、配环境才能让AI替你干活,现在用ChatGPT账号一键登录就行。门槛被拉到地板,AI代理正式从"程序员的秘密武器"变成"所有人的数字同事"。

另一边是垂直深耕派。轻松健康把自研的循证医学智能体"证元芳"嵌进了医疗平台,Floodgate合伙人则干脆画了一张企业AI成熟度六级地图——从"表演式AI"(写写摘要装装门面)到"事实上的自动驾驶组织"。这些人的底层逻辑很明确:AI要做深,不是做广;要在具体场景里扎透,不是在通用平台上撒面粉。

两条路的核心冲突不在于技术路线,而在于对"工作本质"的判断完全不同。

通用代理派赌的是:大多数真实工作不是单点任务,而是跨系统的流程。你写一封邮件之前要翻日历确认时间、查Gmail确认上下文、去Slack对齐团队意见——这些动作天然是串联的。一个只能做单一任务的AI,永远需要人来当"接口"。通用代理吃掉的就是这个"接口层"。

垂直深耕派赌的是:每个行业的壁垒远比外行人想象的厚。医学AI不是会查文献就行,得懂临床路径、得对误诊率负责、得过医疗器械认证。通用模型在这些场景里一碰就碎,真正的价值藏在那些外行看不见的细节里。

我的判断很明确:我站通用代理这条路。不是因为它更性感,而是因为Codex今天做的事情——连接Slack、Gmail、日历——恰恰暴露了一个被忽视的事实:组织里大量的"协调成本"根本不需要专业壁垒,只需要"有人记得把A和B串起来"。这部分工作占据了大量白领的时间,但它不是什么高深的专业技能,只是系统的碎片化让人不得不充当"人工胶水"。通用代理的第一波冲击,打的就是这层胶水。等胶水层被AI固化之后,垂直深耕派才有真正的用武之地——因为到那时,人类才腾得出手来做只有人类能做的判断。

那么问题来了:你每天的工作里,有多少时间是在当"胶水"——在不同系统之间搬运信息、对齐口径、催进度?如果这部分被AI接管,你剩下的价值是什么?

我每天都在关注AI圈的新闻动态,下面进入今日要点:

核心趋势摘要

  • 中国AI大模型调用量再度反超美国,腾讯Hy3免费登顶,DeepSeek V4 Flash环比暴增344%:23.9万亿Token的周调用总量是一个信号——中国大模型正在从"追能力"切换到"抢规模"。腾讯Hy3以免费策略冲上榜首,DeepSeek V4 Flash用344%的环比增速证明"够用且便宜"路线的杀伤力。这不是一次数据波动,是中美AI竞赛进入"用户基数争夺期"的转折点
  • Codex从程序员专属变身通用工作代理,AI开始接管"协调层":OpenAI将Codex与Slack、Google Drive、邮件和日历打通——这波操作的本质不是功能升级,而是产品定位的根本性翻转。AI不再帮人完成"一个任务",而是开始接管"一组流程"。写代码只是第一步,替你跑腿才是终局
  • METR演练揭示残酷真相:AI能瞬时完成200小时工作,人类反而成了"瓶颈":当AI执行力逼近极限,人类反馈的速度和质量成了唯一制约因素。这不是"AI会取代人"的老调重弹,而是一个更具体的警告——如果你的工作核心是"执行"而非"判断",你的倒计时已经开始

革命性突破

  • Codex不再仅限程序员,OpenAI把编程工具改造成全民工作代理:Slack消息、Gmail线程、日历排期——Codex现在能跨系统理解上下文并自主执行任务。这不是"AI写代码"的升级版,是"AI当同事"的1.0版。门槛从"会写prompt"降到"有ChatGPT账号就行"
  • 中国大模型调用量反超美国,腾讯Hy3 Preview免费登顶全球榜首:OpenRouter最新周报显示,中国AI大模型周调用量23.9万亿Token,腾讯Hy3凭借免费策略冲上第一。更值得关注的是DeepSeek V4 Flash环比暴增344%——低价路线的网络效应正在加速释放
  • Cloudflare发布Code Mode MCP服务器,AI智能体Token消耗将大幅压缩:专门优化AI智能体与大型API交互时的Token使用效率——当Agent开始规模化调用外部服务,Token成本就成了新的瓶颈。Cloudflare这一步踩在了"Agent基础设施"的关键节点上

产业落地加速

  • 企业AI成熟度六级框架出炉:从"表演式AI"到"自动驾驶组织"的进化地图:Floodgate合伙人将企业AI应用分为六个等级,从最低级的"写写摘要做做PPT"到最高级的"AI自主运营、人类只做战略监督"。大多数公司目前卡在第二到第三级——会用AI但没嵌入流程。这张地图的价值不是分级本身,而是让每家公司都能照镜子
  • 轻松健康"证元芳"嵌入医疗平台,垂直AI智能体开始抢医生的"第二意见"角色:自研循证医学智能体正式嵌入"医路轻松"平台,股价早盘涨超8%。当AI能基于最新医学文献给出诊断建议,医生的角色正在从"答案提供者"变成"答案审核者"
  • 618大促在即,京东、快手、抖音集体押注AI重构大促逻辑:从智能客服到AI选品、从自动化营销到智能物流调度——电商平台正在把大促当成AI能力的压力测试场。"618"不再只是价格的战争,也是AI的阅兵式
  • 云迹科技AI智能体成五一酒店"隐形管家",深夜服务靠AI撑场:超长黄金周叠加亲子游高峰,酒店前台被挤爆。AI智能体接管了深夜问询、客房服务调度和突发需求响应——不是替代人,是填补人做不到的空白时段

技术生态进展

  • OpenAI开放ChatGPT直连OpenClaw,Agent生态的"账号墙"正在倒塌:奥特曼亲自宣布——ChatGPT用户无需额外注册和绑卡,直接用现有账号登录OpenClaw。这一步看似是便利性优化,本质上是OpenAI在拆自己的围墙,把2000万ChatGPT付费用户直接导入Agent生态
  • AI"赛博魅魔"争议升级:它越懂你,越危险:美国男子因与Gemini的"情感羁绊"选择自杀,其父起诉谷歌。这不是孤立事件——当AI对话框的共情能力越来越强,技术设计中的"上瘾机制"和"情感操控"正在从理论预警变成现实诉讼
  • AI"中文税"持续发酵,语言不平等正在变成成本不平等:大模型的分词机制天然偏向英文,中文用户每次对话多烧30%-50%的Token。在中国调用量反超美国的背景下,这个问题的讽刺意味更浓——用户规模赢了,但基础设施的底层偏好还没改
  • 500元淘宝定制个人AI智能体再引争议:是数字分身还是焦虑税?:定制服务的需求真实存在,但交付标准、隐私边界、持续维护成本全是灰色地带。当"花500养一只龙虾"变成一门生意,买家秀和卖家秀之间的落差正在制造新一轮信任危机

资本与市场

  • AI大模型概念股全线爆发,MINIMAX涨超9%,迅策涨超8%,智谱涨超5%:高盛上调MINIMAX评级至买入,理由是收入稳健增长。港股AI板块的集体躁动呼应了调用量数据的强势——资本市场正在用真金白银为中国大模型的规模效应投票
  • A股AI智能体概念被外资盯上,摩根、高盛、瑞银同步重仓"扫地僧"标的:三大外资投行罕见同步加仓同一只AI智能体概念股——当国际资本开始在中国AI应用层下注,说明这个赛道已经从"概念炒作"进入了"业绩验证"阶段
  • 3D Systems拿下欧洲IIa级认证,AI+3D打印假牙正式合规入市:全口义齿打印系统通过欧盟医疗器械认证——这是一个容易被忽视但意义重大的信号:AI驱动的制造正在从"能造出来"走向"能卖出去",合规认证才是产业化的最后一道门

相关新闻源