郑工长

郑工长·AI洞察|2026.05.20·35小时!智能体从助手变员工

发布于 2026年5月20日 | 分类: AI洞察日报

郑工长·AI洞察|2026.05.20·35小时!智能体从助手变员工

郑工长观点

朋友们好,我是郑工长。

35小时。

这是通义千问Qwen3.7-Max在今天发布会上公布的一项测试数据——在一项长周期自主执行任务中,它连续工作了整整35个小时,不需要人类插手。

这个数字放在打工人的语境里是什么概念?中国的标准工作周是40小时。一个AI模型,已经能不吃不喝、不休不眠地干完近一周的活。中间不摸鱼、不抱怨、不需要团建。

而就在同一天,大洋彼岸的谷歌I/O大会上,桑达尔·皮查伊把「Agent」这个词在台上重复了几十遍。Gemini 3.5 Flash、Gemini Omni、Android Halo——全线产品围绕智能体重构。谷歌不再问「AI能帮你回答什么」,而是问「AI能替你做掉什么」。再过几个小时,硅谷传来消息:安德烈·卡帕西——特斯拉前AI高级总监、OpenAI创始成员——正式入职Anthropic。

三件事撞在同一天,不是巧合。智能体从「能干活」到「能干很久的活」再到「抢最能干的人来干」,这条链条在今天被焊死了。

反差点在哪?在大众认知里,AI还在「回答问题」的阶段。但今天这三个信号同时在说一件事:AI已经进入了「替你上班」的阶段。35小时不是炫技数字,是智能体从「助手」变成「员工」的临界点。一旦AI能连续自主工作一个工作周,企业对它的定位就不再是「提效工具」,而是「劳动力单元」——你要评估的不是它的API价格,是它替代的那个人的年薪。

为什么是今天?因为三个必要条件同时成熟了。第一,模型能力——Qwen3.7-Max证明了长周期推理不再崩盘,Agent不会跑着跑着就「忘了自己在干什么」。第二,平台生态——谷歌把Agent塞进了搜索、邮箱、安卓、地图,不是做Demo,是推向十亿用户。第三,人才密度——卡帕西选在Agent爆发前夜加入Anthropic,硅谷最聪明的一批人正在从「造大模型」流向「做Agent」。三个齿轮同时咬合,智能体的临界点到了。

我的判断很明确:智能体竞赛的上半场是「谁能做出Agent」,这个阶段基本结束。下半场是「谁的Agent能跑得更久、管得更多、渗透得更深」,今天正式开哨。Qwen3.7-Max押的是「能力深度」——一个Agent能干完一个团队的事。谷歌押的是「场景广度」——每个用户接触的每个产品里都住着一个Agent。Anthropic押的是「人才密度」——把全球最懂AI的人聚在一起,赌他们能做出别人做不出的东西。

三条路没有对错,但有一条共同的底线:Agent正在从技术问题变成劳动力问题。当AI能连续干35小时的活,人力资源部迟早要和IT部合署办公。

问题来了:35小时只是今天的数字。如果明年是350小时呢?你的岗位,经得起一个不吃不睡不抱怨的AI连续干多久?

郑工长每天都在关注AI圈的新闻动态,下面进入今日要点:

核心趋势摘要

  • 谷歌I/O 2026全面Agent化:搜索、邮箱、安卓、地图全线「塞入」智能体,AI战场正式从「聊天」切换到「办事」:Gemini 3.5 Flash主打极速响应,Gemini Omni实现全模态实时理解,Android Halo让用户在屏幕上直接看到Agent在干什么。皮查伊的潜台词很清楚——上一代AI比谁更会聊,这一代AI比谁更能干活
  • 阿里Qwen3.7-Max定义「全能Agent基座」,35小时长周期自主执行立下新标杆:编程、办公自动化、多Agent协作、MCP协议集成——Qwen3.7-Max把所有Agent核心能力打包进一个模型。这不是升级,是直接在模型层面对Agent做了原生设计
  • 卡帕西入职Anthropic,硅谷最强大脑正在从「造模型」流向「做Agent」:OpenAI创始成员、特斯拉前AI总监,每一个头衔都自带光环。他选择在Agent爆发前夜加入Anthropic,比任何融资新闻都更能说明风向

技术突破与基础设施

  • Gemini 3.5 Flash vs Gemini Omni:谷歌双线出击,一个拼速度,一个拼「全懂」:Flash主打低延迟实时交互,Omni则能同时理解视频、音频、文本并实时推理。谷歌的策略不是做一个「最强模型」,而是做两个「最适合场景的模型」——快速任务和深度任务各配一把刀
  • Snowflake Intelligence亮出底牌:个人工作Agent从「回答问题」进化到「执行任务」:业务用户每天早上的标准动作——打开多个工具、等报告、追着分析师要数据——现在可以被一个Agent接管。Snowflake的切入角度很刁钻:不做通用Agent,专攻企业数据工作流里的「最后一公里」
  • 大模型也有「中文税」:中文比英文更费Token,你的每一次提问都在交语言溢价:Anthropic Claude Opus 4.7发布后引发争议——中文用户发现同样的对话消耗的Token远超英文。这不是技术bug,是大模型底层分词机制对中文不友好。中文使用者每一次调用API都在交一笔隐形的「语言税」
  • AI编码智能体基准测试揭露软肋:能修独立漏洞,但读不懂系统全局:CNCF博客发布的研究证实,AI编码Agent可以精准定位并修复孤立漏洞,但面对跨模块、跨依赖的系统级问题,表现断崖式下跌。改进代码检索只是治标,Agent缺的是「系统思维」
  • JiuwenSwarm告别单体架构,Agent协作从「排队」升级到「蜂群」:过去的多Agent系统本质是流水线——一个干完下一个接。JiuwenSwarm的Swarm架构让Agent像蜂群一样同时工作、动态分工。当Agent从串行变成并行,任务吞吐量的天花板被大幅抬高

产业落地加速

  • 贵阳银行砸3.36亿布局AI大模型,城商行的AI军备竞赛静悄悄开打:2025年信息科技直接投入3.36亿元,贵阳银行成为城商行中AI投入最激进的一家。当大行还在搞PoC,城商行已经开始真金白银下注——金融AI的下半场,地方军可能比中央军跑得更快
  • 大华股份把AI大模型塞进高速摄像头,无感通行从「识别车牌」进化到「理解场景」:驰光相机系列用AI大模型赋能高速收费站,不再只是拍车牌,而是能理解复杂场景——逆光、雨雾、遮挡、假牌。交通运输部「手机+」无感通行政策持续落地,AI正在吃掉高速公路的感知层
  • 上海首例AI大模型著作权侵权案二审落槌:用动漫角色训练模型并生成相似图,赔5万:用户李某截取美杜莎等动漫角色训练AI模型并生成相似图片,法院认定构成著作权侵权。平台因无主观故意且履行审核义务不担责。判决划了一条线——「训练」本身不算侵权,但「产出实质性相似内容」算。这对所有做AI绘画的公司都是风向标
  • 工商银行原CTO吕仲涛定调:智能体将成为未来银行的核心基础设施,不是辅助工具:在清华五道口全球金融论坛上,吕仲涛提出「人类把控核心决策、智能体精准执行」的人机互补模式。当国有大行前技术掌门人把Agent定位为「基础设施」,银行业的AI采购单已经在改写了
  • Soul冲刺上市途中打出「场景化AI」牌,社交平台的AI竞争从「有没有」变成「好不好用」:当多数社交平台还在用AI做同质化的聊天机器人,Soul试图把AI嵌入真实的社交场景。社交AI的下一个分水岭:不是AI能不能陪你聊,是AI能不能帮你交到朋友

资本与市场

  • 卡帕西正式入职Anthropic,一场没有硝烟的人才暗战:特斯拉前高级总监、OpenAI创始成员——卡帕西的履历本身就是AI行业半部发展史。Anthropic拿下这位标志性人物,二级市场估值应声而动。硅谷AI人才争夺战已经打到「抢创始成员」的级别
  • MemoraX AI拿下数千万种子+轮,专攻大模型「记性」这个被低估的赛道:聚焦大模型个性化记忆——让AI记住你是谁、你聊过什么、你的偏好是什么。当所有人在卷模型参数时,MemoraX赌的是「记忆层」将成为Agent时代的基础设施。Agent越自主,对记忆能力的要求越高
  • 花旗高呼闪迪还能涨50%,AI智能体浪潮正在「溢出」到存储芯片:花旗大幅上调闪迪目标价,核心逻辑——Agent的自主执行会产生海量中间数据,NAND存储需求被结构性拉高。当Agent的算力需求养肥了英伟达,Agent的存储需求正在养肥闪迪
  • 亚信科技午后涨超6%,AI大模型交付赛道开始获得资本市场正反馈:公司自称在AI大模型交付领域已处于行业领先地位,一季度收入近10亿。当「做模型」的故事讲完了,「交付模型」的故事刚刚开始——能帮企业把大模型真正用起来的公司,正在成为新的资本宠儿
  • AMD AI开发者大会首次落地中国,上海成为全球GPU「第二战场」:AMD将AI DevDay搬到上海,零一万物、ComfyUI等中国团队登台。当英伟达在中国市场受限,AMD正在加速填补生态空白——GPU的竞争不只是芯片参数,更是开发者生态的抢夺

相关新闻源