郑工长·AI洞察｜2026.05.20·35小时！智能体从助手变员工

郑工长观点

朋友们好，我是郑工长。

35小时。

这是通义千问Qwen3.7-Max在今天发布会上公布的一项测试数据——在一项长周期自主执行任务中，它连续工作了整整35个小时，不需要人类插手。

这个数字放在打工人的语境里是什么概念？中国的标准工作周是40小时。一个AI模型，已经能不吃不喝、不休不眠地干完近一周的活。中间不摸鱼、不抱怨、不需要团建。

而就在同一天，大洋彼岸的谷歌I/O大会上，桑达尔·皮查伊把「Agent」这个词在台上重复了几十遍。Gemini 3.5 Flash、Gemini Omni、Android Halo——全线产品围绕智能体重构。谷歌不再问「AI能帮你回答什么」，而是问「AI能替你做掉什么」。再过几个小时，硅谷传来消息：安德烈·卡帕西——特斯拉前AI高级总监、OpenAI创始成员——正式入职Anthropic。

三件事撞在同一天，不是巧合。智能体从「能干活」到「能干很久的活」再到「抢最能干的人来干」，这条链条在今天被焊死了。

反差点在哪？在大众认知里，AI还在「回答问题」的阶段。但今天这三个信号同时在说一件事：AI已经进入了「替你上班」的阶段。35小时不是炫技数字，是智能体从「助手」变成「员工」的临界点。一旦AI能连续自主工作一个工作周，企业对它的定位就不再是「提效工具」，而是「劳动力单元」——你要评估的不是它的API价格，是它替代的那个人的年薪。

为什么是今天？因为三个必要条件同时成熟了。第一，模型能力——Qwen3.7-Max证明了长周期推理不再崩盘，Agent不会跑着跑着就「忘了自己在干什么」。第二，平台生态——谷歌把Agent塞进了搜索、邮箱、安卓、地图，不是做Demo，是推向十亿用户。第三，人才密度——卡帕西选在Agent爆发前夜加入Anthropic，硅谷最聪明的一批人正在从「造大模型」流向「做Agent」。三个齿轮同时咬合，智能体的临界点到了。

我的判断很明确：智能体竞赛的上半场是「谁能做出Agent」，这个阶段基本结束。下半场是「谁的Agent能跑得更久、管得更多、渗透得更深」，今天正式开哨。Qwen3.7-Max押的是「能力深度」——一个Agent能干完一个团队的事。谷歌押的是「场景广度」——每个用户接触的每个产品里都住着一个Agent。Anthropic押的是「人才密度」——把全球最懂AI的人聚在一起，赌他们能做出别人做不出的东西。

三条路没有对错，但有一条共同的底线：Agent正在从技术问题变成劳动力问题。当AI能连续干35小时的活，人力资源部迟早要和IT部合署办公。

问题来了：35小时只是今天的数字。如果明年是350小时呢？你的岗位，经得起一个不吃不睡不抱怨的AI连续干多久？

郑工长每天都在关注AI圈的新闻动态，下面进入今日要点：

核心趋势摘要

谷歌I/O 2026全面Agent化：搜索、邮箱、安卓、地图全线「塞入」智能体，AI战场正式从「聊天」切换到「办事」：Gemini 3.5 Flash主打极速响应，Gemini Omni实现全模态实时理解，Android Halo让用户在屏幕上直接看到Agent在干什么。皮查伊的潜台词很清楚——上一代AI比谁更会聊，这一代AI比谁更能干活
阿里Qwen3.7-Max定义「全能Agent基座」，35小时长周期自主执行立下新标杆：编程、办公自动化、多Agent协作、MCP协议集成——Qwen3.7-Max把所有Agent核心能力打包进一个模型。这不是升级，是直接在模型层面对Agent做了原生设计
卡帕西入职Anthropic，硅谷最强大脑正在从「造模型」流向「做Agent」：OpenAI创始成员、特斯拉前AI总监，每一个头衔都自带光环。他选择在Agent爆发前夜加入Anthropic，比任何融资新闻都更能说明风向

技术突破与基础设施

Gemini 3.5 Flash vs Gemini Omni：谷歌双线出击，一个拼速度，一个拼「全懂」：Flash主打低延迟实时交互，Omni则能同时理解视频、音频、文本并实时推理。谷歌的策略不是做一个「最强模型」，而是做两个「最适合场景的模型」——快速任务和深度任务各配一把刀
Snowflake Intelligence亮出底牌：个人工作Agent从「回答问题」进化到「执行任务」：业务用户每天早上的标准动作——打开多个工具、等报告、追着分析师要数据——现在可以被一个Agent接管。Snowflake的切入角度很刁钻：不做通用Agent，专攻企业数据工作流里的「最后一公里」
大模型也有「中文税」：中文比英文更费Token，你的每一次提问都在交语言溢价：Anthropic Claude Opus 4.7发布后引发争议——中文用户发现同样的对话消耗的Token远超英文。这不是技术bug，是大模型底层分词机制对中文不友好。中文使用者每一次调用API都在交一笔隐形的「语言税」
AI编码智能体基准测试揭露软肋：能修独立漏洞，但读不懂系统全局：CNCF博客发布的研究证实，AI编码Agent可以精准定位并修复孤立漏洞，但面对跨模块、跨依赖的系统级问题，表现断崖式下跌。改进代码检索只是治标，Agent缺的是「系统思维」
JiuwenSwarm告别单体架构，Agent协作从「排队」升级到「蜂群」：过去的多Agent系统本质是流水线——一个干完下一个接。JiuwenSwarm的Swarm架构让Agent像蜂群一样同时工作、动态分工。当Agent从串行变成并行，任务吞吐量的天花板被大幅抬高

产业落地加速

贵阳银行砸3.36亿布局AI大模型，城商行的AI军备竞赛静悄悄开打：2025年信息科技直接投入3.36亿元，贵阳银行成为城商行中AI投入最激进的一家。当大行还在搞PoC，城商行已经开始真金白银下注——金融AI的下半场，地方军可能比中央军跑得更快
大华股份把AI大模型塞进高速摄像头，无感通行从「识别车牌」进化到「理解场景」：驰光相机系列用AI大模型赋能高速收费站，不再只是拍车牌，而是能理解复杂场景——逆光、雨雾、遮挡、假牌。交通运输部「手机+」无感通行政策持续落地，AI正在吃掉高速公路的感知层
上海首例AI大模型著作权侵权案二审落槌：用动漫角色训练模型并生成相似图，赔5万：用户李某截取美杜莎等动漫角色训练AI模型并生成相似图片，法院认定构成著作权侵权。平台因无主观故意且履行审核义务不担责。判决划了一条线——「训练」本身不算侵权，但「产出实质性相似内容」算。这对所有做AI绘画的公司都是风向标
工商银行原CTO吕仲涛定调：智能体将成为未来银行的核心基础设施，不是辅助工具：在清华五道口全球金融论坛上，吕仲涛提出「人类把控核心决策、智能体精准执行」的人机互补模式。当国有大行前技术掌门人把Agent定位为「基础设施」，银行业的AI采购单已经在改写了
Soul冲刺上市途中打出「场景化AI」牌，社交平台的AI竞争从「有没有」变成「好不好用」：当多数社交平台还在用AI做同质化的聊天机器人，Soul试图把AI嵌入真实的社交场景。社交AI的下一个分水岭：不是AI能不能陪你聊，是AI能不能帮你交到朋友

资本与市场

卡帕西正式入职Anthropic，一场没有硝烟的人才暗战：特斯拉前高级总监、OpenAI创始成员——卡帕西的履历本身就是AI行业半部发展史。Anthropic拿下这位标志性人物，二级市场估值应声而动。硅谷AI人才争夺战已经打到「抢创始成员」的级别
MemoraX AI拿下数千万种子+轮，专攻大模型「记性」这个被低估的赛道：聚焦大模型个性化记忆——让AI记住你是谁、你聊过什么、你的偏好是什么。当所有人在卷模型参数时，MemoraX赌的是「记忆层」将成为Agent时代的基础设施。Agent越自主，对记忆能力的要求越高
花旗高呼闪迪还能涨50%，AI智能体浪潮正在「溢出」到存储芯片：花旗大幅上调闪迪目标价，核心逻辑——Agent的自主执行会产生海量中间数据，NAND存储需求被结构性拉高。当Agent的算力需求养肥了英伟达，Agent的存储需求正在养肥闪迪
亚信科技午后涨超6%，AI大模型交付赛道开始获得资本市场正反馈：公司自称在AI大模型交付领域已处于行业领先地位，一季度收入近10亿。当「做模型」的故事讲完了，「交付模型」的故事刚刚开始——能帮企业把大模型真正用起来的公司，正在成为新的资本宠儿
AMD AI开发者大会首次落地中国，上海成为全球GPU「第二战场」：AMD将AI DevDay搬到上海，零一万物、ComfyUI等中国团队登台。当英伟达在中国市场受限，AMD正在加速填补生态空白——GPU的竞争不只是芯片参数，更是开发者生态的抢夺

相关新闻源

ChatGPT 在工作中的使用和采纳模式
这是一份以数据为支撑的行业报告，剖析各行业从业者使用ChatGPT 的现状，涵盖普及趋势、核心工作场景、部门使用特征以及职场AI 的未来发展。
来源：OpenAI
Qwen3.7-Max 发布 - OSCHINA - 开源 × AI · 开发者生态社区
通义实验室宣布推出迄今最全面、最强大的智能体模型 Qwen3.7-Max，即将通过API 提供服务。公告称，Qwen3.7-Max 致力于成为全能的智能体基座——无论是编写和调试代码、...
来源：OSCHINA
千问发布Qwen3.7-Max 致力成为全能的智能体基座
5月20日，千问正式发布Qwen3.7-Max ——面向智能体时代的新一代旗舰模型，即将通过API提供服务。Qwen3.7-Max致力于成为全能的智能体基座——无论是编写和调试代码、自动化...
来源：新浪财经
阿里千问发布新一代旗舰模型Qwen3.7-Max，强化长周期自主执行能力
据阿里研究院官方消息，千问正式发布面向智能体时代的新一代旗舰模型Qwen3.7-Max，该模型将通过阿里云百炼API向用户提供服务。
来源：品玩
千问正式发布 Qwen3.7-Max
Qwen3.7-Max 的核心优势在于智能体能力的广度与深度：编程方面，从前端原型开发到复杂的多文件工程均能驾驭；办公与生产力方面，通过MCP 集成和多智能体协作实现工作流...
来源：搜狐网
Snowflake Intelligence：从回答问题到执行任务的个人工作 Agent ｜技术趋势
每天早上，业务用户都以同样的方式开始一天：打开多个工具，等待更新后的报告，并联系分析师索要一个他们昨天就需要的数字，以便采取有意义的行动。工具和数据都已存在。
来源：Infoq.cn
重新定义Skill开发：保姆级教程&一站式开发助手发布
快速上手Skill开发，让AI Agent变身你的专属助手，实现工作流程自动化与效率倍增。核心内容： 1. Skill的本质与价值：替代重复任务，释放人的判断与体验价值
来源：53AI
Google 憋大招？Gemini 3.5 Flash 与 Gemini Omni 发布
Google I/O 2026不再是一场炫技秀，而是一份清晰的战略宣言：AI的战场，已经从比拼“谁更会聊天”，转移到了角逐“谁能更懂世界，并替我们改变世界”。
来源：51CTO
戴尔扩展面向人工智能时代数据中心的 PowerStore、PowerEdge、PowerProtect 和自动化产品组合
戴尔科技推出了涵盖存储、服务器、网络弹性和私有云自动化的广泛基础设施更新，其产品组合围绕着一个常见的企业问题展开：现代人工智能和高性能工作负载的扩展速度超过了...
来源：StorageReview.com
阿里千问最强智能体模型Qwen3.7-Max发布
编程方面，从前端原型开发到复杂的多文件工程均能驾驭；办公与生产力方面，通过MCP 集成和多智能体协作实现工作流自动化；长周期自主执行方面，在一项长达35 小时、...
来源：搜狐网
AI 大模型的「中文税」：中文比英文更费Token，为什么？|Anthropic|Session|Claude|DeepSeek|OpenAI_手机新浪网
（来源：极客公园）模型不是中性的，它内置了语言偏好。作者｜汤一涛编辑｜靖宇Opus 4.7 刚发布那几天，X 上怨声载道。有人说一次对话就把她的session 额度用光了...
来源：新浪财经
贵阳银行加码AI大模型布局，2025年信息科技直接投入3.36亿元
贵阳银行加码AI大模型布局，2025年信息科技直接投入3.36亿元,https://m.jrj.com.cn/madapter/bank/2026/05/20145257154809.shtml.
来源：金融界
用AI“复刻”美杜莎动漫角色，算侵权吗？上海首例人工智能大模型著作权侵权案二审宣判！-版权|审判动态
上海知识产权法院二审认定，截取动漫角色训练AI模型并生成相似图片构成著作权侵权。用户李某赔偿5万元，平台因无主观故意且履行审核义务不担责。判决厘清模型训练与复制...
来源：中国知识产权律师网
垂直小模型时代,快手用AI+服务重构生意逻辑
【流媒体网】摘要：从“罐头方案”到“生意伙伴”：垂直小模型如何撬动商业增长？最近半年和企业家交流，“怎么用AI提效”是一个绕不过的话题。但我有一个爆论：当下商业最大的...
来源：流媒体网
大华股份发布驰光相机系列以AI大模型赋能高速无感通行新升级近期，随着交通运输部"
大华股份发布驰光相机系列以AI 大模型赋能高速无感通行新升级. 近期，随着交通运输部"手机+" 无感通行政策持续落地，高速公路不停车收费、移动支付等应用全面普及，行业对...
来源：东方财富
场景化AI持续突破，Soul上市进程彰显平台长期技术深耕实力
近期，人工智能大模型行业进入深度落地期，众多社交平台纷纷布局AI赛道，但多数平台存在技术落地脱离场景、同质化炫技、实用性不足等问题。在此行业背景下，Soul秉持“深耕...
来源：中华网
AI大佬卡帕西正式加入Anthropic，硅谷AI人才争夺战持续港美股资讯
①特斯拉前高级总监、OpenAI创始成员安德烈·卡帕西，已正式入职Anthropic； ②此次聘用对Anthropic公司而言是硅谷AI人才争夺战中的一大胜利； ③目前，Anthropic二级市场估值...
来源：www.hstong.com
海外AI圈“大V”36小时中国行：在北京，有一种更浓的“生态感”
一天多时间，不足以真正读懂一个庞大的产业，但足够让一些固有的认知开始松动。 5月第一个小长假，一支由国外AI学者、研究员、独立撰稿人等组成的调研团队在36小时内密集...
来源：新浪新闻_手机新浪网
「MemoraX AI」完成数千万人民币种子+轮融资，聚焦大模型个性化记忆赛道
本轮融资将主要用于加速面向大模型记忆系统Agentic RL 核心技术的深度迭代与规模化工程落地，推动内生记忆模块从技术验证迈向产品化与商业化落地，并持续拓展在B 端各类...
来源：投资界
亚信科技午后涨超6% 公司在AI大模型交付领域已处于行业领先地位
亚信科技（01675）午后股价上涨6.18%，报6.01港元，成交额4098.53万港元。亚信科技此前发布公告，一季度集团收入约9.94亿元人民币。
来源：新浪财经
基准测试表明：AI 智能体可修复独立漏洞，却难以理解系统范围影响
Brandon Foley 在CNCF 博客上发布了一项基准测试研究，证实AI 编码智能体能够发现并修复孤立的漏洞，但它们通常难以理解系统范围内的影响。这对“改进代码检索是提升...
来源：Infoq.cn
全面押注智能体！谷歌Gemini 3.5登场，首款个人智能体亮相
谷歌展现出全面押注AI Agent（智能体）的野心。当地时间5月19日，一年一度的2026年谷歌I/O开发者大会正式开始。在这场年度大会上，谷歌宣布了一系列围绕Agentic AI（代理式...
来源：ThePaper.cn
张江首发“数字伯乐”！“青骐智能体”正式上线，以AI实现产业人才精准匹配
（来源：上观新闻）在产业人才服务领域，企业和人才面对的是同一个问题：信息很多，但有效匹配并不容易。5月18日，在上海张江人工智能创新小镇的ai应用商店内...
来源：新浪财经
谷歌密集“上新” 智能体加速规模化应用机构与融资客紧盯这6股(名单)
谷歌正试图把AI智能体全面“塞进”所有核心入口。Gemini迎模型、智能体重大更新北京时间5月20日凌晨1点，谷歌I/O2026开发者大会正式启幕，Gemini3.5Flash、GeminiOmni...
来源：东方财富
告别单体架构看JiuwenSwarm如何用Agent Swarm重构多智能体协同内核
过去两年，AI Agent（智能体）领域经历了从Prompt Engineering（提示词工程）到Context Engineering（上下文工程），再到Harness Engineering（驾驭工程）的快速迭代。
来源：驱动之家
吕仲涛：构建“人类把控核心决策、智能体精准执行”的人机互补模式
AI正驱动金融业迎来企业与效能的双重深度变革.
来源：中国电子银行网
谷歌发布安卓Halo，实时显示AI智能体状态|Sundar Pichai|google i/o|Android|Google|开发者大会_手机新浪网
谷歌发布安卓Halo，实时显示AI智能体状态. 市场资讯 05.20 01:52. （来源：IT之家）. IT之家5 月20 日消息，在今日的2026 谷歌 I/O 开发者大会上，谷歌CEO 桑达尔· 皮查...
来源：新浪财经
前方高能! AI智能体浪潮拉爆NAND存储需求花旗高呼闪迪(SNDK.US)还能狂飙50%
前方高能! AI智能体浪潮拉爆NAND存储需求花旗高呼闪迪(SNDK.US)还能狂飙50%. 市场资讯 05.19 22:07. （来源：智通财经）. 智通财经APP获悉，随着华尔街金融巨头花旗大举...
来源：新浪财经
AMD AI开发者大会首次在中国举行，共谈AI智能体新趋势|上海市|零一万物|Comfy ui|模型|处理器_手机新浪网
AMD AI开发者大会首次在中国举行，共谈AI智能体新趋势. 市场资讯 05.19 22:50. （来源：IT之家）. IT之家5 月19 日消息，今天，AMD AI 开发者大会（AMD AI DevDay 2026）在上海...
来源：新浪财经
工商银行原首席技术官吕仲涛：智能体将成为未来银行的核心基础设施
5月20日金融一线消息，2026清华五道口全球金融论坛5月17日-20日在四川成都举办，本次论坛主题为“变局下的全球金融治理：新挑战、新机遇、新发展”。
来源：新浪财经