
郑工长观点
朋友们好,我是郑工长。
今天AI圈出现了两条针锋相对的叙事。
第一条:Anthropic发布Claude Opus 4.8——性能飙升、速度翻2.5倍、价格直降三分之二。旗舰模型继续沿着「更强、更快、更便宜」的轨道推进。同一天,腾讯面向全球推出WorkBuddy、Miora和TokenHub三件套,AI工具出海按下加速键。
第二条:36氪发了一篇标题毫不客气的文章——「OpenAI和Anthropic带头念的经可能是歪的」。矛头直指多智能体系统(MAS),质疑Claude Code、Codex这类让AI拆解任务、分派子智能体协同执行的架构,是不是在用一个复杂方案解决一个不该复杂的问题。同日,TOM科技的评论补了一刀:「成熟的智能体应该懂得说不」。神州数码的实战总结同样扎心——企业落地AI智能体「难以规模化复制」。
两边说的都是多智能体,但一推一踩,方向完全相反。
核心冲突在哪?Anthropic和OpenAI押注的是「复杂任务必须拆解」——一个AI搞不定的事,就派一群AI协同搞。底层假设是:单模型能力有天花板,多智能体编排是突破天花板的唯一路径。Claude Opus 4.8的每一项能力升级,最终都要落到Claude Code的多智能体工作流里才有商业价值。
质疑者的逻辑是另一个方向:多智能体协同的协调成本、不确定性和调试复杂度,可能比单模型能力不足的问题更大。一个智能体出错还能排查,五个智能体交互出错——你连责任人都找不到。「难以规模化复制」这句话翻译过来就是:Demo很漂亮,一上线就崩。
我的判断:我站质疑者这一侧——不是反对多智能体的方向,而是反对「现在就是成熟时机」的判断。当单个智能体还没「成熟到懂得说不」之前,急于上多智能体编排,等于把一群还没拿驾照的人编成车队上高速。Claude Opus 4.8的降价和提速,恰恰说明Anthropic自己也清楚——先把单模型的能力底座打扎实,多智能体的故事才能讲下去。更何况,同一天另一条新闻暴露了更根本的问题:63.6%的AI供应商在合同之外偷偷把客户数据发给未授权模型。当数据治理的透明度都还没解决,谈多智能体协同,地基是悬空的。
问题来了:你觉得Anthropic和OpenAI押注多智能体是看到了未来,还是在用一个过度设计的方案掩盖单模型能力的瓶颈?如果多智能体架构真的是「歪经」,那正确方向在哪里?
郑工长每天都在关注AI圈的新闻动态,下面进入今日要点:
核心趋势摘要
- Claude Opus 4.8突袭+多智能体路线遭炮轰:Anthropic同一天左手亮剑右手挨刀:速度翻2.5倍、价格砍掉三分之二,用硬实力回应市场。但36氪发文质疑MAS路线是「歪经」,TOM科技喊话「成熟智能体应懂拒绝」。一边是单模型能力再上台阶,一边是多智能体架构被泼冷水——两条叙事在同一天撞车,折射出一个行业刚刚开始面对的结构性问题
- 63.6%的AI供应商在合同里埋雷:你的企业数据正在裸奔,而你签了字都不知道:最新研究报告揭开了AI供应链最隐秘的角落——超六成AI供应商隐瞒了第三方AI分包商。你采购的AI服务背后,数据可能在未经你同意的模型上流转。这不是漏洞,是行业默许的潜规则
- 中国AI注册用户突破31亿,但信任分层触目惊心:金融法律场景信任度不足两成:当AI覆盖了几乎所有网民,用户却在最关键场景按下了暂停键——涉及金融和法律决策时,愿意信任AI的受访者均不足20%。渗透率和信任度之间的裂谷,才是AI商业化的真正天花板
技术突破与基础设施
-
Claude Opus 4.8三连击:速度2.5倍、价格三分之一、能力全面升级:Anthropic深夜发布新一代旗舰模型,不是小修小补,是系统性换代。在智能体路线被质疑的同一天放出硬核成绩单——Anthropic的姿态是:别吵了,先看实力
-
阶跈星辰开源Step 3.7 Flash:国产开源阵营再添一把火:轻量级高性能模型加入开源阵营。国产开源模型的密度正在以月为单位提升——不是一家在跑,是一群在追
-
苹果iOS 27联手谷歌Gemini训练本地AI模型:手机上跑大模型,两家巨头决定一起干:不是云端调API,是在设备本地训练。当手机厂商开始把AI算力塞进每一台设备,云端大模型的调用逻辑将被部分改写
-
中国电信完成抗量子芯片AI多智能体可信通信试验:安全基建从「防小偷」升级到「防量子计算机」:联合清华大学和沐创集成电路,基于国产抗量子芯片跑通多智能体通信。当量子计算还在实验室,抗量子通信已经落地——安全领域的「先装锁再等人来撬」
-
AI做科研被划成L0到L4五级:52页综述给「AI科学家」发了成绩单:从L0辅助分析到L4自主发现,这篇综述把AI在科研中的角色分得明明白白。结论很直白:绝大多数应用还卡在L1-L2,离「AI独立做科研」还差着两级台阶
-
南洋理工一句话生成完整短剧:AI短剧从「手工作坊」走向「标准化流水线」:分层Agent框架把短剧制作拆成剧本、分镜、角色、剪辑多个工位。当一个Agent专门写冲突戏、另一个专门管运镜,短剧的生产效率将跨入新量级
产业落地加速
-
63.6%的AI供应商在合同之外偷偷转手你的数据:企业AI采购急需加一道「供应链审查」:报告揭示的不仅是隐私问题,是AI产业链的黑箱。当企业采购AI服务时,数据流向的透明度几乎为零——这个问题比模型能力更早需要被解决
-
腾讯AI三件套全球上线:WorkBuddy、Miora、TokenHub集体出海:腾讯云首次在香港举办Tencent Cloud Day,一口气推出效率工具、设计工具和MaaS平台。国内AI工具的出海不再是零星尝试,是系统性进攻
-
国内房地产首批垂直大模型发布:50万字年鉴AI几小时搞定,连地产都用上大模型了:不动产行业迎来自己的大模型。《中国房地产年鉴30年特刊》AI底稿几小时自动完成,专家评价「可以直接用」。当最传统的行业都开始部署垂直大模型,「谁还没用」比「谁在用」更值得关注
-
AI智能体连接医疗器械产业「断点」:生产端和渠道端终于能对话了:医疗器械行业在集采、监管、成本三重压力下,智能体正在打通生产和流通之间的信息断层。不是替代人,是让「不知道对方在干什么」的两端终于能协作
-
美图Roboneo多智能体编排实践亮相AICon:设计生产场景的工程化样本:多智能体被质疑「难以规模化复制」的同一天,美图拿出了设计生产场景下的真实编排案例。理论争论是一回事,工程落地是另一回事——美图在后者上先走了一步
-
AI大模型「位置感知」正在悄悄失灵:LLaMA等模型被发现在空间理解上退化:伊利诺伊大学、波恩大学、阿贡国家实验室和亚马逊AGI团队联合研究——模型对空间位置的理解能力在退化。不是性能下降,是能力结构在悄悄变化。当模型越来越擅长推理,某些基础感知却在流失
资本与市场
-
巨头卡位AI支付:智能体从「帮你做事」进化到「替你花钱」,安全屏障还没建好:当智能体开始自主决策支付——从选品到比价到下单——整个支付安全体系需要从「验证人」升级为「验证智能体」。这不是功能迭代,是安全架构的重构
-
AI让游戏营销进入自动化时代:广告投放、素材生成、热点监控全链AI化:从Meta CLI到Google MCP,从素材Skill到AI剪辑——游戏行业的营销正在被AI系统性地改造。不是某一个环节变快了,是整个链条在重构
-
全球电子实验室笔记本冲向13.8亿美元:科研数字化是AI落地的沉默赛道:预计2034年市场规模达13.8亿美元,CAGR 7.42%。实验室数字化听起来不性感,但这是AI进入科研核心流程的基础设施——没有数字化实验记录,AI scientist就是空中楼阁
相关新闻源
-
电子实验室笔记本市场规模、份额|增长预测 [2034]
全球电子实验室笔记本市场规模预计将从2026 年的7.8 亿美元增长到2034 年的13.8 亿美元,预测期内复合年增长率为7.42%
来源:Fortune Business Insights -
超六成AI供应商未告知客户,偷偷将甲方数据发给未授权模型
最新研究报告显示,63.6%的AI供应商未在客户协议(数据处理部分)中披露第三方AI分包处理方,这意味着采购他们服务的客户,企业数据可能在不知情的情况下暴露给从未知晓的...
来源:安全内参 -
AI在游戏营销中的应用现状:广告投放、创意、热点分析与剪辑的实战探索
本文基于作者实际测试,梳理了当前AI在游戏广告投放(Meta CLI、Google MCP)、广告创意(素材Skill)、热点自动化监控和AI剪辑等方面的应用现状。
来源:虎嗅 -
Motive推出物理AI运营平台重大升级
这些创新旨在提供新能力,将数据整合到单一视图中,并通过能够采取行动的AI自动化复杂工作流程,使英国团队能够专注于最重要的事务,释放安全性和生产力的新水平。
来源:搜狐网 -
维亚生物算法团队JCIM发文:Pep2MARS让复杂环肽分子动力学模拟不再“手工搭积木”
ByDrug医药新闻摘要⌋ 2026-05-28 17:00,维亚生物:近期,维亚生物算法团队在《Journal of Chemical Information and Modeling》 (JCIM)上发表了一篇题为《Pep2MARS:...
来源:ByDrug -
一句话生成完整短剧!南洋理工团队提出分层Agent框架,AI短剧生产走向标准化
近年来,Sora、Kling等视频基础模型显著提升了一键式短片生成能力,但当前短剧生产依赖LLM的one-shot生成与松散工作流,存在三大短板:叙事节奏弱、开场缺乏吸引力、冲突...
来源:智源社区 -
OpenAI和Anthropic带头念的经可能是歪的
过去一年,“多智能体系统(MAS, Multi-Agent System)”成为AI 世界最热门的方向之一。 大量框架和产品开始同时出现,其中最著名的显然就是Claude Code和Codex,这步确实也...
来源:36氪 -
超声市场规模、份额|增长预测 [2034]
全球超声市场规模预计将从2026 年的108.4 亿美元增长到2034 年的185 亿美元,预测期内复合年增长率为6.91%
来源:Fortune Business Insights -
这篇52页综述把AI做科研这件事,明明白白划成了L0到L4五个等级
这篇笔者主要带大家把研究背景和相关工作这两块捋一遍。后面的技术分解、评估体系、领域分析其实更精彩,但内容太多,留着以后再聊。
来源:51CTO -
Amazon Q B... - @亚马逊云科技的视频
Amazon Q Business助力复杂工作流自动化. 605次观看1年前发布. 亚马逊云科技. 69.6万人关注. 关注. 相关推荐. 查看更多视频. 热门评论. 查看更多评论.
来源:微博 -
【明日主题前瞻】AI大模型持续迭代,开源生态推动token调用量持续上行
【热点导读】. AI大模型持续迭代,开源生态推动token调用量持续上行. “十五五”时期预计投资超过5万亿元用于新型电网建设. 京东与头部机器人应用平台达成战略合作.
来源:财联社 -
【每日瞰AI】阶跈星辰开源Step 3.7 Flash 大模型;科大讯飞发布AI 眼镜 ;苹果 iOS 27 联手谷歌Gemini 训练本地AI 模型
知识酷Pro 学显示行业知识找小酷!第2358篇推文5月29日·瞰AI1.Anthropic 发布Claude Opus 4.8,性能飙升速度翻2.5 倍,价格直降三分之二2.阶跈星辰开源St.
来源:电子工程专辑 -
告别专业门槛!音乐AI大模型让你零基础也能创作专业级歌曲
5月28日,BEYOND Expo 2026展会进行时,从北京科创企业自由量级利用AI大模型技术,为音乐创作解锁新的可能性,让零基础的普通人也能享受创作歌曲的快乐。
来源:京报网 -
中国AI用户累计注册数超31亿,公众对治理规范诉求强烈
受访者对AI大模型的信任呈明显分层特征,在低风险、非关键决策场景中充分信赖AI输出,而在涉及金融、法律等领域则保持高度审慎,愿意信任AI的受访者占比均不足两成。
来源:安全内参 -
告别专业门槛!音乐AI大模型让你零基础也能创作专业级歌曲
+订阅. 点赞. 评论. 收藏. 分享. @北京日报. #其它# 告别专业门槛!音乐AI大模型让你零基础也能创作专业级歌曲. prompt-image. -- 我是有底线的--
来源:搜狐网 -
太初绩效大模型助力陕西财政绩效自评复核
近日,零点有数参股公司上海闻政管理咨询有限公司成功中标陕西省财政厅机关绩效自评抽查复核项目,这既是闻政咨询自研财政垂直AI大模型在全国财政一线监管场景的首次正式...
来源:同花顺财经 -
郭岳泉博士:AI大模型如何让我们“看见”政企协作网络?
深化跨学科研究、夯实学术强校底蕴,5月20日,广州新华学院学者讲坛特邀美国密歇根大学政治学博士、德国柏林社会科学中心博士后研究员郭岳泉,带来《AI大模型赋能社会治理...
来源:教育在线 -
伊利诺伊大学等机构发现:AI大模型的"位置感知"正在悄悄失灵|语言模型|AI助手|美国|注意力机制|Llama_手机新浪网
(来源:科技行者) 这项由美国伊利诺伊大学厄巴纳-香槟分校、德国波恩大学、美国阿贡国家实验室以及亚马逊AGI团队联合开展的研究,以预印本形式于2026年5月发表...
来源:新浪财经 -
国内房地产行业首批垂直大模型发布
5月27日,“走进那扇门:不动产的模数共振”AI+不动产生态大会现场,一部50万字的《中国房地产年鉴30年特刊》AI底稿,只花了几小时就自动完成了。编审专家看过后给出的评价...
来源:21财经 -
企业怎么让AI真正落地?私有化AI应用场景和平台选型
ZStack AIOS能力描述基于官网及5.5.16版本产品资料(2026年4月30日发布,zstack.io)。华为昇腾/ModelEngine、百度千帆能力描述基于各厂商官网公开文档。
来源:51CTO -
AI智能体让科技界变得混乱,成熟的智能体应该懂得说不
总之,聪明的智能体应该知道何时停下,告诉用户“我没有权限处理此事”,如果做不到,便是没有成熟,没有准备好。
来源:TOM科技 -
引领行业变革
亚马逊AWS推出新一代OpenSearch Serverless,专为AI智能体工作负载设计。新系统将计算与存储解耦,支持秒级弹性扩缩容,空闲时可缩减至零成本。
来源:信息化观察网 -
企业落地AI智能体“难以规模化复制”,如何从“智变”走向“质变”?|AI Agent|神州数码|上海市|价值|模型_手机新浪网
企业落地AI智能体“难以规模化复制”,如何从“智变”走向“质变”? 市场资讯 05.28 07:54. (来源:上观新闻). 神州数码“数云原力2026”系列活动之原力企业虾城市巡游第二季首站...
来源:新浪财经 -
巨头卡位AI支付,安全屏障如何构建?
智能体让支付决策从人来决策转向人与智能体共同决策。在不少业内人士的未来畅享中,支付还可能一定程度上变成智能体自主决策.
来源:36氪 -
用AI智能体连接医疗器械产业“断点”
图①国科恒泰天津基地外景图②天津基地内的智能仓公司供图. 医疗器械产业正站在数字化与智能化的交汇点。在集采深化、监管趋严、成本高企三重压力下,生产端不了解渠道...
来源:证券时报 -
《现代教育报》:北航举办首届智能体创新大赛
《现代教育报》2026年5月29日(记者赵艳国)报道:北航举办首届智能体创新大赛本报讯(记者赵艳国)5月23日,北京航空航天大学举行首届智能体创新大赛决赛及颁奖仪式。
来源:北航新闻网 -
即构亮相高博会,AI智能体助力高校人才培养
一位大学高数老师借助即构AI产品生成了演示二元函数空间曲面形态的三维动画,帮助学生直观理解抽象理论。坐标轴、曲面起伏、参数变化,全程由AI自主完成,仅用一句话就...
来源:中华网 -
腾讯面向全球市场推出全新AI工具及企业解决方案
效率工具WorkBuddy国际版、设计工具Miora国际版及MaaS平台TokenHub全球上线,助力企业提速应用AI. 腾讯云首次于香港举办年度Tencent Cloud Day活动,并宣布面向全球市场...
来源:Tencent 腾讯 -
中国首创基于国产抗量子芯片的AI多智能体可信通信试验
中新社北京5月28日电(记者刘亮)中国电信28日公布,中国电信研究院近日联合清华大学、无锡沐创集成电路设计有限公司,成功完成基于国产抗量子芯片的AI(人工智能)多智能体...
来源:中国新闻网 -
美图 Roboneo:设计生产场景下多智能体编排工程实践|AICon 上海
当前,以Agent 为核心的新一轮技术浪潮正在席卷产业。那么,世界模型的下一个突破在哪?Agent 从Demo 到工程化还差什么?研发体系不重构,还能撑多久?
来源:Infoq.cn




