郑工长

郑工长·AI洞察|2026.05.06·91%漏洞!十万AI特工裸奔上岗

发布于 2026年5月6日 | 分类: AI洞察日报

郑工长·AI洞察|2026.05.06·91%漏洞!十万AI特工裸奔上岗

郑工长观点

朋友们好,我是郑工长。

今天AI圈上演了一场极致的"冰与火之歌"。

火的一边:AI智能体正在以前所未有的速度涌入现实世界。Anthropic一口气推出10款金融AI特工,直接对标华尔街分析师——FactSet股价应声暴跌8.1%,Morningstar同步下挫。OpenClaw券商路演场场爆满,投研圈集体亢奋。美军更狠——五角大楼证实已在GenAI.mil平台部署超10万个AI智能体,试图打造"算法铁幕"。谷歌也不甘落后,内部代号"Remy"的AI特工正在内测,目标直指OpenClaw。

冰的一边:斯坦福、MIT等顶尖机构联合研究了847个真实部署的AI Agent,结论触目惊心——91%存在工具链攻击漏洞,94%可被记忆投毒。更可怕的是,已发生的Moltbook安全事件让77万个Agent同时暴露于劫持风险。

一边在疯狂部署,一边在裸奔。

这两条路径的核心冲突不在技术,而在底层假设。

"先跑再说"派的逻辑是:AI Agent的竞争窗口正在以月为单位关闭。谁先占领场景、绑定客户、跑通商业模式,谁就能定义行业标准。安全问题可以后补——就像当年的互联网,没有人因为TCP/IP有漏洞就不建网站。五角大楼的逻辑更直白:战场上,一个有漏洞的AI特工比一个不存在的AI特工强一万倍。

"先修后跑"派的逻辑刚好相反:AI Agent不是网站,它是能自主执行交易、访问系统、做出决策的"数字员工"。一个漏洞意味着攻击者可以直接操控你的财务系统、客户数据、甚至武器平台。互联网可以容忍"先上线再打补丁",因为最坏的结果是网页挂掉。AI Agent最坏的结果是钱没了、数据丢了、人被冒充了——这是质的区别。

我的站队很清楚:安全不是Agent的"高级功能",是它的"准生证"。

理由很简单:信任坍塌的速度比技术迭代快一百倍。一次Moltbook级别的事故就能让企业客户集体退回观望模式。而AI Agent的市场恰恰建立在"信任"这个最脆弱的基础之上——你敢把银行账户交给一个91%有漏洞的"数字员工"吗?Anthropic推金融Agent的同一天FactSet跌了8.1%,资本已经用真金白银投了票:被替代的恐慌会加倍放大安全敏感度。一个出错的金融Agent不是"功能故障",是"内鬼"。

那么问题来了:如果明天你公司要部署一个能自主处理客户数据的AI Agent,你是先上线抢业务,还是先花三个月做安全审计?你敢不敢赌那9%的安全概率?

郑工长每天都在关注AI圈的新闻动态,下面进入今日要点:

核心趋势摘要

  • AI特工疯狂上岗撞上安全铁墙:91%漏洞率撕开Agent产业链最深的伤口:斯坦福MIT联合研究不是学术论文,是一份产业级诊断书。当美军10万Agent、Anthropic金融特工、谷歌Remy同时冲刺部署,94%可被投毒意味着——对手可能比你更早用上你的AI
  • AI竞争从"比谁聪明"切换到"比谁赚钱":Anthropic收入跃升重构行业坐标:当多数人还在争论大模型谁更强,Anthropic已经用营收数据把战场从技术参数拽到了商业兑现。金融Agent直接动摇FactSet股价,说明"能赚钱的AI"比"考第一的AI"更有杀伤力
  • 大模型集体"下海":豆包收费只是第一滴血,算力账单压顶下的生死竞速:豆包付费测试引爆了中国AI商业化元年,但背后是同一个算术题——周调用量反超美国的代价是GPU账单飞涨。免费获客时代终结,谁能先让用户心甘情愿掏钱,谁就能活过2026

技术突破与基础设施

  • 谷歌亮出Remy,AI特工赛道迎来最危险的追赶者:内部代号"Remy"的AI智能体正在内测,能代表用户自主执行操作,直接对标OpenClaw。谷歌手握Gemini底座、Android生态、十亿级用户入口——一旦Remy打通谷歌全家桶,Agent分发格局将彻底改写
  • IBM Bob正式发布:AI从"帮程序员写代码"进化到"管整个软件工厂":Bob贯穿从规划、编写到测试、部署的完整软件开发生命周期,并提供企业级治理与安全控制。不是又一个Copilot,而是一套SDLC操作系统——IBM试图用"全流程接管"重新定义AI编程的战场
  • 苹果打出奇招:不自研顶级大模型,但让用户在iOS 27里随便选:自知短期追不上GPT-5.5和DeepSeek V4,苹果选择成为外部AI模型的"最佳宿主"。这不是认输,是另一种卡位——当所有大模型都需要落地场景,iOS的20亿设备就是最肥的入口

产业落地加速

  • Anthropic金融特工10款齐发,FactSet一天蒸发8.1%:能写推介材料、审阅报表、监控交易的AI Agent直接杀入华尔街核心业务。不是辅助分析师的工具,而是让分析师的存在本身成为问号。Morningstar同步下跌——金融数据服务商的护城河,在Agent面前变成了护城沟
  • OpenClaw券商路演场场爆满,投研行业的"GPT时刻"来了:据统计,以OpenClaw为核心的智能投研路演和电话会议异常火爆。曾经需要分析师团队花数周完成的行业报告,正在被AI压缩到小时级别——金融投研的"手工作坊"模式,撞上了工业化流水线
  • Anthropic整了个全是AI的闲鱼群,大模型在里面互相割韭菜:员工给AI设定"高于底价20%就痛快交易"或"一上来就往死里压价"等谈判策略,让一群AI特工在虚拟二手市场里相互博弈。这不是玩具实验——这是在训练AI的商业谈判能力和策略博弈,银行客户经理的"话术经验"正在被代码化
  • 花500元在淘宝定制个人AI特工,安全隐忧比价格更值得砍价:个人AI智能体定制正在成为一门新兴生意,但消费纠纷和网络安全问题同步增长。当你把购物偏好、聊天记录、日程安排喂给一个"定制特工",你买的不是便利,是一张隐私支票——而收票方有没有保险柜,没人知道
  • 丰e足食联手阿里云千问,18万台智能柜开始用大模型"思考":国内无人零售最大运营商在84城运营超18万台设备,接入千问后,补货决策、商品推荐、动态定价将从"规则驱动"转向"模型驱动"。无人零售的竞争壁垒,正在从点位数量变成模型质量

资本与市场

  • Anthropic收入跃升改写AI估值逻辑:从"看参数"到"看营收"的范式切换:当行业还在为Opus 4.7的Token消耗吵翻天,Anthropic已经用商业收入数据把战火烧到了华尔街。资本市场的问题从"你的模型考了多少分"变成了"你的Agent替客户省了多少钱"——后者的答案直接决定股价
  • 算力账单压顶:大模型集体"下海"赚钱,2026年淘汰赛正式开打:第一财经深度报道指出,大模型竞赛的命题已从"谁的模型更强"彻底转向"谁的模型先赚钱"。豆包收费测试、Anthropic金融Agent、千问小酒窝商业化——所有人都在抢答同一道题:免费烧出来的用户,能不能变成付费留下来的客户
  • 美国政府将审查AI大模型,全球AI监管从"呼吁"进入"动手"阶段:财新报道,美政府正式启动对AI大模型的审查程序。监管不再是欧洲的独角戏——当美军部署10万Agent、华尔街用AI替代分析师,华盛顿终于意识到:规则必须跑在事故前面
  • XCaliber Health获650万美元,用"Agent操作系统"取代医疗点解决方案:数字健康平台的融资逻辑在变——不再为单个AI功能买单,而是为"能编排多个Agent协同工作"的操作系统级能力投钱。医疗AI的下一个战场,是让诊断Agent、用药Agent、随访Agent在一个平台上对话

相关新闻源