郑工长

郑工长·AI洞察|2026.05.10·菲尔兹奖叹!AI解题又造假

发布于 2026年5月10日 | 分类: AI洞察日报

郑工长·AI洞察|2026.05.10·菲尔兹奖叹!AI解题又造假

郑工长观点

朋友们好,我是郑工长。

今天早上你刷到那条"8家车企被约谈"的新闻,转发到车友群,群友也信了。直到中汽协和8家车企集体出来辟谣,你才反应过来——这条新闻的源头,可能只是一个AI大模型在某个提示词下的产物。

这不是阴谋论。每日经济新闻今天详细还原了这条假新闻的传播链:有媒体报道新能源车"锁电"投诉激增,经自媒体和搜索引擎AI摘要层层"加工",最终发酵成一份"被约谈名单"——8家车企不得不在同一天集体发声辟谣。

就在同一条时间线上,剑桥大学菲尔兹奖得主Timothy Gowers发了一个帖子。他用AI解出了一个博士级别的数学开放问题。然后他干的第一件事不是庆祝,是开始为博士生发愁——当AI能完成博士水平的数学推导,博士生们未来几年该学什么?

两条新闻相隔万里,却在同一天撞出了同一个事实:AI的能力正在超速扩张,而我们对它的信任基础,远远没有跟上。

今天还有第三条线把这幅图拼完整了。新浪财经起底了一条隐秘的灰产——AI"投毒"。有人专门向大模型语料库注入虚假信息,用批量造假来操控AI搜索结果,业内黑话叫GEO(生成式引擎优化)。这不是网络水军刷评论,这是直接往AI的"大脑"里灌假记忆。

被忽略的隐性成本在这里暴露了:我们每个人都在支付越来越高的"AI心智税"。你每看到一条新闻,得多花时间验证是不是AI编的。你每用一次AI搜索,得在心里打一个问号——这个答案是被"投毒"优化过的吗?这些多出来的时间、焦虑和判断力消耗,没有人写在产品定价表里,但每一个AI用户都在默默支付。

当前阶段这些成本无法被工具消除,原因很简单:AI生成和AI检测是一场永无止境的猫鼠游戏。Gowers证明了AI的能力边界还在以惊人速度扩张——能力越强,造假就越逼真,检测就越困难。这不是技术问题,是逻辑问题。

那么谁适合在这个阶段深度使用AI?答案是具备"源信息验证能力"的人。你能追溯到一手论文、你能交叉验证多个信源、你能识别信息发布者的资质——那AI就是你的加速器。你不具备这些能力——AI就是你的信息茧房加速器。

问题来了:作为普通用户,你敢不敢100%相信AI给你的信息?你上一次交叉验证AI的答案,是什么时候?

郑工长每天都在关注AI圈的新闻动态,快讯梳理在下方:

核心趋势摘要

  • AI能力与AI信任同日"双向奔赴":菲尔兹奖得主解数学题+8家车企辟谣假新闻+AI投毒灰产起底,行业最尖锐的矛盾不再是如何变强,而是强了之后谁敢信:Gowers证明了AI的智力天花板还在被捅破;假新闻和投毒灰产证明了AI的信任地板随时可能塌陷。当"最强"和"最假"在同一天抵达,AI行业必须回答——能力不设上限,信任能不能同步跟上
  • 智能体从"管行为"到"管身份":KYA基础设施竞逐开启,AI Agent正在被装进"社会操作系统":三部委《实施意见》定调之后,更底层的工程问题浮出水面——ERC-8004、Visa TAP、Trulioo等方案正在竞逐"Know Your Agent"身份标准。跟当年互联网从匿名到实名的演化路径如出一辙
  • AI产品"付费+实名"双闸落下:豆包68-500元定价确认,Claude Opus 4.7查身份,Grok Build泄露暴露代码Agent赛道已挤满玩家:免费AI三周之内被三件事联手终结。下一个问题:用户愿意为AI付的钱,够不够撑起这些公司的估值

技术突破与基础设施

  • Claude Opus 4.7或本周上线,但Anthropic要查你证件了:新版本同步推出身份验证机制——当AI替你在网上操作账户,系统必须先确认"你是谁"。这不是限制自由,是给Agent发"驾驶执照"
  • 马斯克Grok Build编程智能体提前泄露,代码Agent赛道一夜从"二人转"变"三国杀":xAI被收编到SpaceXAI后,Grok Build直接对标Claude Code。加上GPT-5.4的Agent能力,美国三大AI编程Agent已全部亮剑。比的不是代码质量,是谁先卡住企业开发者工作流入口
  • 智源联合七所高校发布FlagSafe,大模型安全终于有了一站式检测平台:北大、北邮、北航、上交大、中科院等联手,覆盖对抗攻击、数据投毒、后门检测。AI投毒灰产浮出水面的同一天,防守方也开始建阵地
  • 中国移动Token运营体系曝光:不做算力贩子,要做AI时代的"央行":整合网络、算力、模型、应用与10亿用户,国家数据局披露日均Token调用量已于3月突破140亿。运营商的牌很明确——Token成为AI基础货币后,要建的是清算体系不是矿场
  • Goldman Sachs定调:Agentic AI正把Token从"成本项"拧成"增长引擎":AI智能体让Token消耗量跃升式增长,算力成本降幅超过定价降幅——超大规模云厂商的利润率即将进入扩张通道

产业落地加速

  • 从KYC到KYA:AI智能体正在被要求"出示身份证":当Agent开始自主执行交易、签合同、做决策,监管逻辑自然从"了解你的客户"延伸到"了解你的Agent"。ERC-8004、Visa TAP等方案竞逐链上身份体系——谁先建立可信Agent身份标准,谁就掌握了下一代商业流量的"海关"
  • 科博会现场直击:AI智能体从"能用"到"敢用",中间缺的不是技术而是兜底机制:三部委《实施意见》出台后首个行业展会,企业最关心的不是Agent多聪明,而是Agent出了错谁来扛。安全、可信、可追溯——这三样成了企业级Agent落地的"铁三角"
  • 新华GEO智能体平台发布:央媒亲自下场建"可信信息分发"国家队:AI投毒灰产污染搜索结果,央媒的应对不是封堵,是建一个"可信GEO"平台。AI时代的信息竞争,已从"谁写得多"变成"谁的信源更可信"
  • 71.4K星AI交易团队开源项目:多智能体正在"炒"出一个分布式华尔街:不是单个AI做交易决策,多个Agent分工——盯盘、分析、执行各司其职。GitHub热度说明散户在用开源Agent武装自己,对抗机构的算法优势
  • 中信建投姚紫薇定调:善用AI的分析师才有核心竞争力,投研行业正在经历"重新分工":AI不会取代分析师,但会用AI的分析师会取代不会用的。跟慧算账"含虾率100%"逻辑一致——所有知识工种都在经历同一场洗牌

资本与市场

  • 豆包正式标价68-500元,中国免费AI时代终结三周后,行业开始算账:字节跳动的定价已实施近一周,行业从震惊进入盘算期。当中国月活最高的AI应用开始收费,所有还在免费烧钱的公司都被架在火上——跟,现金流撑不住;不跟,用户用脚投票涌向付费产品,说明用户开始愿意为"靠谱的AI"掏钱
  • AI"投毒"灰产生意起底:批量造假降成本,业内人直言"投毒"难防:向大模型语料库注入虚假信息操控AI搜索结果——互联网黑产在AI时代的"产业升级"。更棘手的是,被污染的信息一旦进入模型训练,清除成本远高于投毒成本。AI安全的攻防不对称,正在变成一门"负成本犯罪"
  • 字节Seed成AI黄埔军校:大厂人才流动比模型迭代还快,核心know-how扩散从论文变成"人带着脑子跳槽":DeepSeek近300人作者名单中10人标注"已离职",去向多为字节Seed。中国AI圈的人才争夺已白热化到——你刚发完论文,对手已经把作者挖走了
  • GEO赛道跑出新玩家:聚邑智能喊出"全球四强",AI时代的SEO战争才刚刚开始:传统搜索被AI搜索取代,SEO行业经历范式迁徙。聚邑智能定位"大模型语料新生态"——这个赛道还在草莽期,但方向明确:谁掌控AI知识入口,谁掌控下一代信息分发权
  • 中国移动建国内最大大模型服务平台,300+模型一站解锁:运营商从"管道"变"超市":MoMA平台首创词元集约化运营。电信运营商在AI时代的野望很清楚——不做模型,做模型的分发和结算。这张牌比单纯卖算力大得多

相关新闻源