
郑工长观点
朋友们好,我是郑工长。今天AI圈有个讽刺的现象对比:苹果研究实锤质疑AI推理能力只是'数学幻象',而麦肯锡调查显示23%企业仍在加速扩展AI智能体应用。这两个现象摆在一起,像极了皇帝的新衣——所有人都夸衣服漂亮,只有小孩说皇帝根本没穿衣服。
苹果这个研究结果让我仿佛看到了一场魔术表演。魔术师让你相信他真的有魔法,实际上全靠道具和手法。现在的AI大模型就像高级魔术师,用复杂的数学变换让你觉得它有'思考能力',但苹果的研究人员引入新型符号数据集一测试,发现它根本不懂推理,只是在做模式匹配。
更有意思的是,就在苹果捅破这层窗户纸的同一天,AI大模型'六小虎'之一的MiniMax通过了港交所聆讯,准备上市圈钱。这就像魔术师被揭穿手法后,不仅不慌,反而开始卖门票教别人变魔术。
再看看麦肯锡的调查数据:39%的企业在试验智能体,但只有23%在业务部门扩展应用。这个数字比前两天瑞银说的5%落地率高了不少,但仔细想想,23%意味着超过四分之三的企业要么没试,要么试了没扩。
说白了,AI行业正在上演一场大型的'认知失调'。一边是技术专家说AI不会推理,一边是资本市场疯狂追捧,一边是企业半信半疑地试水。这三股力量拉扯下,整个行业就像在走钢丝。
当AI的'思考能力'被证明可能只是数学幻象时,那些估值百亿的AI公司,到底在卖什么?是真正的智能,还是精心包装的'数字魔术'?
以下是今日的行业要点,大家看看有什么值得关注的:
核心趋势摘要
- AI推理能力遭苹果实锤质疑,'数学幻象'戳破技术泡沫 苹果研究引入新型符号数据集测试,发现当前AI模型缺乏真正推理能力,只是在做复杂的模式匹配,挑战AI智能本质认知。
- 企业AI扩展率仅23%,理想与现实差距依然巨大 麦肯锡调查显示仅23%企业在业务部门扩展AI智能体应用,39%仍在试验阶段,企业级AI落地仍面临信任与效果双重挑战。
- 资本市场与技术进步脱节,MiniMax上市凸显估值泡沫 在AI推理能力被质疑的背景下,MiniMax通过港交所聆讯准备上市,显示资本市场热度与技术实际进展存在明显时差。
革命性突破
- 苹果研究挑战AI推理能力认知,称LLM推理只是'数学幻象' 苹果研究人员通过引入新型符号数据集,对包括OpenAI GPT-4o在内的领先AI模型进行测试,质疑其是否具备真正推理能力。
- 小米AI'野心初现':罗福莉首秀,基座大模型问鼎全球开源TOP2 小米在合作伙伴大会上全面开放AI能力,MiMo大模型负责人罗福莉展示开源大模型成果,显示中国AI人才实力。
- 全国规划资源领域首个基础大模型发布,商汤与上海政府联合打造 '云宇星空大模型(专业版)'由上海市规划资源局联合商汤大装置共同研发,实现问不倒、能调图、会统计等专业能力。
产业落地加速
- AI大模型'六小虎'MiniMax通过港交所聆讯,即将上市 稀宇科技已拿到证监会备案且通过港交所聆讯,自主研发多模态通用大模型,成为又一家冲击资本市场的AI公司。
- 南航'智慧出行管家'智能体正式亮相,AI赋能航空全流程 南航集团举办AI+产业生态创新大会,推出'南小航'智能体,实现旅行线路定制、航班信息一键定制等功能。
- 博西家电上线品牌AI家电管家智能体'西西子'与'博世熊' AI技术为家电注入智慧,通过手机提问即可获得个性化家电管理建议,智能家电交互体验升级。
- SaaS转型Agent时代新基建,传统系统不会被取代而是进化 智源社区分析指出,传统CRM、ERP系统不会死亡,而是逐渐变成Agent时代的基础设施,支持智能体处理工作流。
技术生态进展
- 高质量数据重新定义AI能力边界,成为新一代基础设施建设 创业邦分析指出,在未来很长时间里,数据都是不可或缺的基石,高质量数据正在成为AI能力的关键决定因素。
- Cloudflare阻止AI爬虫,成为首家保护互联网内容的基建商 Cloudflare明确反对AI内容抓取行为,阻止AI爬虫在未经许可、未支付报酬的情况下采集内容,引发行业争议。
- 同济大学发布'同仪智擎'大型仪器AI大模型,推动设备开放共享 学校召开大型仪器设备开放共享交流会,发布AI大模型提升仪器设备使用效率与管理水平。
- 蚂蚁集团分享百灵多模态实践与探索,展示全模态战略布局 蚂蚁集团资深算法专家陈景东分享百灵大模型在多模态领域的实践,展示中国企业在AI前沿技术的探索。
资本与市场
- 2026年智能体AI:应用参差不齐而非全面普及 麦肯锡调查显示智能体AI实际应用情况复杂,仅23%企业在业务部门扩展应用,跨平台多智能体协作仍是挑战。
- AI时代员工价值评估体系迎来革命性变革,传统工时考核失效 虎嗅报道提出以智能体编排能力和Token投资回报率为核心的新评估框架,员工价值评估从工时转向AI协作能力。
- 上海交通大学图书馆AI知识库项目入选高质量数据集先行先试 '面向法学人才培养的AI知识库和智能体构建'项目入选上海市数据局第一批高质量数据集先行先试项目。
- 高通徐晧解读6G关键趋势:AI成核心驱动力,智能体互联网将临 高通全球副总裁徐晧指出,智能体AI兴起将重塑业务与流量模型,6G时代AI将成为通信技术核心驱动力。
相关新闻源
- 有意为之的混合设计,是数字化转型和云计算的致胜之道
虚拟办公的兴起、人工智能技术以及流程数字化带来了组织复杂性。此外,公司的业务内容与产品服务正加速数字化。 IBM 商业价值研究院的一项研究发现,到2026 年,全球...
来源:IBM - Laserfiche荣膺Info-Tech Research Group《企业内容管理——企业级数据象限》行业领导者殊荣
(美国商业资讯)-- 作为智能内容管理与业务流程自动化领域的领先SaaS服务提供商,Laserfiche在Info-Tech Research Group发布的《企业内容管理——企业级数据象限报告》中获...
来源:Business Wire - 安波福与Vecna Robotics携手开发新一代自主移动机器人
安波福与Vecna Robotics近日宣布达成战略合作,双方将联合开发新一代自主移动机器人(AMR)解决方案,旨在实现经济高效的自动化部署。 此次合作将融合安波福行业领先的产品...
来源:中国商用汽车网 - 上海崛起超级个体经济,一个人+AI就能调度“千军万马”
2024年初,OpenAI CEO山姆·奥特曼抛出一个大胆预言:AI时代将诞生估值10亿美元的“一人独角兽”。 不到两年,这一未来图景正逐步在上海临港新片区落地生根。
来源:新浪新闻_手机新浪网 - Cloudflare 希望保护互联网免受“零点击”内容带来的风险。它会成功吗?
Cloudflare 明确反对AI 内容抓取行为,成为首家阻止AI 爬虫在未经许可、未支付报酬的情况下采集内容的互联网基础设施提供商。
来源:IBM - Mediaocean:2025年广告行业调查报告
根据对近700名营销专业人士的调研,2025年的广告业正迎来一场深刻的结构性变革。数字渠道的霸主地位愈发稳固,其中社交媒体以68%的营销人员计划增加投入的压倒性优势...
来源:新浪网 - GMP数字化的"底座之选":魔方网表如何内建21 CFR Part 11能力
在全球医药监管日趋严格的今天,FDA 21 CFR Part 11法规已成为药企数字化转型必须跨越的"合规门槛"。然而,传统信息化系统要么合规能力不足,要么定制成本高昂、验证周期...
来源:中华网 - SaaS 已死?不,SaaS 会成为 Agent 时代的新基建
「传统Saas 应用已死?CRM 、 ERP 系统会被彻底取代,Agent 会处理所有工作流?」 每隔一段时间,都有类似的论断、观点出现。 不会的。相反,这些系统会逐渐变成Agent...
来源:智源社区 - 实现数据可视化升级,PhotonPay光子易推出新一代金融操作系统
【2025年12月18日】—— 光子易(PhotonPay) 宣布上线新一代金融操作系统(Financial Operating System)
来源:飞象网 - AI时代员工价值评估体系迎来革命性变革
随着AI技术在企业核心业务中的深度应用,传统以工时和任务量为基准的员工评估体系已失效。报告提出以智能体编排能力(IAOC)和Token投资回报率为核心的新框架,...
来源:虎嗅网 - AI大模型“六小虎”MiniMax通过港交所聆讯
近日,记者获悉,AI大模型“六小虎”之一MiniMax(稀宇科技)已拿到证监会备案且通过港交所聆讯。MiniMax成立于2021年,自主研发了一系列多模态通用大模型,包括MiniMax...
来源:新浪网 - 小米AI“野心初现”:罗福莉首秀 基座大模型问鼎全球开源TOP2
《科创板日报》12月17日讯(记者余诗琪)在今日举办的小米“人车家全生态”合作伙伴大会上,AI能力的全面开放与进化成为核心焦点。 在这次会上,小米MiMo大模型负责人罗福莉...
来源:财联社 - AI市场将扩容10倍?多模态Agent需求逐步爆发
回顾豆包大模型近两年的AI征程,可以看到一条从技术验证、到平台构建、再到生态扩张的清晰轨迹。
来源:21财经 - 元保方锐:搭AI智能服务体系 赋能保险全链条效率提升
人工智能(AI)技术的演进,无疑是现代科技发展历程中浓墨重彩的关键篇章。近年间,依托Transformer架构的大模型持续释放强劲势能,凭借卓越的理解与生成能力惊艳业界——...
来源:中华网 - 用于产品开发:TCL华星发布垂域大模型“星智X-Intelligence3.0”
12月11日,2025年TCL全球技术创新大会(TIC2025)在广州举行。本届大会以“AI for Real(AI向实)”为主题,探讨人工智能技术在产业端与消费端的落地应用。
来源:laoyaoba.com - 高质量数据,正在重新定义AI的能力边界
在未来很长一段时间里,数据都将是不可或缺的基石,它属于新一代的基础设施建设。 12月11日,由北京市通州区人民政府主办,通州区经济和信息化局、通州区台湖镇人民政府...
来源:创业邦 - AI 的数学幻象:苹果研究挑战 AI 推理能力认知
在一项引发科技界涟漪效应的研究中,苹果公司研究人员对LLM 是否具备真正推理能力提出了质疑。 论文作者通过引入新型符号数据集,对当前AI 模型(包括行业领先者OpenAI...
来源:IBM - 全国规划资源领域首个基础大模型发布,上海市规划资源局与商汤大装置联合打造
问不倒、能调图、会统计、能识图、会报告——全国规划资源领域首个基础大模型“云宇星空大模型(专业版)” 今天在上海发布,该模型由上海市规划资源局联合商汤大装置共同研发...
来源:上观 - 学校召开2025年度大型仪器设备开放共享交流会,“同仪智擎”大型仪器AI大模型发布
为持续推进大型仪器设备开放共享工作高质量发展,12月17日,同济大学2025年度大型仪器设备开放共享现场交流会在沪西校区举行,副校长石振明出席并致辞。
来源:同济大学新闻网 - 社区供稿丨Ming-Omni:百灵多模态实践与探索
本文整理自蚂蚁集团资深算法专家陈景东在Hugging Face Papers 直播AI Insight Talk| Omni 全模态专场的分享。 引言:百灵大模型的整体战略布局.
来源:智源社区 - 2026年智能体AI:应用参差不齐而非全面普及
智能体AI正引发热议,但实际应用情况复杂。麦肯锡调查显示,39%的企业正在试验智能体,仅23%在业务部门扩展应用。尽管Salesforce等厂商已将智能体嵌入应用,但跨平台多智能...
来源:至顶网 - 南航“智慧出行管家”智能体正式亮相
《中国民航报》、中国民航网记者郭瑛报道:12月18日,南航集团在广州成功举办“创新领航·AI赋能”南航AI+产业生态创新大会,全面展示南航深入落实国家“人工智能+”行动和民航...
来源:中国民航网 - 博西家电上线品牌AI家电管家智能体 “西西子”与“博世熊”
AI技术为家电注入了前所未有的智慧,然而复杂的参数设置、层层嵌套的操控界面,智能家电的下一场进化,正在转向交互体验的升维。如果只需在手机上提出疑问,就会有一位始终...
来源:中国家电网 - AI赋能 南航“智慧出行管家”智能体亮相
新华网广州12月18日电(李幸子)想去哪里旅行,跟“南小航”说一下,大数据模型就能为你定制专属旅行线路,再也不用辗转几个App做攻略,适配你的航班信息可以一键定制。
来源:新华网广东 - 移动互联网后可能是智能体互联网?通信专家谈6G+AI的想象力
新京报贝壳财经讯(记者韦英姿)6G技术预计在2030年左右启动商业化,目前还处于标准化阶段,而在通信行业看来,AI已经成为6G迈入下一技术阶段、寻找应用场景的切入点。12...
来源:新京报 - 祝贺!AIR可进化AI医疗智能体入选清华2025前沿科技榜单
11月22日,清华大学万国数据教授、AIR执行院长刘洋课题组研发的可进化AI医疗智能体入选清华大学2025“青年最关注的改变未来十大变革科技"榜单。
来源:清华大学 - 智能体驱动生产力变革 360十大案例解码AI应用实施路径
科技日报记者付丽丽. 随着大模型技术从概念热潮走向务实应用,产业界正聚焦于一个核心议题:人工智能如何真正融入生产流程,转化为可量化、可验证的生产力?
来源:中国科技网 - AI市场将扩容10倍?多模态Agent需求逐步爆发
回顾豆包大模型近两年的AI征程,可以看到一条从技术验证、到平台构建、再到生态扩张的清晰轨迹。
来源:21财经 - 上海交通大学图书馆“面向法学人才培养的AI知识库和智能体构建”入选上海市数据局第一批高质量数据集先行先试项目
近日,上海市数据局正式公布第一批高质量数据集先行先试项目名单*。由上海交通大学图书馆牵头建设并申报的“面向法学人才培养的AI知识库和智能体构建”项目成功入选第一批...
来源:上海交通大学 新闻网 - 高通徐晧解读6G关键趋势:AI成核心驱动力
随着6G 标准化元年到来,高通全球副总裁徐晧分享6G 技术演进方向。他指出,技术演进与应用趋势共同推动6G 发展,智能体AI 兴起将重塑业务与流量模型,个人AI 助手等场景使...
来源:新浪财经




