郑工长

郑工长·AI洞察|2025.12.23·智能体质量遇阻,市场抢食

发布于 2025年12月23日 | 分类: AI洞察日报

郑工长·AI洞察|2025.12.23·智能体质量遇阻,市场抢食

郑工长观点

朋友们好,我是郑工长。今天AI圈最让人咂摸的,不是谁又发了个大模型,而是LangChain年度报告直接点名:智能体最大的障碍,是输出质量! 你以为大家都在狂吹“智能体元年”要搞定一切,结果它连最基本的“把话说好”都还没彻底解决。这就像一个号称能当“万能管家”的AI,你让他去买菜,结果他带回来一堆你根本没要求的东西,还振振有词说“这是我推理出来的最优解”!

更有意思的是,一边是智能体的“表达障碍”,另一边却是谷歌DeepMind提出一个颠覆性观点:AGI不是单一的神,而可能是“一家公司”,由多个智能体拼凑而成。这不就是说,我们现在期待的那个“超级大脑”,未来可能只是一群不怎么聪明但分工明确的“打工人”的总和吗?这感觉就像,我们正努力让一个AI个体变得更聪明,结果人家DeepMind却说,智能体的未来在于“团队协作”,甚至它们现在连“团队沟通”都还磕磕绊绊。

你以为这就完了?Quest Mobile的数据显示,豆包、DeepSeek、元宝、蚂蚁阿福已经杀入AI原生App周活前四强,这说明消费者对AI的实用性需求是实实在在的。而同时,法新社却评论说“中国廉价AI模型仍脱颖而出”。这简直是又给我上了一课:当技术还在解决“质量”和“协作”的基础问题时,市场已经用脚投票,甚至开始卷“性价比”了。

说白了,现在AI圈就像一场多线作战。有人在攻克技术核心,有人在重新定义智能的终局,有人则在悄悄地把AI做成“白菜价”卖给普通用户。这场游戏里,是先解决“说话的质量”,还是先实现“团队的智慧”,或者直接用“价格优势”抢占市场?

在当前的技术与市场博弈中,你是更看重AI智能体的“个体能力”,还是它“团队协作”的潜力?

接着看具体动向:

核心趋势摘要

  • LangChain报告揭示智能体最大痛点:超半数企业已部署,但“输出质量”仍成最大障碍 (57%企业已将大语言模型Agent投入生产,但输出质量仍是Agent最大障碍,客服、研究落地最快。)
  • 谷歌DeepMind颠覆性观点:AGI非单一神,或由“多个智能体公司”拼凑而成,重塑未来智能路径 (AGI可能并非单一超级智能体,而是由多个系统“拼凑”而成,挑战传统认知。)
  • 国产AI应用周活四强出炉:豆包、DeepSeek等领跑,市场已从技术狂热转向“质价比”搏杀 (Quest Mobile报告显示,豆包、DeepSeek、元宝、蚂蚁阿福成为全市场AI原生App周活前四,且法新社评论中国廉价AI模型脱颖而出。)

革命性突破

  • 亚马逊云科技推出“DevOps Agent”,智能体前沿技术赋能事件响应自动化 (AWS DevOps Agent 公开预览版发布,旨在帮助组织更快应对生产故障、识别根本原因,并主动加强系统可靠性。)
  • 智谱AI旗舰模型GLM-4.7上线,IPO前夕聚焦编码、长程任务与工具协同再强化 (智谱AI正式上线并开源其最新旗舰模型GLM-4.7,新版本针对Coding场景强化编码能力、长程任务规划与工具协同。)
  • 谷歌DeepMind挑战AGI传统认知:通用智能或是“一家公司”的集群智慧 (谷歌DeepMind提出颠覆性观点:AGI可能并非单一超级智能体,而是由多个系统“拼凑”而成,引发对人工智能未来形态的深思。)

产业落地加速

  • 57%企业已将大模型Agent投入生产,LangChain报告揭示客服、研究场景落地最快 (LangChain Agent年度报告显示,超1300人调研中57%企业已将大语言模型Agent投入生产,客服、研究是最快落地场景。)
  • 浩瀚深度携手燧原科技发布金融智能体服务一体机,数字员工加速万亿蓝海市场 (浩瀚深度与燧原科技签署战略合作协议,共建联合实验室,发布金融智能体服务一体机,致力以数字员工开拓万亿蓝海。)
  • 云徙科技xGOS.AI构建智能基座,赋能企业核心业务数智增长,突破AI应用瓶颈 (云徙科技与GOS.AI合作,旨在解决大模型在企业核心业务中应用有限的问题,构建智能基座赋能数智增长。)
  • 魔方网表赋能企业告别Excel VBA痛点,轻松实现定制化业务功能自动化 (针对Excel VBA开发耗时、维护困难等问题,魔方网表提供解决方案,实现企业业务功能定制化与自动化。)

技术生态进展

  • AI大神Karpathy年终总结刷屏:大模型潜力挖掘不足10%,6大转折点至关重要 (Andrej Karpathy发表年度总结,认为2025年大模型有6大转折点,但潜力挖掘不足10%。)
  • SenseTime宣善明:真正面向大模型的AI Infra需同时懂模型、系统与产业 (商汤大装置副总裁宣善明指出,AI基础设施正从单纯资源供给转向系统能力建设,必须同时懂模型、系统、产业。)
  • 腾讯云与Dify专家共识:2025年为Agent元年,安全沙箱等Agent Infra成落地关键 (腾讯云于广游与Dify郑立指出安全沙箱、可观测工具等Agent Infra是解决不确定性的核心,预计2025年将迎来智能体规模化应用。)
  • a16z预测2026年AI Agent三大趋势:输入框消失、代理使用优先、语音代理崛起 (a16z描绘AI技术演进蓝图,预测2026年AI Agent将实现输入框消失、代理使用优先、语音代理崛起等趋势。)
  • 中国移动“弈衡”大模型评测体系演进:聚焦深度思考,推动AI从生成能力迈向可信智能 (中国移动“弈衡”大模型评测体系,旨在科学评估深度思考大模型的技术成熟度与应用能力。)

资本与市场

  • Quest Mobile报告揭示AI原生App市场格局:豆包、DeepSeek、元宝、蚂蚁阿福斩获周活前四 (研究机构Quest Mobile发布的《2025下半年AI应用交互革新与生态落地报告》显示,全市场AI原生App中,最新周活跃用户排名前四的是豆包、DeepSeek、元宝、蚂蚁阿福。)
  • 海致科技递表港交所,营收位列中国产业级AI智能体提供商第五 (海致科技向港交所递交上市申请,按2024年营收计,在中国产业级AI智能体提供商中排第五,市场份额2.8%。)
  • 法新社关注中国廉价AI模型脱颖而出,质疑“物美价廉”是否长久优势 (法新社评论地缘政治紧张下中国廉价AI模型仍脱颖而出,引发对中国AI市场竞争策略和长期发展模式的讨论。)
  • ISC2网络安全人才研究警示:AI熟练工人短缺,AI技能已跻身必备前五 (ISC2《2024 年网络安全人才研究》显示,AI已跻身网络安全领域必备技能的前五名,人才短缺问题突出。)
  • AI搜索用户突破6亿,83%年轻用户首选AI获取信息,企业抢占“答案推荐位”成生存刚需 (在AI搜索用户突破6亿的浪潮下,企业抢占AI答案优先推荐位已成生存刚需,83%年轻用户首选AI获取信息。)

相关新闻源