郑工长·AI洞察｜2025.12.05·实战突围！AI从"画饼"到"造血"的生死竞速

郑工长观点

朋友们好，我是郑工长。今天AI圈有几件大事值得关注：首先是京东、飞猪、云知声等企业专家集体复盘，揭秘AI从"画饼"到"造血"的实战账本；其次是中科院团队突破AI诚信对齐难题，仅需千分之一数据让大模型学会"知之为知之"；同时，Salesforce发布EDR系统，让AI智能体能像专业分析师一样做企业深度研究。

这让我想到了一个"AI从炫技到务实"的深刻转变。过去一年，我们见证了太多AI的"魔法时刻"——生成精美的图片、写出流畅的文章、进行复杂的对话。但今天，当京东、飞猪、云知声的专家们坐下来算账时，他们问的是最现实的问题：AI到底是在"画饼"，还是在真的"造血"？如果AI仅仅停留在生成一些文案或图片，那它还不足以成为驱动增长的核心引擎。这种从"技术秀"到"价值算账"的转变，标志着AI行业正在进入一个更加务实、更加注重ROI（投资回报率）的新阶段。

更值得深思的是中科院团队的突破。他们提出的EliCal框架，仅需0.18%的标注数据就能达到传统方法98%的性能，解决了大语言模型的"诚信对齐"难题。这就像是给AI装上了"自知之明"的开关——让AI学会区分"我知道什么"和"我不知道什么"，而不是为了完成任务而胡编乱造。在AI大规模应用的今天，这种"诚信"能力可能比单纯的"聪明"更重要。想象一下，如果一个医疗AI系统因为"面子"而不敢承认自己不确定，后果可能是灾难性的。

与此同时，Salesforce的EDR系统展示了AI智能体的另一个进化方向：从简单的任务执行者，升级为能够像专业分析师团队一样协作的"企业研究大脑"。这个系统包含主规划智能体和四个专业智能体，能够处理复杂的企业研究任务。这不再是单个AI的"单打独斗"，而是多个AI的"团队作战"，每个智能体都有自己的专长，通过协作完成更复杂的任务。

那么，当AI从"画饼"走向"造血"，企业该如何建立科学的AI价值评估体系？在AI诚信成为核心竞争力的时代，我们又该如何平衡AI的"自信"与"诚实"？

今日快讯汇总，请关注落地案例与趋势：

核心趋势摘要

AI价值评估从"画饼"转向"造血" 企业开始系统复盘AI投入产出，关注AI是否真正创造业务价值，而非停留在技术演示层面。
大模型诚信对齐成技术新前沿 中科院团队突破AI诚信对齐难题，仅需千分之一数据让大模型学会"知之为知之"，解决AI"胡说"问题。
多智能体协作从简单任务走向复杂研究 AI智能体正从单一任务执行者，向能够像专业团队一样协作处理复杂研究任务的方向演进。

革命性突破

中科院突破AI诚信对齐 中科院团队提出EliCal框架，通过两阶段训练解决大语言模型诚信对齐难题，仅需0.18%标注数据达到传统方法98%性能，并在未见任务上表现优异。
斯坦福ReCAP框架性能提升112.5% 斯坦福和MIT研究团队推出新型AI智能体推理框架ReCAP，在长上下文任务中全面超越主流框架ReAct，通过递归树结构和三大机制提升性能。
OpenAGI发布Lux基座模型 OpenAGI基金会发布首个"computer-use"基座模型Lux，号称是世界上最好、最快、最便宜的computer-use模型，已通过SDK对外开放。

产业落地加速

京东飞猪云知声复盘AI实战账本 企业专家集体复盘AI提效实战，探讨AI从"画饼"到"造血"的转变，关注AI是否真正成为驱动增长的核心引擎。
Salesforce发布EDR企业深度研究系统 Salesforce AI Research开发EDR系统，这是一个可操控的多智能体AI框架，能像专业分析师团队一样处理复杂企业研究任务。
群思AI语音客服线上发布会启幕 群思AI语音客服线上发布会即将启幕，针对医疗、金融、政务等高频服务场景中传统智能客服的局限性，推出AI解决方案。
新华网"AI探真"智能体正式上线 新华网联合中国科学技术大学、支付宝共同研发的"AI探真"智能体正式上线，作为我国辟谣领域首个中央主流媒体AI智能体。
宁夏银行AI大模型知识库项目招标 宁夏银行发布AI大模型知识库场景建设项目竞争性磋商公告，显示金融行业对AI大模型落地的实际需求。

技术生态进展

亚马逊让Agent"长出"手脚 亚马逊云科技在re:Invent上强调AI Agent时代已来，未来将出现数十亿AI Agent，为工作流自动化提供完整解决方案。
基于文本AI的终结？Agent协作复制思维 在Agentic AI时代，多智能体系统让AI学会组队协作，Token效率暴涨，推动AI从单一模型向协作系统演进。
SIEM与数据湖融合演变 安全信息与事件管理（SIEM）市场正经历重大转变，由安全数据湖、数据管道及高级分析平台驱动，从集中式日志管理向智能分析演进。
AI生成只占10%？工程深海占90% 业界共识浮出水面：在严肃的企业级应用开发中，AI生成或许只占最终成功交付的10%，90%在于工程化、集成与业务流程适配。

资本与市场

专访大模型创业公司商业化突围 澎湃新闻专访大模型创业公司，探讨在AI大模型讨论热潮不再的背景下，创业公司如何在商业化中实现突围。
UiPath股价大涨超8% UiPath股价在盘前交易中上涨超过8%，此前这家自动化软件提供商在第三财季的营收和盈利均超过预期。
机器人行业泡沫破灭后的新巨头 36Kr分析机器人行业泡沫破灭后的格局，认为未来具备真正壁垒的机器人企业，会是最早实现"从产品能力到组织资产"转化的企业。
卢伟冰：小米AI大模型进展远超预期 小米集团合伙人卢伟冰表示，在AI大模型和应用方面的进展远超预期，显示小米在AI领域的加速布局。

相关新闻源

京东、飞猪、云知声、蚂蚁专家复盘，揭秘 AI 提效的 4 本实战账本 | AICon
在企业内部，AI 到底是在“画饼”，还是真的在“造血”？这是当前所有CTO 和业务负责人都必须直面的灵魂拷问。如果AI 仅仅停留在生成一些文案或图片，那它还不足以成为驱动增长...
来源：InfoQ 官网
从“会聊天”到“干实事”，亚马逊云科技让Agent“长出了手脚”
美国西部时间12月2日的2025 亚马逊云科技re:Invent上，亚马逊云科技首席执行官Matt Garman在开场演讲中抛出了一个观点：AI Agent时代已来，未来将出现数十亿AI Agent，为...
来源：维科号
AI时代，CISO正在沦为“首席背锅官”？
人工智能浪潮席卷而至，每个从业者的工作模式都在经历深刻重构。对于首席信息安全官(CISO)而言，这场技术革命所引发的，恐怕是一场前所未有的角色认知危机。
来源：信息化观察网
SIEM与数据湖的融合演变进化及趋势
安全信息与事件管理（SIEM）市场正经历数十年来最重大的转变之一，这一转变由安全数据湖、数据管道及高级分析平台的兴起驱动。从最初的集中式日志管理，如今已演变为关于"...
来源：安全内参
产品发布｜群思AI语音客服线上发布会即将启幕，诚邀您莅临！
当前，在医疗、金融、政务等高频服务场景中，传统智能客服的局限性日益凸显，无法感知用户焦虑、无法精准解决需求，因此对AI智能客服的需求尤为迫切。
来源：中华网
Invent 2025 Swami博士主题演讲：可用、易用、可靠的Agentic AI核心技术路径
亚马逊云科技Agentic AI副总裁Swami Sivasubramanian发表了《Agentic AI的未来已来》主题演讲，以一系列重磅发布正式开启人机协作的Agent新时代！
来源：量子位
机器人行业泡沫破灭，谁将崛起成新巨头？
未来具备真正壁垒的机器人企业，会是最早实现“从产品能力到组织资产”转化的企业。
来源：36Kr
OpenAGI 基金会推出号称全球最好的Computer Use 基座模型：Lux - OSCHINA - 开源 × AI · 开发者生态社区
OpenAGI 基金会近日发布了其首个“computer-use”基座模型，名为Lux。官方称它是“世界上最好、最快、最便宜的computer-use 模型”，并且已经通过其SDK 对外开放，因此任何...
来源：OSCHINA
UiPath Stock Surges Over 8% On Strong Revenue and Earnings Estimate
UiPath stock is up 8% in pre-market after the automation software provider beat revenue and earnings estimates in fiscal Q3.
来源：TIKR.com
MNEE：构建下一代数字美元流动性基础设施
探索MNEE USD稳定币如何通过可靠性和透明性解决数字经济中的实际交易问题。
来源：Bitcoin.com News
专访｜当AI走向应用落地，大模型创业公司如何在商业化中突围
在过去三年里，大模型创业公司是科技领域里的明星、宠儿，每家公司的创业故事都曾引发热议。进入2025 年下半年，人工智能大模型的讨论热潮不再，话题则深入到商业应用。
来源：ThePaper.cn
中国人工智能大会丨吴玮杰：大模型的核心价值在于落地场景的深度适配
来源：东方网11月30日，由中国人工智能学会主办，CAAI智能传媒专委会、新浪新闻联合支持的“人机协同与传播新范式”专题活动在北京落幕。
来源：新浪新闻_手机新浪网
让表格会思考，多智能体重构大数据自助分析｜AICon 北京
12 月19-20 日， AICon全球人工智能开发与应用大会收官之站将在北京举办，本次大会将以“探索AI 应用边界” 为主题，聚焦企业级Agent 落地、上下文工程、AI 产品创新等多个...
来源：InfoQ 官网
宁夏银行AI大模型知识库场景建设项目竞争性磋商公告
宁夏银行AI大模型知识库场景建设项目竞争性磋商公告. 移动支付网2025/12/5 8:54:49. 赞( ) 收藏. 展开全文. 文章评论. 还没有人评论过，赶快抢沙发吧！相关阅读.
来源：移动支付网
储能出海"AI新护照"！远景大模型+智能体重构全球竞争规则
人工智能正成为储能出海的“新通行证”，中国企业凭借技术优势在国际高端.
来源：维科号
中科院团队突破AI诚信对齐新难题：仅需千分之一标注数据，让大模型学会"知之为知之"
中科院团队提出EliCal框架，通过两阶段训练解决大语言模型诚信对齐难题。该方法仅需0.18%的标注数据就能达到传统方法98%的性能，并在未见任务上表现优异。
来源：科技行者
绿动齐鲁数智赋能丨海尔“立体化AI”布局：大模型、智能体与终端协同赋能产业创新
12月5日上午，由山东省委网信办主办，中国互联网发展基金会数字碳中和专项基金支持的“'绿'动齐鲁数智赋能”网络名人实践行活动走进海尔科创生态园。
来源：东方财富
卢伟冰：在AI大模型和应用方面进展远超预期
12 月4 日消息，小米集团合伙人/ 总裁、手机部总裁、小米品牌总经理卢伟冰昨日在社交媒体发布了答网友问第12集。
来源：飞象网
GPT周报｜AMD计划恢复向中国出口MI308芯片；豆包下线合作款手机AI操作微信功能；可灵发布多模态工具O1
推荐：亚马逊发布新一代大模型Nova 2；DeepSeek发布DeepSeek-V3.2系列模型；理想汽车发布首款AI眼镜.
来源：财新
亿道“易道”：All in AI，聚焦端云协同！
在云端强大的算力和数据加持之下，云的智能已经成型，当前AI竞争已从单一模型参数竞赛转向“场景与应用”的生态博弈。因此，国际科技巨头都在推动云端模型向端侧下沉。
来源：电子工程专辑
让表格会思考，多智能体重构大数据自助分析｜AICon 北京
12 月19-20 日， AICon全球人工智能开发与应用大会收官之站将在北京举办，本次大会将以“探索AI 应用边界” 为主题，聚焦企业级Agent 落地、上下文工程、AI 产品创新等多个...
来源：InfoQ 官网
押注AI智能体，奇奇科技跨越十年的“换挡”与远航
2025年，中国数字经济正经历从“云原生”向“AI原生”的剧烈变革。国务院印发的《关于深入实施“人工智能+”行动的意见》明确提出，到2027年智能体应用普及率要超过70%。
来源：至顶网
Salesforce发布EDR：让AI智能体像专业分析师一样做企业深度研究
Salesforce AI Research开发了EDR企业深度研究系统，这是一个可操控的多智能体AI框架，能像专业分析师团队一样处理复杂企业研究任务。系统包含主规划智能体、四个专业...
来源：科技行者
首届全球智能机械与电子产品博览会启幕，钛动科技首个出海营销AI智能体亮相_行业动态
12月4日，2025全球智能机械与电子产品博览会（AIE）在澳门与珠海双城启幕，全球逾千家科技企业参展，全方位展示智能机械与电子领域的最新成...
来源：投资界
基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨
在Agentic AI 时代，模型不再是独来独往的学霸，而是开始学会组队、一起想问题。多智能体系统（MAS，multi-agent systems）的发展让AI...
来源：新浪网
AI智能体能为您做什么？
AI agents能够自主设定并推进目标，而非等待反馈或指令，这类技术正从商业应用领域向消费级市场拓展。这一转变有望重塑购物、医疗健康、金融服务等多个行业。
来源：电子工程专辑
储能出海"AI新护照"！远景大模型+智能体重构全球竞争规则
人工智能正成为储能出海的“新通行证”，中国企业凭借技术优势在国际高端.
来源：维科号
全面战胜ReAct！斯坦福全新智能体推理框架性能提升112.5%
斯坦福和MIT的研究团队推出了一种新的AI智能体推理框架ReCAP，在长上下文任务中全面超越了现有的主流框架ReAct，性能提升显著。ReCAP通过独特的递归树结构和三大机制，...
来源：驱动之家
新华网“AI探真”智能体正式上线
12月3日，由新华网联合中国科学技术大学、支付宝共同研发的“AI探真”智能体在企业家博鳌论坛2025新消费发展论坛上正式上线。作为我国辟谣领域首个中央主流媒体AI智能体，...
来源：宁夏新闻网
AI生成只占10%？数睿数据企业级应用真正含金量在于90%“工程深海”
当业界还在惊叹于AI智能体自动生成应用、执行业务流程的“魔法”时，一个深刻的共识正在浮出水面：在严肃的企业级应用开发中，那看似炫酷的AI生成，或许只占最终成功交付...
来源：中华网