郑工长观点
朋友们好,我是郑工长。今天AI圈有几件大事值得关注:首先是京东、飞猪、云知声等企业专家集体复盘,揭秘AI从"画饼"到"造血"的实战账本;其次是中科院团队突破AI诚信对齐难题,仅需千分之一数据让大模型学会"知之为知之";同时,Salesforce发布EDR系统,让AI智能体能像专业分析师一样做企业深度研究。
这让我想到了一个"AI从炫技到务实"的深刻转变。过去一年,我们见证了太多AI的"魔法时刻"——生成精美的图片、写出流畅的文章、进行复杂的对话。但今天,当京东、飞猪、云知声的专家们坐下来算账时,他们问的是最现实的问题:AI到底是在"画饼",还是在真的"造血"?如果AI仅仅停留在生成一些文案或图片,那它还不足以成为驱动增长的核心引擎。这种从"技术秀"到"价值算账"的转变,标志着AI行业正在进入一个更加务实、更加注重ROI(投资回报率)的新阶段。
更值得深思的是中科院团队的突破。他们提出的EliCal框架,仅需0.18%的标注数据就能达到传统方法98%的性能,解决了大语言模型的"诚信对齐"难题。这就像是给AI装上了"自知之明"的开关——让AI学会区分"我知道什么"和"我不知道什么",而不是为了完成任务而胡编乱造。在AI大规模应用的今天,这种"诚信"能力可能比单纯的"聪明"更重要。想象一下,如果一个医疗AI系统因为"面子"而不敢承认自己不确定,后果可能是灾难性的。
与此同时,Salesforce的EDR系统展示了AI智能体的另一个进化方向:从简单的任务执行者,升级为能够像专业分析师团队一样协作的"企业研究大脑"。这个系统包含主规划智能体和四个专业智能体,能够处理复杂的企业研究任务。这不再是单个AI的"单打独斗",而是多个AI的"团队作战",每个智能体都有自己的专长,通过协作完成更复杂的任务。
那么,当AI从"画饼"走向"造血",企业该如何建立科学的AI价值评估体系?在AI诚信成为核心竞争力的时代,我们又该如何平衡AI的"自信"与"诚实"?

今日快讯汇总,请关注落地案例与趋势:
核心趋势摘要
- AI价值评估从"画饼"转向"造血" 企业开始系统复盘AI投入产出,关注AI是否真正创造业务价值,而非停留在技术演示层面。
- 大模型诚信对齐成技术新前沿 中科院团队突破AI诚信对齐难题,仅需千分之一数据让大模型学会"知之为知之",解决AI"胡说"问题。
- 多智能体协作从简单任务走向复杂研究 AI智能体正从单一任务执行者,向能够像专业团队一样协作处理复杂研究任务的方向演进。
革命性突破
- 中科院突破AI诚信对齐 中科院团队提出EliCal框架,通过两阶段训练解决大语言模型诚信对齐难题,仅需0.18%标注数据达到传统方法98%性能,并在未见任务上表现优异。
- 斯坦福ReCAP框架性能提升112.5% 斯坦福和MIT研究团队推出新型AI智能体推理框架ReCAP,在长上下文任务中全面超越主流框架ReAct,通过递归树结构和三大机制提升性能。
- OpenAGI发布Lux基座模型 OpenAGI基金会发布首个"computer-use"基座模型Lux,号称是世界上最好、最快、最便宜的computer-use模型,已通过SDK对外开放。
产业落地加速
- 京东飞猪云知声复盘AI实战账本 企业专家集体复盘AI提效实战,探讨AI从"画饼"到"造血"的转变,关注AI是否真正成为驱动增长的核心引擎。
- Salesforce发布EDR企业深度研究系统 Salesforce AI Research开发EDR系统,这是一个可操控的多智能体AI框架,能像专业分析师团队一样处理复杂企业研究任务。
- 群思AI语音客服线上发布会启幕 群思AI语音客服线上发布会即将启幕,针对医疗、金融、政务等高频服务场景中传统智能客服的局限性,推出AI解决方案。
- 新华网"AI探真"智能体正式上线 新华网联合中国科学技术大学、支付宝共同研发的"AI探真"智能体正式上线,作为我国辟谣领域首个中央主流媒体AI智能体。
- 宁夏银行AI大模型知识库项目招标 宁夏银行发布AI大模型知识库场景建设项目竞争性磋商公告,显示金融行业对AI大模型落地的实际需求。
技术生态进展
- 亚马逊让Agent"长出"手脚 亚马逊云科技在re:Invent上强调AI Agent时代已来,未来将出现数十亿AI Agent,为工作流自动化提供完整解决方案。
- 基于文本AI的终结?Agent协作复制思维 在Agentic AI时代,多智能体系统让AI学会组队协作,Token效率暴涨,推动AI从单一模型向协作系统演进。
- SIEM与数据湖融合演变 安全信息与事件管理(SIEM)市场正经历重大转变,由安全数据湖、数据管道及高级分析平台驱动,从集中式日志管理向智能分析演进。
- AI生成只占10%?工程深海占90% 业界共识浮出水面:在严肃的企业级应用开发中,AI生成或许只占最终成功交付的10%,90%在于工程化、集成与业务流程适配。
资本与市场
- 专访大模型创业公司商业化突围 澎湃新闻专访大模型创业公司,探讨在AI大模型讨论热潮不再的背景下,创业公司如何在商业化中实现突围。
- UiPath股价大涨超8% UiPath股价在盘前交易中上涨超过8%,此前这家自动化软件提供商在第三财季的营收和盈利均超过预期。
- 机器人行业泡沫破灭后的新巨头 36Kr分析机器人行业泡沫破灭后的格局,认为未来具备真正壁垒的机器人企业,会是最早实现"从产品能力到组织资产"转化的企业。
- 卢伟冰:小米AI大模型进展远超预期 小米集团合伙人卢伟冰表示,在AI大模型和应用方面的进展远超预期,显示小米在AI领域的加速布局。
相关新闻源
- 京东、飞猪、云知声、蚂蚁专家复盘,揭秘 AI 提效的 4 本实战账本 | AICon
在企业内部,AI 到底是在“画饼”,还是真的在“造血”?这是当前所有CTO 和业务负责人都必须直面的灵魂拷问。如果AI 仅仅停留在生成一些文案或图片,那它还不足以成为驱动增长...
来源:InfoQ 官网 - 从“会聊天”到“干实事”,亚马逊云科技让Agent“长出了手脚”
美国西部时间12月2日的2025 亚马逊云科技re:Invent上,亚马逊云科技首席执行官Matt Garman在开场演讲中抛出了一个观点:AI Agent时代已来,未来将出现数十亿AI Agent,为...
来源:维科号 - AI时代,CISO正在沦为“首席背锅官”?
人工智能浪潮席卷而至,每个从业者的工作模式都在经历深刻重构。对于首席信息安全官(CISO)而言,这场技术革命所引发的,恐怕是一场前所未有的角色认知危机。
来源:信息化观察网 - SIEM与数据湖的融合演变进化及趋势
安全信息与事件管理(SIEM)市场正经历数十年来最重大的转变之一,这一转变由安全数据湖、数据管道及高级分析平台的兴起驱动。从最初的集中式日志管理,如今已演变为关于"...
来源:安全内参 - 产品发布|群思AI语音客服线上发布会即将启幕,诚邀您莅临!
当前,在医疗、金融、政务等高频服务场景中,传统智能客服的局限性日益凸显,无法感知用户焦虑、无法精准解决需求,因此对AI智能客服的需求尤为迫切。
来源:中华网 - Invent 2025 Swami博士主题演讲:可用、易用、可靠的Agentic AI核心技术路径
亚马逊云科技Agentic AI副总裁Swami Sivasubramanian发表了《Agentic AI的未来已来》主题演讲,以一系列重磅发布正式开启人机协作的Agent新时代!
来源:量子位 - 机器人行业泡沫破灭,谁将崛起成新巨头?
未来具备真正壁垒的机器人企业,会是最早实现“从产品能力到组织资产”转化的企业。
来源:36Kr - OpenAGI 基金会推出号称全球最好的Computer Use 基座模型:Lux - OSCHINA - 开源 × AI · 开发者生态社区
OpenAGI 基金会近日发布了其首个“computer-use”基座模型,名为Lux。官方称它是“世界上最好、最快、最便宜的computer-use 模型”,并且已经通过其SDK 对外开放,因此任何...
来源:OSCHINA - UiPath Stock Surges Over 8% On Strong Revenue and Earnings Estimate
UiPath stock is up 8% in pre-market after the automation software provider beat revenue and earnings estimates in fiscal Q3.
来源:TIKR.com - MNEE:构建下一代数字美元流动性基础设施
探索MNEE USD稳定币如何通过可靠性和透明性解决数字经济中的实际交易问题。
来源:Bitcoin.com News - 专访|当AI走向应用落地,大模型创业公司如何在商业化中突围
在过去三年里,大模型创业公司是科技领域里的明星、宠儿,每家公司的创业故事都曾引发热议。进入2025 年下半年,人工智能大模型的讨论热潮不再,话题则深入到商业应用。
来源:ThePaper.cn - 中国人工智能大会丨吴玮杰:大模型的核心价值在于落地场景的深度适配
来源:东方网11月30日,由中国人工智能学会主办,CAAI智能传媒专委会、新浪新闻联合支持的“人机协同与传播新范式”专题活动在北京落幕。
来源:新浪新闻_手机新浪网 - 让表格会思考,多智能体重构大数据自助分析|AICon 北京
12 月19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会将以“探索AI 应用边界” 为主题,聚焦企业级Agent 落地、上下文工程、AI 产品创新等多个...
来源:InfoQ 官网 - 宁夏银行AI大模型知识库场景建设项目竞争性磋商公告
宁夏银行AI大模型知识库场景建设项目竞争性磋商公告. 移动支付网2025/12/5 8:54:49. 赞( ) 收藏. 展开全文. 文章评论. 还没有人评论过,赶快抢沙发吧! 相关阅读.
来源:移动支付网 - 储能出海"AI新护照"!远景大模型+智能体重构全球竞争规则
人工智能正成为储能出海的“新通行证”, 中国企业凭借技术优势在国际高端.
来源:维科号 - 中科院团队突破AI诚信对齐新难题:仅需千分之一标注数据,让大模型学会"知之为知之"
中科院团队提出EliCal框架,通过两阶段训练解决大语言模型诚信对齐难题。该方法仅需0.18%的标注数据就能达到传统方法98%的性能,并在未见任务上表现优异。
来源:科技行者 - 绿动齐鲁 数智赋能丨海尔“立体化AI”布局:大模型、智能体与终端协同赋能产业创新
12月5日上午,由山东省委网信办主办,中国互联网发展基金会数字碳中和专项基金支持的“'绿'动齐鲁数智赋能”网络名人实践行活动走进海尔科创生态园。
来源:东方财富 - 卢伟冰:在AI大模型和应用方面进展远超预期
12 月4 日消息,小米集团合伙人/ 总裁、手机部总裁、小米品牌总经理卢伟冰昨日在社交媒体发布了答网友问第12集。
来源:飞象网 - GPT周报|AMD计划恢复向中国出口MI308芯片;豆包下线合作款手机AI操作微信功能;可灵发布多模态工具O1
推荐:亚马逊发布新一代大模型Nova 2;DeepSeek发布DeepSeek-V3.2系列模型;理想汽车发布首款AI眼镜.
来源:财新 - 亿道“易道”:All in AI,聚焦端云协同!
在云端强大的算力和数据加持之下,云的智能已经成型,当前AI竞争已从单一模型参数竞赛转向“场景与应用”的生态博弈。因此,国际科技巨头都在推动云端模型向端侧下沉。
来源:电子工程专辑 - 让表格会思考,多智能体重构大数据自助分析|AICon 北京
12 月19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会将以“探索AI 应用边界” 为主题,聚焦企业级Agent 落地、上下文工程、AI 产品创新等多个...
来源:InfoQ 官网 - 押注AI智能体,奇奇科技跨越十年的“换挡”与远航
2025年,中国数字经济正经历从“云原生”向“AI原生”的剧烈变革。国务院印发的《关于深入实施“人工智能+”行动的意见》明确提出,到2027年智能体应用普及率要超过70%。
来源:至顶网 - Salesforce发布EDR:让AI智能体像专业分析师一样做企业深度研究
Salesforce AI Research开发了EDR企业深度研究系统,这是一个可操控的多智能体AI框架,能像专业分析师团队一样处理复杂企业研究任务。系统包含主规划智能体、四个专业...
来源:科技行者 - 首届全球智能机械与电子产品博览会启幕,钛动科技首个出海营销AI智能体亮相_行业动态
12月4日,2025全球智能机械与电子产品博览会(AIE)在澳门与珠海双城启幕,全球逾千家科技企业参展,全方位展示智能机械与电子领域的最新成...
来源:投资界 - 基于文本AI的终结?Agent协作可直接「复制思维」,Token效率暴涨
在Agentic AI 时代,模型不再是独来独往的学霸,而是开始学会组队、一起想问题。多智能体系统(MAS,multi-agent systems)的发展让AI...
来源:新浪网 - AI智能体能为您做什么?
AI agents能够自主设定并推进目标,而非等待反馈或指令,这类技术正从商业应用领域向消费级市场拓展。 这一转变有望重塑购物、医疗健康、金融服务等多个行业。
来源:电子工程专辑 - 储能出海"AI新护照"!远景大模型+智能体重构全球竞争规则
人工智能正成为储能出海的“新通行证”, 中国企业凭借技术优势在国际高端.
来源:维科号 - 全面战胜ReAct!斯坦福全新智能体推理框架 性能提升112.5%
斯坦福和MIT的研究团队推出了一种新的AI智能体推理框架ReCAP,在长上下文任务中全面超越了现有的主流框架ReAct,性能提升显著。ReCAP通过独特的递归树结构和三大机制,...
来源:驱动之家 - 新华网“AI探真”智能体正式上线
12月3日,由新华网联合中国科学技术大学、支付宝共同研发的“AI探真”智能体在企业家博鳌论坛2025新消费发展论坛上正式上线。作为我国辟谣领域首个中央主流媒体AI智能体,...
来源:宁夏新闻网 - AI生成只占10%?数睿数据企业级应用真正含金量在于90%“工程深海”
当业界还在惊叹于AI智能体自动生成应用、执行业务流程的“魔法”时,一个深刻的共识正在浮出水面:在严肃的企业级应用开发中,那看似炫酷的AI生成,或许只占最终成功交付...
来源:中华网




