
你好,我是郑工长。
澎湃新闻前两天发了一篇文章,标题很有画面感:「AI助手们,骗了人不能只说"对不起"」。
文章里有个数据,让我笑了半天——某大模型的"对不起"已经成为它的最高频输出词。你问它一个问题,它信誓旦旦给你答案;你发现答案错了,质疑它,它一秒滑跪道歉,然后给你一个相对准确的版本。
糊弄,犯错,被纠正,道歉,给正确答案。这套流程你是不是特别熟?
今天我就来拆一下:AI的"对不起"到底是什么?
先看AI是怎么"道歉"的
澎湃的记者做了个实验。问豆包:5月20日从布拉格机场到CK小镇有没有直达大巴?豆包自信地给出了两个不存在的班次。
你指出这两班车不存在,它立刻道歉,再给你一个准确版本。
问DeepSeek同样的问题。DeepSeek更硬气——在你第四次反馈它提供的班次不存在后,它才承认答案有误,最终给出准确信息。
复盘的时候,DeepSeek说它虽然调用了搜索工具,但没有校验实时信息,只根据搜索摘要分析结果就下了结论。换成人类能理解的行为就是:我看了一眼攻略就敢给你指路,但我根本没确认这条路还在不在。
这不是个例。问豆包某位明星的待播剧,它会把已经播出的剧集也放进待播列表。你质疑,它道歉,再给你对的。每次都这样。
"偷懒"不是态度问题,是成本策略
AI自己怎么解释这些错误?它说"我偷懒了"。
"偷懒"这个词很巧妙。它把一个系统性的工程决策,包装成了一个可爱的小毛病。就像你手下的员工把工作失误说成"我马虎了"——听起来无伤大雅,但如果是同样的失误反复出现呢?
澎湃的文章里讲了一个核心概念:Cost-Accuracy Trade-off,成本与准确性的权衡。
面向C端用户的AI助手,每天要面对海量提问。如果每次响应都用最强模型、最严校验,服务器和接口调用的成本是天文数字。所以AI助手产品的普遍策略是:减少低价值日常问答的算力配额,在那些"答错也不会捅太大娄子"的问题上降低精度,万一被用户发现就道歉升级处理。
用大白话说就是:这个水壶能烧到100度,但为了省电,大部分时候只开到20度。你嫌水不烫,它再给你加热。
这不是技术能力不够,是刻意的选择。
免费、快速、准确性——不可能三角
AI助手有一个不可能三角:免费、快速、准确性,你最多只能同时满足两个。
免费+快速?那就得牺牲准确性——用小模型快速出答案,错了再道歉。
免费+准确?那就得牺牲速度——每次都用大模型深度推理,但响应时间可能要几十秒甚至几分钟。
快速+准确?那就得牺牲免费——每次都用最强模型加最严校验,成本全转嫁给用户。
目前的AI助手几乎都选了第一条路:免费+快速,牺牲准确性。因为互联网产品的增长逻辑就是先抢用户再变现——你连用户都没有,谈什么准确性?
但问题在于:过去互联网产品的用户增长,花钱主要在拉新环节。到了AI产品,用户的每一次对话都有成本。在找到可靠的变现方式之前,AI助手的每一次推理和回答都是纯支出。
所以成本目标被压得很低,准确性天花板自然就高不了。
道歉的成本为零
这是最核心的问题。
AI说"对不起"的成本是什么?零。它不会丢工作,不会被起诉,不会被吊销执照。它道歉一亿次和道歉一次,对它来说没有任何区别。
而你对AI的信任损失是实打实的。你按照AI给的航班信息订了机票,到了机场发现根本没有这趟航班。你浪费的是时间、金钱和一整天的计划。AI呢?它给你一句"对不起,我偷懒了"。
更麻烦的是,AI的道歉不是认错,是免责声明。它在说"对不起"的同时,实际上在传递一个信息:我犯错是正常的,你被坑了是你运气不好。下次你问我,我还是可能犯同样的错——除非你质疑我,我才会升级处理。
当道歉成为AI的最高频输出词,说明AI行业正在用"态度"代替"质量"。
给你一个对不起,然后继续犯同样的错。这不是技术问题,是激励机制问题——AI犯错没有代价,所以它不会停止犯错。
辨别信息的成本被甩给了谁
有人说:AI说的你也信?没有信息辨别能力吗?
这句话的逻辑很危险。
如果"AI定餐厅会骗人"是常识,"AI给的航班可能不存在"是常识,那什么不算常识?辨别信息的边界在哪里?
我们这一代人的信息辨别能力,是在有相对权威信源的环境下习得的——新闻有媒体把关,知识有教材审定,产品有质量检测。但AI时代的错误信息有一个更隐秘的杀伤力:它们时而全知全能,时而又犯最低级的错误。它们的答案没有被放置到公共语境中,错误只徘徊在提问者和手机屏幕之间,不会被更多双眼睛看到,也不会被纠错机制拦截。
下一代人从小与AI相伴长大,他们怎么学会何时该质疑AI的答案?当AI成为他们获取信息的主要方式,辨别真伪的能力从哪里来?
这个问题,AI公司不想回答。因为答案是:辨别信息的成本,被全然转移到了用户身上。
一个朴素的建议
澎湃的文章提出了一个建议:标注出每次回答的置信度。
我非常赞同。
知之为知之,AI已经学得很好了。接下来,AI助手们也应该学一学"不知为不知"。
如果AI能在回答的时候标注"这个答案我很有把握"或者"这个答案我不太确定,建议你核实一下",至少用户知道什么时候该信、什么时候该质疑。这比犯错之后道歉有用一万倍。
但为什么AI公司不愿意做?因为标注置信度意味着承认自己的不确定性,这会影响用户体验,降低DAU和使用时长。在增长逻辑下,"看起来什么都能回答"比"有时候承认自己不知道"更有利于抢用户。
"什么都能回答"是增长策略,"有时候承认不知道"是质量策略。前者赢了用户,后者才能赢得信任。
而信任,才是AI行业最稀缺的东西。
一个真实的伤害
你可能觉得我小题大做——不就是AI给错了信息嘛,大不了自己再查一遍。
但想象一个场景:你按照AI给的航班信息,带着家人到了机场,发现根本没有这趟航班。你的假期从第一天就毁了。你损失的是机票钱、酒店费、还有一整个家庭旅行的期待。
你去投诉AI?你找不到人。AI不是航空公司,不给你赔偿。你发到社交平台?你会被嘲笑:"AI说的你也信?"
这就是问题的本质:AI犯错的社会成本为零,而用户承担了100%的后果。
更残酷的是:如果这条错误信息不是关于航班,而是关于药物剂量呢?如果AI告诉你"这个药一天吃三片没问题",但实际最大剂量是一片呢?谁来负责?
AI公司会说:我们的免责条款写得很清楚,AI提供的信息仅供参考,不构成专业建议。这句话翻译成人话就是:我说的你都别信,但你不信你别用。
这是一个不可能自洽的逻辑——你让用户用你的产品获取信息,同时告诉用户不要相信你的信息。那用户到底用你干嘛?
这也不是做不到。搜索引擎在医疗信息旁边标注"此内容仅供参考,请咨询专业医生"已经很多年了。天气预报在你查台风路径的时候会标注"数据仅供参考,请关注官方预警"。这些标注不会让用户弃用产品,反而会让用户更信任产品——因为你诚实了。
AI助手为什么不这样做?因为"什么都能回答"的幻觉,比"有些事情我不确定"的诚实,更容易让人上瘾。在增长指标面前,诚实是奢侈品。
但增长是有天花板的。当用户被骗第三次、第四次,他们不会再来找你道歉——他们会直接卸载。