
你好,我是郑工长。
今天这篇文章,建议所有在企业里拍板采购AI工具的人认真看完。
最新研究报告显示了一个触目惊心的数字:63.6%的AI供应商,在客户协议中没有披露第三方AI分包处理方。
翻译成人话——你花了十几万甚至上百万买了一套AI服务,签了合同、过了法务、做了数据安全评审。但你的企业数据,正在被转手发给合同里根本没写过的其他AI模型。而那些模型的数据保护水平、安全标准、使用条款,你一无所知。
这不是漏洞。这是行业默许的潜规则。
还原一下这个场景。你是某家公司的IT负责人,公司决定采购一套AI客服系统。供应商给你看了产品演示,功能强大,价格合理。法务审了合同——数据安全条款有十几页,写得清清楚楚。你签了字,付了款,觉得稳妥了。
但实际发生了什么?
这家AI供应商自己底层调用的是另一家大模型公司的API,这是第一层转手。而那家大模型公司,负载过高的时候又自动把部分请求桥接到了另一家开源模型部署商,这是第二层转手。你的客户问题、业务数据、内部对话记录,就这样穿过三层数据通道,每一层都在你不知道的地方运行。
而你签的那份合同里,数据安全条款只覆盖了第一层。
问题出在AI产业的结构性特征上。今天的AI产品几乎没有一个是从零开始自研全套的。做应用层的在调用大模型API,做大模型API的在用开源基座做微调,做开源基座的训练数据可能来自公开互联网。每一层都在调用下一层,每一层都有数据在流转。但合同、信任、安全审查,只覆盖了最表面那一层。往下的每一层,都是你签了字但看不见的灰色地带。
而这个灰色地带,才是真正的问题所在。
报告揭示的63.6%这个数字不是偶然——它说明大多数AI供应商都在刻意这么做。不是"忘了披露",是"选择不披露"。因为一旦披露,对话就会变成这样:
客户问:除了你们,还有哪些模型能接触到我的数据?
供应商答:这个……我们的技术架构涉及多个底层服务商。
客户问:他们和我签了同样的保密协议吗?
供应商答:呃,他们有自己的安全政策。
客户问:那我的数据会被用来训练他们的模型吗?
供应商答:我们会在合理范围内确保……(含糊其辞)
这个对话一旦发生,订单就有黄掉的风险。不披露,大家就都装作不知道,生意继续做。这就是AI行业的"信任套利"——利用信息不对称,让客户以为自己的数据只被一家公司处理,实际上被转手了多次。
这让我想起建筑行业的层层转包。你签合同找了一家总包公司建楼,结果总包把工程分给三个分包,分包又把一部分转给更小的施工队。等楼出了问题,总包说这是分包的活,分包说这是施工队的责任,你拿着合同站在工地中间,谁都告不了。AI供应链今天正在复刻这个剧本,只不过建筑材料从钢筋水泥变成了你的企业数据。
但AI供应链的转包比建筑转包可怕十倍——因为数据是不可回收的。
房子建歪了可以拆了重建。数据一旦被发送给第三方的模型,你永远没办法把它"追回来"。它可能被记录、被缓存、被用作训练数据。你的客户信息、商业策略、内部文档,可能会变成某个模型训练集的一部分——而那个模型的下一个客户,可能是你的竞争对手。你花钱买了服务,结果你的数据变成了别人产品的一部分。这不是阴谋论,是AI行业的已知风险。
据我所知,一些大型企业在采购AI服务时已经开始加码——要求供应商提供完整的数据处理链图谱,明确标注每一层调用了哪个模型、部署在哪个地区、用什么方式加密。但能做到这一点的供应商凤毛麟角。大多数供应商的回答是:"我们的架构比较复杂,没法详细列出来。"
这不是技术问题,是意愿问题。
更深层的问题是:为什么AI供应商没有动力去解决数据供应链透明度?
答案藏在商业逻辑里。AI供应商之所以能保持有竞争力的定价,很大程度上是因为他们自己在做"模型套利"——哪个模型便宜就用哪个,哪个模型效果好就切到哪个,今天用OpenAI,明天换Claude,后天试试国产模型。这种灵活切换的能力是它们竞争力的核心,但同时也意味着数据流向是一个动态变化的黑盒。一旦要求每一层都透明、每一层都签约、每一层都做数据合规审计,这种灵活性就没了,成本也会翻倍。
所以AI供应商面对的是一个典型的商业两难:要么保持黑箱,维持低成本和高灵活性,但承担信任风险;要么打开黑箱,做数据合规,但成本上升、失去灵活性。
目前,大多数选择了前者。63.6%的沉默率就是答案。
这个现象在别的行业也有前车之鉴。十年前,食品行业面临类似的信任危机——消费者不知道餐盘里的食材来自哪里、经过哪些加工环节、有没有添加不该添加的东西。解决办法是什么?食品溯源体系。从农田到餐桌,每一环节的信息都被记录并可查询。如今,食品供应链透明化已经成为一个成熟产业,消费者扫码就能看到一颗苹果从采摘到上架的全过程。
AI数据供应链需要的也是同样的逻辑——不是"相信我们",而是"让我们能看到"。不能溯源的数据处理流程,和不能溯源的食品供应链一样,本质上都是黑箱。而黑箱,迟早会出事。
但这个选择不会一直维持下去。当越来越多的企业因为数据被转手而遭遇安全事件,供应链透明度就会从一个"可选项"变成"准入门槛"。事实上,这个转变已经在发生——欧盟的AI法案正在把供应链透明度写入法律要求,中国的数据出境安全评估也在收紧。合规压力不是未来时,是现在进行时。
那么作为采购方,现在应该怎么做?
三个动作,马上就可以做。
第一,在采购合同里加一条"次级处理方披露条款"。明确要求供应商书面披露所有可能接触到你数据的第三方、第四方模型服务商,并明确每一层的数据安全责任归属。如果供应商说"这是商业机密不能告诉你",正确的回应是:连谁在看我的数据都不说,凭什么让我签?
第二,索要第三方安全审计认证。不要只看供应商自己写的安全白皮书——那叫宣传材料。要看独立的第三方审计结果。SOC 2 Type II、ISO 27001、等保三级——至少有一项。如果一个AI产品连这些基础认证都没有,说明它连"被审查"的流程都没走过。你愿意把数据交给一个从没被审查过的系统吗?
第三,要求数据调用日志可追溯。对于核心业务场景,采购合同中应要求供应商提供API调用日志,清晰记录每一次请求中数据经过了哪些节点、被哪个模型处理、是否被缓存或存储。如果供应商说"技术上做不到",那说明他们的架构本身就不具备数据追踪能力——这正是问题所在,而不是问题的借口。
最后说一下我的判断。
AI行业现在正处于一个非常微妙的转折点。一方面,模型能力的提升让企业跃跃欲试,AI采购预算在快速增长。另一方面,数据治理的漏洞让先行者成为了小白鼠。63.6%这个数字不会一直被掩盖——当越来越多企业因为数据被转手而爆出安全事件,它就会从行业秘闻变成公共话题。
到那时,那些今天选择"不披露"的供应商,会发现自己面临两难:要么补上透明度的课,成本上升;要么被市场淘汰,丧失竞争力。而那些今天就把数据供应链合规做在前面的公司,会在下一波信任红利中占据优势。
AI供应链的透明度不是合规成本,是信任存款。今天不存,明天取不出来。
还有一个被大多数人忽略的角度:AI供应商自己其实也希望行业透明化。道理很简单——当整个行业都在"偷偷转手",那些真正做好数据合规的公司反而因为成本高而在价格竞争中处于劣势。这是一种典型的"劣币驱逐良币"。透明化不是对谁的惩罚,是让良币不再吃亏。一个透明的市场,会把选择权还给买家,让合规者不再独自承担合规成本。
所以,推动AI供应链透明化的最大动力,未必来自监管,而是来自市场上那些真正想做长期生意的AI供应商——他们比任何人都希望这个行业走出灰色地带。
你的企业采购AI服务时,问过供应商"我的数据还会被哪些模型看到"这个问题吗?如果没有,下一次签合同之前,加上这一条。





