郑工长

Google Chrome大动作!AI将直接“上网”,Web3.0还有人类的事吗?

发布于 2026年2月11日 | 分类: AI随心分享

Google Chrome大动作!AI将直接“上网”,Web3.0还有人类的事吗?

你好,我是郑工长。

最近Google Chrome的一个内部消息,让我感到一丝兴奋,也夹杂着一丝不安。Chrome正在重构其Agent交互层,也就是WebMCP(Web Multi-modal Control Protocol)。简单来说,就是未来AI Agent将能够直接操控浏览器,而不是像现在这样通过模拟人类的点击、输入来间接操作。一个看似寻常的技术升级,背后却隐藏着对整个Web形态和人机交互模式的颠覆:Web将从“被阅读”向“被执行”的范式转移,Web3.0可能比我们想象的更早到来。但问题是,Web3.0里,还有人类的事吗?

从工程学的视角来审视,这背后是一条关于Web协议进化的铁律:

当“信息孤岛”被“AI连接器”打通时,Web的边界将被无限拓宽。AI直接操控浏览器,意味着Web从“被阅读”向“被执行”的范式转移,这不仅仅是自动化,更是Web协议本身的进化。

我们先看现在的Web。无论多么智能的AI,想要在Web上执行任务,都离不开模拟人类行为:通过Selenium、Playwright等工具模拟鼠标点击、键盘输入、等待页面加载。这是一个“AI模拟人”的过程。这本身就引入了复杂性,也限制了AI的效率和能力。

但当AI直接操控浏览器,就完全不一样了。

  • 从“所见即所得”到“所知即执行”: AI不再需要通过视觉识别来理解网页元素,而是可以直接读取网页的DOM结构、语义信息,甚至可以与网页背后的服务直接进行API级别的交互。它“知道”这个按钮是用来干什么的,而不是“看到”一个按钮然后点击。这让AI能够更高效、更精准地完成任务。
  • Web的“信息孤岛”被打破: 现在的网页,数据往往是散落在各个标签和API接口中,AI Agent需要复杂的编排才能整合信息。WebMCP的重构,可以想象成在浏览器层面提供了一个统一的“AI连接器”,让AI Agent可以更高效、更精准地获取和操作数据,打破了Web上的“信息孤岛”。
  • Web3.0的加速器: Web3.0强调去中心化、用户数据自主权和智能合约。当AI Agent能够直接、自主、高效地在Web3.0的协议层上进行操作,例如执行交易、管理数字资产、参与DAO治理时,Web3.0的生态将得到极大的加速和丰富。

那么,Web被AI直接操控后,人类的角色又在哪里?这是否意味着我们离不开浏览器,也离不开这些便利的服务?从工程上看,这要求Web开发者从“面向用户UI设计”转向“面向Agent API设计”。未来的Web服务,不仅要考虑如何让人用得舒服,更要考虑如何让AI Agent用得高效。人类将从“直接操作者”变为“AI Agent的设计者、管理者和监督者”。我们可能不再亲自去“搜索、点击、填写”,而是设计一个Agent,让它去Web上替我们完成这些任务,然后我们只需审核结果。

面对AI直接操控浏览器的趋势,你是选择成为这个新Web世界的“设计师”,还是被AI Agent“代劳”的旁观者?你的答案是什么?