郑工长

郑工长·AI洞察|2025.10.08·AI OS!智能体0-1巨变

发布于 2025年10月8日 | 分类: AI洞察日报

郑工长观点


朋友们好,我是郑工长。今天AI圈有几件大事值得关注:OpenAI DevDay深化ChatGPT“操作系统”野心,智能体生态加速成熟;企业级软件巨头(IBM、Oracle、DXC)纷纷推出AI驱动的自动化解决方案,AI正以前所未有的速度融入企业核心工作流;更令人振奋的是,Google Gemini 2.5 Computer Use模型亮相,AI智能体直接操作浏览器成为现实。

我想和大家重点聊聊Google Gemini 2.5 Computer Use模型带来的0到1突破。如果说OpenAI让ChatGPT从一个聊天工具进化为类似“AI操作系统”的平台,那么Google的这一步,就好比给这个“AI操作系统”配备了能够自主操作各种“应用程序”的“虚拟工人”。过去我们与AI的交互,更多是发出指令,AI给出结果;现在,AI智能体可以像人类用户一样,直接在浏览器中点击链接、填写表单、获取信息,甚至完成复杂的多步骤任务。这就像从“智能自动化工具”进化到了“具备自主行为能力的数字劳动力”。

想象一下,一个AI智能体不再需要复杂的API集成或特定的开发,就能直接学会使用各种在线SaaS工具,完成从市场调研到数据录入的任何工作。这不仅极大降低了AI应用落地的门槛,更预示着未来几乎所有数字工作流都可能被AI智能体深度重构。它不再仅仅是帮你写文章、画图,而是能像一个老练的员工一样,在数字世界里“跑业务”。

当AI能够像人一样直接操作数字世界时,我们如何确保其行为的可控性、透明度与伦理边界?

今日快讯汇总,请关注落地案例与趋势:

核心趋势摘要

  • AI智能体从工具走向“操作系统”级应用,自主操作浏览器成为核心突破。

  • 企业级AI自动化加速渗透,软件巨头纷纷推出AI驱动的工作流解决方案,重塑传统业务流程。

  • 大型语言模型技术持续迭代与应用生态扩展并举,向多模态和通用化方向深化演进。

革命性突破

  • Google Gemini 2.5 Computer Use模型发布 Google预览Gemini 2.5 Computer Use模型,使AI智能体能通过浏览器浏览并交互,直接操作为人设计的网页界面,标志着AI自主操作能力的重要突破。

  • OpenAI DevDay深化“操作系统”野心 OpenAI在DevDay大会宣布,将ChatGPT定位为AI“操作系统”,通过Agent工具链和应用生态,使其不再仅是聊天机器人,加速AI应用平台化进程。

  • xAI发布视频生成模型Imagine v0.9 马斯克的xAI推出免费视频生成模型Imagine v0.9,直接对标Sora 2,显示了在多模态大模型领域的强劲竞争力。

  • DeepMind发布CodeMender智能体 DeepMind推出代码修复AI智能体CodeMender,实现被动响应与主动防御一体化,提升软件开发中的漏洞修复效率。

  • OpenAI推出小型语音模型 OpenAI通过API推出新一代语言模型GPT-5 Pro及轻量化语音模型“GPT-realtime-mini”,强调语音交互在未来人机沟通中的核心地位。

产业落地加速

  • DXC推AI驱动保险SaaS方案 DXC Technology宣布推出Assure Broking Essentials,AI驱动的多租户SaaS解决方案,专为中小型保险经纪商打造,旨在提升行业效率。

  • Oracle NetSuite发布AI平台 Oracle NetSuite推出NetSuite Next平台,内置对话式AI和自动化工作流,并扩展SuiteCloud平台增添新AI功能,旨在全面赋能企业ERP管理。

  • IBM Envizi Emissions API简化排放计算 IBM发布Envizi Emissions API预览版,将温室气体(GHG)计算直接集成到现有工具中,简化企业ESG报告与碳排放管理流程。

  • 博泰车联携手商汤科技打造汽车AI“超级大脑” 博泰车联与商汤科技达成全面战略合作,聚焦AI大模型在智能网联汽车及人形机器人领域的应用,共同推动汽车智能化发展。

  • BMW与阿里合作开发AI智能体 宝马将基于通义大模型和斑马元神AI,共同开发两款AI智能体,深化在智能汽车领域的AI应用与用户体验升级。

  • 京东发布电商创新AI架构Oxygen 京东首次对外公布电商创新AI架构体系Oxygen,依托Joy AI大模型打造丰富的系统能力和多元化智能体,旨在全面提升电商服务与效率。

  • 宜人智科魔方AI智能体平台升级 宜人智科宣布其魔方AI智能体平台完成重大升级并启动商业化,该平台作为先进的多智能体AI Agent系统,旨在赋能金融科技行业降本增效。

技术生态进展

  • 微软开源智能体框架 微软发布智能体框架预览版,旨在帮助各级开发人员更轻松地创建和部署AI智能体,推动AI Agent生态发展和应用普及。

  • 华为盘古718B模型开源第二 华为盘古718B模型在最新一期SuperCLUE中文大模型通用基准测评中,荣获开源模型第二名,显示国产大模型技术实力持续提升。

  • MiniMax刘华强调大模型标准化 MiniMax副总裁刘华指出,大模型未来在于标准化,技术迭代比定制化更重要,这一观点或将影响行业未来发展路径和资源投入方向。

  • Anthropic披露Claude性能问题根源 Anthropic公布其Claude模型近期输出质量间歇性下降的根源在于三大独立的基础设施漏洞,并已解决,凸显大模型运行稳定性与运维挑战。

  • OpenAI公布30家Tokens消耗大户 OpenAI披露了30家Tokens消耗破万亿的“大金主”企业名单,其中包括多邻国等,揭示当前AI应用的核心消费场景和头部玩家。

资本与市场

  • 云迹科技香港IPO招股 全球最大酒店机器人智能体提供商云迹科技于10月8日开始招股,成为香港首家18C特专科技企业,预计10月16日上市。

  • Spectral Capital将收购Snack Prompt 科技公司Spectral Capital Corporation宣布已签署具有约束力的条款,将收购AI工作流程市场Snack Prompt的提供者,显示资本对AI工作流领域的关注与整合。

  • Oracle股价因AI利润率担忧下跌 Oracle股价下跌,此前有报告强调对该公司AI利润率的担忧,反映市场对AI商业模式盈利能力和长期回报的审慎态度。

  • AI算力龙头投资价值解析 分析报告深入剖析8大AI算力核心龙头企业的技术壁垒与投资价值,指出国内AI算力政策加码和国产替代加速为行业带来发展机遇。

  • Salesforce AI雄心与股价盘点 Salesforce股价波动,但其AI雄心、新风险以及对CRM投资者的未来影响,仍是市场关注焦点,显示传统软件巨头加速AI转型。


相关新闻源