郑工长

郑工长·AI洞察|2026.06.09·AI高考148分!自主造芯炸裂

发布于 2026年6月8日 | 分类: AI洞察日报

郑工长观点

朋友们好,我是郑工长。

先看一个数字:148分。

这是新京报用高考数学卷实测6款AI大模型时,成绩最高的那个拿到的分数——差2分满分。同一张卷子,成绩最低的模型只拿了91分。同一门考试,同一套题目,最高和最低之间差了57分,等于一个985和一个二本线之间的距离。

但更值得琢磨的不是148分本身,而是这个数字出现的位置:高考。过去两年AI考数学,大家看个热闹。今年不一样——这是第一次有模型几乎满分,同时有模型不及格。

这个反差暴露了一个正在被忽略的事实:AI能力的分化,比你想象的要剧烈得多。

同一张卷子、同一个评分标准,模型之间的差距不是5分10分,是几十分。这意味着什么?意味着今天你选择用哪个模型,已经不只是「哪个更聪明」的偏好问题——它开始变得像「你选哪个老师教孩子高三数学」一样严肃。选错了,结果就差一个档次。

再看另一条新闻:Cadence和英伟达联手发布了全球首个Level-5全自主芯片设计AI工程师。注意关键词——全自主。不是辅助画版图,不是帮你检查DRC,是自己决定芯片架构、自己做布局布线、自己完成时序收敛。硅工干了三十年才能独立负责一个模块,AI用几个月就跨到了「全自主」。

把高考数学和AI造芯放在一起看,一条主线就清晰了:AI从「工具」到「决策者」的切换正在加速。它不再只是给你答案让你自己判断,它开始直接替你交出最终结果——交卷、交设计、交预测。

这才是今天真正值得关注的东西:不是AI有多强,而是我们正在不知不觉中,把越来越多的决策权交了出去,却没来得及建立对应的验收标准。

我的判断:未来一年,「AI输出物验收能力」会变成一项新的核心技能。不是让你去审查每一行代码,而是你要有能力判断「这个结果靠不靠谱」。这种能力现在几乎没有人教,但它正在成为AI时代的必修课。

问题来了:如果你的团队用AI写代码、做设计、出方案,你现在的验收标准是什么?还是直接点了「采纳」?

郑工长每天都在关注AI圈的新闻动态,快讯梳理在下方:

核心趋势摘要

  • AI高考成绩大分化:最高148分差2分满分,最低不及格——同一张卷子,模型差距拉到57分。6款大模型同台竞技,数学压轴题成了真正的分水岭。AI已经不是「行不行」的问题,是「你选哪个」的问题
  • 芯片设计被AI捅破天花板:Cadence发布全球首个Level-5全自主AI芯片工程师。从辅助工具到主设计师,AI在半导体行业完成了一次角色跃迁——硅工们还没反应过来
  • 苹果WWDC亮出Siri AI满血版,但只给最贵的机型用:AI正在变成手机定价的新锚点。iPhone 17 Pro/Air独占,普通iPhone 17用户只能看着——硬件等级直接决定了AI体验等级

技术突破与基础设施

  • 6款大模型挑战高考数学,最高148分,压轴题成了唯一分水岭。新京报实测,基础题各家都满分,一到压轴题差距立刻拉开——逻辑推理和创造性解题能力,仍然是模型之间最硬的差距

  • Cadence联合英伟达发布全球首个全自主芯片设计AI虚拟工程师,自主水平达Level-5。在COMPUTEX 2026上亮相的ChipStack AI Super Agent,不是辅助设计工具,是能独立完成芯片架构到物理设计的「数字硅工」。半导体行业的设计流程,可能从此被重写

  • Kimi拿出300个AI Agent预测世界杯:不是猜输赢,是用多智能体协作模拟完整赛事。36氪报道,Kimi投入300个Agent覆盖104场比赛,每个Agent负责不同维度的数据分析和推演——这不是一次体育预测,是一场AI多智能体协作的公开压力测试

  • 苹果Xcode 27 Beta发布,官方称其为构建AI智能体应用的「最佳场所」。全新Core AI框架同步推出,苹果开始认真搭建自己的AI开发生态——不是追赶OpenAI,是在自己地盘上重新定义AI应用开发标准

  • 英特尔至强6+发布:智能体时代CPU回「C位」,重塑AI推理底座。英特尔的判断很明确:当AI从训练转向Agent大规模部署,CPU在高并发推理场景下的性价比优势正在回归

产业落地加速

  • 苹果WWDC 2026:满血Siri AI仅支持iPhone 17 Pro/Air,普通iPhone 17无缘。不是技术做不到,是商业选择——AI能力正在成为手机产品线的最高溢价锚点。你买的已经不是「内存多大」,是「AI有多聪明」

  • OpenAI将在数周内把Codex整合进ChatGPT:编程AI从「开发者专属」走向「所有人可用」。财联社分析,OpenAI和字节豆包同时押注Codex化路线——AI不再满足于回答你,开始直接帮你干活。从问答到执行,这个切换的商业价值比模型参数翻倍更大

  • 腾讯云副总裁胡利明:金融行业正迈向AI大规模应用的关键节点。AI已从「问答演示」走向「会规划、有记忆、能执行」,金融行业的AI化正在从外围客服渗透到核心风控和投研

  • 同程旅行宣布全面接入微信AI智能体,成为首批OTA接入案例。用户可在微信AI智能体内通过语音或文字直接完成住宿、门票、度假等旅行预订——当AI生态开始接入真实交易,「聊天机器人」和「服务平台」之间的界限正在消失

  • 青岛500余家企业押注特色化大模型:海洋和工业制造成了AI的新战场。不跟北上深卷通用大模型,青岛选择在海洋资源和工业制造场景上做纵深——垂直场景可能是第二波AI落地潮的真正主战场

  • 315晚会曝光AI大模型「投毒」黑产后续:39.9元就能篡改AI给你的答案,GEO技术被玩成了「AI时代的假新闻工具」。央视锐评:GEO本身只是工具,但「歪嘴和尚念错经」——AI时代的信任问题,不是技术能单独解决的

  • 「AI中转站」被国家安全部点名:你用来翻墙访问大模型的服务,可能正在收集你的每一次提问。批量提供海外大模型访问服务的平台正在国内走红,安全边界几乎为零

资本与市场

  • 云知声发布U2大模型,喊出「生产力AI」概念,行业迎来定价逻辑重构。此前大模型行业盲目堆砌参数,带来高成本与部署门槛。云知声反其道而行,主打「中小场景可用」——大模型市场正在从「参数竞赛」转向「能用性竞赛」

  • 阿里巴巴升级大模型组织架构,成立Token Foundry事业部。组织调整往往是战略转向的先行指标——阿里把AI资源从「部门级」升级到「事业群级」,背后的决心不言自明

  • 海外涨、国内守:AI收费双轨制正在成为行业常态。OpenAI海外推Codex整合提价,国内豆包等应用跟进付费模式——全球AI市场正在同步完成从「免费圈地」到「付费留存」的切换

  • AI写代码飞快、架构却烂透了:技术债正在以AI速度累积。51CTO发出的警告很直接——开发效率提升的同时,代码质量和架构合理性正在被牺牲。AI帮你写完的代码,三年后可能让你加倍偿还


相关新闻源