郑工长观点
朋友们好,我是郑工长。
先看一个数字:148分。
这是新京报用高考数学卷实测6款AI大模型时,成绩最高的那个拿到的分数——差2分满分。同一张卷子,成绩最低的模型只拿了91分。同一门考试,同一套题目,最高和最低之间差了57分,等于一个985和一个二本线之间的距离。
但更值得琢磨的不是148分本身,而是这个数字出现的位置:高考。过去两年AI考数学,大家看个热闹。今年不一样——这是第一次有模型几乎满分,同时有模型不及格。
这个反差暴露了一个正在被忽略的事实:AI能力的分化,比你想象的要剧烈得多。
同一张卷子、同一个评分标准,模型之间的差距不是5分10分,是几十分。这意味着什么?意味着今天你选择用哪个模型,已经不只是「哪个更聪明」的偏好问题——它开始变得像「你选哪个老师教孩子高三数学」一样严肃。选错了,结果就差一个档次。
再看另一条新闻:Cadence和英伟达联手发布了全球首个Level-5全自主芯片设计AI工程师。注意关键词——全自主。不是辅助画版图,不是帮你检查DRC,是自己决定芯片架构、自己做布局布线、自己完成时序收敛。硅工干了三十年才能独立负责一个模块,AI用几个月就跨到了「全自主」。
把高考数学和AI造芯放在一起看,一条主线就清晰了:AI从「工具」到「决策者」的切换正在加速。它不再只是给你答案让你自己判断,它开始直接替你交出最终结果——交卷、交设计、交预测。
这才是今天真正值得关注的东西:不是AI有多强,而是我们正在不知不觉中,把越来越多的决策权交了出去,却没来得及建立对应的验收标准。
我的判断:未来一年,「AI输出物验收能力」会变成一项新的核心技能。不是让你去审查每一行代码,而是你要有能力判断「这个结果靠不靠谱」。这种能力现在几乎没有人教,但它正在成为AI时代的必修课。
问题来了:如果你的团队用AI写代码、做设计、出方案,你现在的验收标准是什么?还是直接点了「采纳」?
郑工长每天都在关注AI圈的新闻动态,快讯梳理在下方:
核心趋势摘要
- AI高考成绩大分化:最高148分差2分满分,最低不及格——同一张卷子,模型差距拉到57分。6款大模型同台竞技,数学压轴题成了真正的分水岭。AI已经不是「行不行」的问题,是「你选哪个」的问题
- 芯片设计被AI捅破天花板:Cadence发布全球首个Level-5全自主AI芯片工程师。从辅助工具到主设计师,AI在半导体行业完成了一次角色跃迁——硅工们还没反应过来
- 苹果WWDC亮出Siri AI满血版,但只给最贵的机型用:AI正在变成手机定价的新锚点。iPhone 17 Pro/Air独占,普通iPhone 17用户只能看着——硬件等级直接决定了AI体验等级
技术突破与基础设施
-
6款大模型挑战高考数学,最高148分,压轴题成了唯一分水岭。新京报实测,基础题各家都满分,一到压轴题差距立刻拉开——逻辑推理和创造性解题能力,仍然是模型之间最硬的差距
-
Cadence联合英伟达发布全球首个全自主芯片设计AI虚拟工程师,自主水平达Level-5。在COMPUTEX 2026上亮相的ChipStack AI Super Agent,不是辅助设计工具,是能独立完成芯片架构到物理设计的「数字硅工」。半导体行业的设计流程,可能从此被重写
-
Kimi拿出300个AI Agent预测世界杯:不是猜输赢,是用多智能体协作模拟完整赛事。36氪报道,Kimi投入300个Agent覆盖104场比赛,每个Agent负责不同维度的数据分析和推演——这不是一次体育预测,是一场AI多智能体协作的公开压力测试
-
苹果Xcode 27 Beta发布,官方称其为构建AI智能体应用的「最佳场所」。全新Core AI框架同步推出,苹果开始认真搭建自己的AI开发生态——不是追赶OpenAI,是在自己地盘上重新定义AI应用开发标准
-
英特尔至强6+发布:智能体时代CPU回「C位」,重塑AI推理底座。英特尔的判断很明确:当AI从训练转向Agent大规模部署,CPU在高并发推理场景下的性价比优势正在回归
产业落地加速
-
苹果WWDC 2026:满血Siri AI仅支持iPhone 17 Pro/Air,普通iPhone 17无缘。不是技术做不到,是商业选择——AI能力正在成为手机产品线的最高溢价锚点。你买的已经不是「内存多大」,是「AI有多聪明」
-
OpenAI将在数周内把Codex整合进ChatGPT:编程AI从「开发者专属」走向「所有人可用」。财联社分析,OpenAI和字节豆包同时押注Codex化路线——AI不再满足于回答你,开始直接帮你干活。从问答到执行,这个切换的商业价值比模型参数翻倍更大
-
腾讯云副总裁胡利明:金融行业正迈向AI大规模应用的关键节点。AI已从「问答演示」走向「会规划、有记忆、能执行」,金融行业的AI化正在从外围客服渗透到核心风控和投研
-
同程旅行宣布全面接入微信AI智能体,成为首批OTA接入案例。用户可在微信AI智能体内通过语音或文字直接完成住宿、门票、度假等旅行预订——当AI生态开始接入真实交易,「聊天机器人」和「服务平台」之间的界限正在消失
-
青岛500余家企业押注特色化大模型:海洋和工业制造成了AI的新战场。不跟北上深卷通用大模型,青岛选择在海洋资源和工业制造场景上做纵深——垂直场景可能是第二波AI落地潮的真正主战场
-
315晚会曝光AI大模型「投毒」黑产后续:39.9元就能篡改AI给你的答案,GEO技术被玩成了「AI时代的假新闻工具」。央视锐评:GEO本身只是工具,但「歪嘴和尚念错经」——AI时代的信任问题,不是技术能单独解决的
-
「AI中转站」被国家安全部点名:你用来翻墙访问大模型的服务,可能正在收集你的每一次提问。批量提供海外大模型访问服务的平台正在国内走红,安全边界几乎为零
资本与市场
-
云知声发布U2大模型,喊出「生产力AI」概念,行业迎来定价逻辑重构。此前大模型行业盲目堆砌参数,带来高成本与部署门槛。云知声反其道而行,主打「中小场景可用」——大模型市场正在从「参数竞赛」转向「能用性竞赛」
-
阿里巴巴升级大模型组织架构,成立Token Foundry事业部。组织调整往往是战略转向的先行指标——阿里把AI资源从「部门级」升级到「事业群级」,背后的决心不言自明
-
海外涨、国内守:AI收费双轨制正在成为行业常态。OpenAI海外推Codex整合提价,国内豆包等应用跟进付费模式——全球AI市场正在同步完成从「免费圈地」到「付费留存」的切换
-
AI写代码飞快、架构却烂透了:技术债正在以AI速度累积。51CTO发出的警告很直接——开发效率提升的同时,代码质量和架构合理性正在被牺牲。AI帮你写完的代码,三年后可能让你加倍偿还
相关新闻源
-
好用的GEO工具推荐
AI 搜索正在重塑用户获取信息与品牌决策的路径产品概览苦瓜科技推出的HapiClaw定位于AI 搜索时代的GEO 自动化营销系统,核心主张为“让...
来源:中华网 -
快鹭参展AI+ Power 2026,快鹭Claw、AI领域专家让企业拥有数字员工
Agentic AI 正从概念走进产业落地。6 月4日至5 日,快鹭科技参展香港极具规模的商业化AI 展会——AI+ Power 2026 。该展会作为全球AI技术与方案交流的关键窗口,汇聚...
来源:中国报业 -
通过动力学匹配的共还原反应,实现了InSb量子点的自动化合成,并显著提高了批次间的重复性
摘要锑化铟(InSb)胶体量子点(CQDs)是一种无重金属的红外光检测吸收材料,但其合成过程仍具有挑战性,因为前驱体的还原过程与量子点的成核和生长过程同时发生,这阻碍了...
来源:生物通 -
AI写代码飞快,架构却烂透了,这可能是技术债爆炸的前兆
AI正在悄然改写软件开发规则:开发者从编写代码转向管理和编排AI,软件交付速度空前提升,然而,真正的挑战并非效率,而是信任。
来源:51CTO -
拿“ Codex”当馅儿,豆包才值钱
(来源:字母榜) OpenAI刚刚给字节上了一课。 据《金融时报》披露,OpenAI正准备对ChatGPT进行自2022年推出以来规模最大的改版。
来源:新浪财经 -
Cadence携手英伟达发布业界首位全自主芯片设计AI虚拟工程师
IT之家6 月9 日消息,Cadence(楷登)在COMPUTEX 2026 台北国际电脑展上宣布,在NVIDIA(英伟达)的支持下,其ChipStack AI Super Agent 自主水平已达Level-5 级别,成为业界首...
来源:凤凰网 -
300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验
德国爆冷夺冠! 看到Kimi这份世界杯预测报告,很多球迷第一反应大概率是:这AI能懂球吗? 毕竟,足球比赛最有意思的地方就在于随机。强队会翻车,弱队会爆冷。
来源:36Kr -
Agent工程化五件套:Prompt、Skill、MCP、CLI到底如何协同?
过去一年,业界对Agent的探索持续升温。从智能客服到代码助手,从知识库问答到自动化运营助手,各类Agent应用不断涌现。然而,当项目从Demo走向生产环境时,许多团队发现了...
来源:积墨 AI -
在美国硅谷深度考察一周后,我看清了中国 AI 该怎么走
这次的Summit 是Snowflake 办过最大的一届——现场两万多人,七百多位演讲嘉宾、五百多场分论坛。主题为: Making AI Real for Business(让AI 在业务里真的有用)。
来源:Infoq.cn -
AI公司CEO抄袭自媒体作者文章,揭示AI赋能与一人公司的本质问题
近日一篇来自微信公众号的文章指出,某AI应用公司CEO的视频号内容高度复刻了作者两天前的文章。作者推测该视频系员工用AI工具制作。事件暴露出AI工具虽然能提升效率但...
来源:虎嗅 -
6款AI大模型挑战高考数学!一款拿下148分,压轴题成分水岭
6月7日,2026年全国高考数学科目考试落下帷幕,随后,多个数学相关的话题登上热搜。过去两年,AI行业迎来高速发展,大模型推理能力、数理分析能力持续进阶,如果让AI大模型...
来源:新京报 -
瞭望 | 技术技能人才融合“加速跑”|AI大模型|机器人技术|智能体|工程|大赛_手机新浪网
(来源:新华社) 当前,AI大模型、数字孪生、工业智能体等高新技术在制造领域加速应用,高端制造领域生产工具持续升级,工程技术人才与高技能人才融合的“复合型工程人...
来源:新浪财经 -
“AI中转站”,风险要防范
本文来自微信公众号“国家安全部”,【作者】安平。 一段时间以来,随着人工智能应用需求的迅猛增长,批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红。
来源:信息化观察网 -
315曝光AI大模型“投毒”黑产,39.9元篡改AI答案
狠抓“歪嘴和尚念错经”. 对于AI大模型被“投毒”的乱象,央视锐评道:. GEO技术本身只是一个优化信息分发的工具,是AI时代的新型营销服务之一,但一本好经总被市场上一些“歪嘴和尚...
来源:36Kr -
海外涨、国内守:AI收费双轨制背后的用户与利润博弈 |深度
《科创板日报》6月9日讯(记者王耐)近日,两则消息同时在AI圈广泛传播,值得放在一起看。 一是OpenAI宣布将在几周内把Codex核心能力整合进ChatGPT,推动Codex从开发者工具...
来源:财联社 -
500余家企业汇聚,特色化大模型加速落地——青岛人工智能何以成势
在新一轮产业变革中,青岛这座制造业重镇将人工智能作为抢滩未来发展的重要引擎。依托在海洋资源、工业制造等方面的特色优势,这里汇聚了500多家相关企业,重点推进海洋...
来源:大众网 -
腾讯云副总裁胡利明:金融行业正迈向AI大规模应用的关键节点_行业新闻
“当前,AI已从问答演示走向会规划、有记忆、能执行的新阶段,金融行业也正在迈向AI大规模应用的关键节点。腾讯云通过模型和工程能力,产业生态、AI infra...
来源:证券之星 -
当AI大模型被重新定价:云知声发布U2,迎来「DeepSeek时刻」
云知声发布新一代通用大语言模型底座U2,是其转向“原生智能体大模型公司”关键里程碑。此前大模型行业盲目堆砌参数,带来高成本与部署门槛。云知声提出“生产力AI”概念,U2...
来源:Sina finance -
苹果满血AI大模型仅支持iPhone 17 Pro/Air:iPhone 17用户无缘
快科技6月9日消息,苹果今天凌晨在WWDC2026开发者大会上正式发布了全新的Siri AI,这是一套完全由Apple Intelligence驱动的智能助理,相当于把过去几代的Siri完成了彻底重...
来源:驱动之家 -
AI早报 | 阿里巴巴升级大模型组织架构,成立Token Foundry事业部;微信宣布面向开发者提供接入微信AI生态的能力
英伟达与SK海力士宣布多年期技术合作,共同开发下一代AI内存;北京人形全尺寸通用人形机器人天工3.0将于2026年下半年量产交付。
来源:Jiemian.com -
跨境支付群雄逐“AI Agent”
来源:北京商报作者: 刘四红董晗萱近两年,跨境支付行业持续火爆,但也进入明显的存量内卷阶段。 不少业内人士直言,传统通道费率持续走低...
来源:新浪财经 -
AI智能体TOP40,德沃克X-Agent凭什么与DeepSeek、宇树同榜?
6月6日,2026第23届浙商(投融资)合作周现场,一份"2026浙商AI智能体TOP40"榜单引发产业界注目。阿里巴巴、深度求索、宇树科技、云深处、强脑科技、钉钉…
来源:中华网生活 -
强敌环伺,腾讯亮出AI底牌
随着AI竞争进入应用场景争夺的下半场,拥有超14亿月活用户的微信准备推出能“连接人与服务”的微信AI智能体,以应对字节豆包和阿里千问等强敌的围攻,改变腾讯AI慢人一步的...
来源:ThePaper.cn -
放心使用数字员工!安恒信息携统信软件为AI智能体穿上国产“安全铠甲”
当AI智能体成为7×24小时不休息的“数字员工”,——你真的放心吗? 正是洞察到这股智能浪潮下的深层安全隐忧,安恒信息通过顶尖AI防护能力,与统信软件强强联手,共同打造...
来源:同花顺 -
同程旅行将接入微信AI智能体,覆盖住宿、门票及度假等服务
6月8日,同程旅行宣布即将全面接入微信AI智能体生态,并成为首批接入微信AI生态的在线旅游平台(OTA)。未来,游客可在微信AI智能体内,通过语音指令或文字输入提出旅行需求,...
来源:东方财富 -
智能体时代CPU回“C位”,英特尔至强6+重塑AI底座
2026年6月5日,在北京召开的在英特尔至强6+ 新品发布会暨数据中心创新日上,英特尔给出了其对AI时代下一个关键转折点的判断:当AI从大模型训练全面转向Agentic AI(智能...
来源:电子工程专辑 -
“新华语典”智能体鄂尔多斯市试用交流座谈会举行
新华语典”智能体鄂尔多斯市试用交流座谈会举行-“新华语典”权威AI时政资讯智能体鄂尔多斯市试用交流座谈会在康巴什区举行。
来源:新华网 -
先河环保(sz300137)新增概念:AI智能体
先河环保(sz300137)$新增概念:『AI智能体』 概念解析:2026年6月3日微信公众号,公司专家级智能体” 高值溯源系统基于全要素感知体系,运用大数据分析、AI/AR算法等,...
来源:金股讯 -
Counterpoint研究总监Marc Einstein:把握物理AI新机遇,人工智能迈入多元发展新阶段
在技术快速迭代、全球竞争格局瞬息万变的时代,拥有系统、权威、前瞻的信息来源是做出正确决策的前提。集微VIP频道已收录超十万份深度行业报告,并以每周新增千篇的速度...
来源:集微网 -
Xcode 27 Beta 发布:苹果称其是构建 AI 智能体应用的“最佳场所”
IT之家 6 月9 日消息,在今天(6 月9 日)召开的2026 全球开发者大会(WWDC)上,苹果公司面向开发者,升级推出全新Xcode,并同步推出Core AI 框架。
来源:Sina finance





