美国AI对华领先优势已消失?斯坦�页AI报告划重点
美国AI对华领先优势已消失?斯坦�页AI报告划重点
  • 2026-04-17 19:12:07
    来源:蒙在鼓里网

    美国AI对华领先优势已消失?斯坦�页AI报告划重点

    字体:

    智东西编译 程茜 王涵编辑 李水青

    智东񕻺�日消息,昨日晚间,美国斯坦福大学以人为本AI研究院(HAI)发布长�页的《AI指数报�》,报告提到全球顶尖AI模型的性能格局,正呈现中美交替领先的态势。

    这一长篇报告全面统计了中美AI模型竞争态势、开闭源模型竞争、AI投融资、算力等领域的最新数据和进展。

    《AI指数报�》核心信息提炼如下:

    1、顶尖模型:2025年AI产业界产生�%的顶尖模型,若干模型达到或超过人类基线。全球顶尖模型贡献方前三为OpenAI、谷歌、阿里巴巴。

    2、中美差距:顶尖模型仍集中在全球少数国家手中,过去一年中美模型差距在近乎持平到个位数的区间内波动。

    2025𻂊月,DeepSeek-R1仅𱓲.4%的差距落后于当时领先的美国模型o1-2024-12-17。截�𻂋月,美国Claude Opus 4.6领先字节的Dola-Seed-2.0 Preview,差距𰹆.7%。

    3、学术论文:中国AI论文发表数量、引用次数、专利产出上位居全球第一。

    4、算力需求:2025年全球总算力规模达�万块H100等效算力。数据中心层面,美国共运�个数据,中国排񌾼�个。

    5、AI投资:全�年AI总投�.9亿美元(约合人民𺰍.97万亿元),私募投资中生成式AI企业投资同比增�%。地域分布上,AI总投资额美国第一、中国第二。此外,2000-2023年间,中国政府引导基金已向AI企业投入�亿美元(约合人民𺰋.25万亿元)。

    6、AI发展风险:当下AI发展需要警惕三大风险:最强模型透明度变低;基准测试的可用性降低;AI实用性不足,大模型拿下奥数金牌却看不懂时钟。

    《AI指数报�》联合主席约兰达·吉尔(Yolanda Gil)、雷蒙德·佩罗(Raymond Perrault)在报告中写道,生成式AI仅用三年时间,就实现了�%的全球人口级渗透,远超个人电脑与互联网。AI有望成�世纪最具变革性的技术,但若缺乏审慎引导与规范,其发展红利恐难以均匀分配。

    多家外媒在分析报告时提到,在AI领域,中国与美国的差距几乎已经消失。

    一、AI论文、引用、专利数中国第一,美国运�个数据中心、中�个

    2025年整体来看,支撑AI发展的资源投入仍在持续增长,但其中有两大风险。

    首先,重磅模型发布数量较上年有所减少,前沿AI系统愈发集中在极少数机构手中,但模型的训练代码、数据集规模、参数量等核心信息开源大幅减少。

    其次,�年以来这些模型背后的算力需求每年增长񏉿.3倍,但几乎所有算力都依赖中国台湾的台积电,导致全球硬件供应链很脆弱。

    1、产业界主�%以上顶尖AI模型,但最强模型透明度变低

    2025年,超�%的标杆AI模型由企业打造,报告显示,2025年美国共发�个标杆AI模型,位居全球第一;中国发�个,位列第二;韩国发𺰣个,加拿大、法国、中国香港、英国各发𺰟个。

    在产业界,2025年全球顶尖模型贡献方为OpenAI(19个)、谷歌(12个)、阿里巴巴(11个),在学术界,过去十年产出最丰硕的机构为清华大学(26个)、斯坦福大学(26个)、卡内基梅隆大学(25个)。

    但OpenAI、Anthropic、谷歌等头部厂商的多款超大规模模型,已不再公开训练代码、参数量、数据集规模、训练时长等核心技术细节。2025年,95个标杆模型中�个未公开对应的训练代码,𱎶个将代码完全开源。

    2、总算力规模达�万块H100等效算力

    2008年�年间,机器学习硬件的峰值计算性能呈指数级增长,FP16、Tensor-FP16/BF16等低精度格式,已成为多数训练与推理场景的标准配置。

    主流芯片厂商的AI算力供给持续扩张,�年起,总算力规模以每年񏉿.3倍的速度增长,达到�万块H100等效算力。

    2025年美国运�个数据中心,数量是其他任何国家�倍以上;德�个、英�个、中�个紧随其后,其余多数国家的数据中心数量均不�个。

    3、中国AI出版物、AI论文引用量,领跑全球

    2024年,中国�.8%的AI出版物占比位居全球第一,欧洲�.1%,印度𰹋.6%;在AI论文引用量上,中国同样�.6%的占比领跑,欧�.5%、美国�.6%。

    高引用论文中,美国居高引论文数量第一,但份额持续下滑,中国份额持续攀升,�年�篇增�年�篇。

    4、中国AI专利数量全球第一,占比�.2%

    全球已授权AI专利数量�年�件飙升�年�件。2023-2024年,授权专利量同比增񝛾.2%。其中,中国占据全球绝对主导地位,占全球总量�.2%,美国占�.1%位居第二。

    5、模型规模扩张远超能效提升

    训练环节,机器学习硬件的能效持续提升,但模型规模的扩张速度远超能效提升,因此训练前沿系统所需的总功率仍在持续增长。大模型通常碳排放更高,但DeepSeek V3的碳排放约�吨,远低于同规模其他模型。

    推理环节,2025年能耗排名�的模型中,DeepSeek V3.2 Exp与DeepSeek V3.2单查询能耗最高,�Wh;GPT-5(high)�.9Wh紧随其后。即使同年发布的模型,能耗与碳排放也存在巨大差异,这表明推理能效存在显著分化,模型能力强弱与环境成本并非正相关。

    二、中美模型交替领先,头部模型分差缩小

    当下,头部模型之间的性能差距正在持续缩小,且中美顶尖模型之间的性能鸿沟也在缩小。这或许意味着行业竞争焦点将转向成本、可靠性与真实世界实用性。

    1、中美模型差距彻底收窄

    过去一年,中美模型的性能差距始终在近乎持平和个位数小幅领先之间波动。

    截�𻂋月,在Arena Leaderboard的人类投票评估中,Anthropic、xAI、谷歌、OpenAI四家头部厂商的模型Elo分差不�,阿里巴巴、DeepSeek等紧随其后。性能差距收窄后,行业竞争焦点从基准跑分转向成本、延迟、可靠性、垂直领域优化等工程化能力。

    2、开闭源模型差距被拉开

    开源与闭源模型的性能差距�年短暂收窄后,2025年再度扩大。截�𻂋月,头部闭源模型领先开源模𶭱.3%;Arena排行榜�模型中,6款为闭源模型。

    3、基准测试可靠性持续下滑,无效问题率最高�%

    用于衡量AI进展的基准测试,正面临越来越严重的可靠性与刷榜问题。9个主流基准中,无效问题率从MMLU Math񊄪%到GSM8K�%不等。

    4、奥数拿金牌,却无法准确读时钟

    AI可斩获国际数学奥林匹克(IMO)金牌,却无法准确读表,凸显能力“锯齿状前沿”(大模型能力分布极度不均衡)。

    Gemini Deep Think在IMO中夺得金牌,但顶尖模型读取模拟钟表的正确率仅�.1%。AI智能体在真实计算机任务上的成功率�%跃升至�%,可跨操作系统运行,但在结构化基准测试中仍有񏉽/3的尝试失败。

    5、AI能力持续超越基准,人类级测试快速饱和

    AI能力的提升速度,已远超为衡量它而设计的基准。原本设计用于多年追踪进展的高难度测试,在数月内就被模型饱和,大幅压缩了基准的有效生命周期。

    三、生成式AI普及增速远超PC、互联网,全球AI投资�亿美元

    生成式AI在面向大众市场推出后,三年时间实现了�%的人口渗透率,增速超过个人电脑与互联网,这种快速普及正在转化为实实在在的价值:截�年初,美国消费者从生成式AI中获得的年度剩余价值,预计达�亿美元。

    ▲2025年关键AI事件

    1、全球企业AI投资翻倍,美国主导全球私募AI投资

    2025年,全球AI总投资达�.9亿美元,同比增�.9%。2025年全球AI私募投资总额达�.7亿美元,同比增�.5%,其中生成式AI企业贡献�.9亿美元,占全部私募AI投资的近一半,同比增长�%。

    从投资总额和新融资企业数量来看,全球AI私募投资都高度集中在少数国家。

    2025年的AI总投资额美国为�亿美元位居全球第一,中�亿美元位居第二,英�亿美元位居第三。在美国,超半数私募AI投资流向生成式AI,规模�亿美元;中国与欧洲的生成式AI投资合计�亿美元。

    但报告特别提到,私募数据严重低估中国AI总投入,2000-2023年间,中国政府引导基金已向AI企业投入�亿美元。

    此外,2025年AI初创企业私募投资按赛道拆分显示,资本大幅向AI基础设施搭建与规模化的上游环节倾斜。

    2、AI公司营收爆发式增长,算力成本同步创历史新高

    AI公司营收以历史最快速度增长,但算力成本与基础设施开支也同步创下纪录。头部企业短期内实现可观营收规模,同时算力开支同比大幅攀升。

    如下图所示,OpenAI、Anthropic、xAI、Mistral AI、智谱等头部AI企业的年化营收估算,在近年实现了快速增长。

    主流云服务商加速资本开支,2025年谷歌年度资本开支�亿美元。

    3、生成式AI三年渗透率�%,速度超PC、互联网

    生成式AI仅用三年实�%的渗透率,增速超过个人电脑与互联网。

    2025年,企业AI adoption率持续上升,受访组织中生成式AI已�%的企业中用于至少一项业务职能,中国与欧洲同比增速最高。AI Agent在几乎所有业务职能中的部署率仍仅为个位数,处于早期阶段。

    4、AI对就业市场影响不均,1/3企业预期裁员

    在就业市�-25岁软件开发者的就业率�年下降�%。

    雇主调研中,1/3组织预期未来一年将裁员,近半数受访组织预期岗位无变化。服务运营、供应链、软件工程等领域的裁员预期最高。几乎所有公司中,预期裁员规模均已超过实际已发生的裁员。

    四、负责任AI发展严重滞后于AI能力

    最新研究表明,提升某一项负责任AI维度,往往会以牺牲另一项为代价:如隐私保护的提升,可能导致公平性下降;安全性的增强,可能伴随准确率降低。报告显示,目前尚无框架可平衡这些取舍;对于公平性、隐私性、可解释性等维度,也缺乏可追踪长期进展的标准化数据。

    1、负责任AI基准测试增长,但严重滞后于AI技术迭代

    几乎所有前沿模型厂商,都会披露MMLU、SWE-bench等能力基准的结果,但负责任AI基准的报告率始终极低。且有记录的AI安全事件持续攀升,AI事件数据�年记�起,2024年�起。

    在一项用于区分已知事实与主观信念的全新基准KaBLE上,26款顶尖模型的幻觉率区间�%�%:GPT-4o的准确率�.2%跌�.4%,DeepSeek R1�%降�.4%。当错误陈述被包装为他人的信念时,模型无法有效甄别。

    2、AI在英语外表现大幅滑坡,方言差距更显著

    AI在英语场景表现最优,非英语场景的性能差距大于全球基准的表面数据。在HELM阿拉伯语测试中,专为阿拉伯语训练的专用模型,表现超越了GPT-5.1、Gemini 2.5 Flash。

    在斯洛文尼亚常识推理测试中,多款顶尖模型用区域方言测试时,准确率较标准语版本下跌�%。

    3、AI企业透明度不升反降

    基础模型透明度指数(FMTI)�-2024年�分升�分后,2025年平均得分回落�分。在训练数据、计算资源、部署后影响等核心维度,企业披露仍存在缺口。

    五、AI4S论文年�%,但复现任务遭遇瓶颈

    2024年诺贝尔化学奖授予了德米斯·哈萨比斯、约翰·江珀和戴维·贝克,以表彰他们在AI驱动的蛋白质结构预测与设计方面的贡献。到�年,AI不再局限于优化单个流程环节,而是开始替代整个科研工作流。然而,最前沿的智能体在论文级复现任务中的成功率不�%,与实际科研还存在较大壁垒。

    在Web of Science数据库中,自然科学领域与AI相关的论文发表量�年�篇增�年的�篇,一年内增长�%。其广泛性表明,AI方法正成为各学科科研实践中常规组成部分。

    六、AI临床推理超越医生,AI摘要开始影响用户健康理解

    2025年,AI在医学领域取得了多方面进展,但强大的模型性能并未完全地转化为现实世界的临床影响力。

    1、多智能体协同成为生物医学研究发展趋势

    2025年,科学发现的自动化探索聚焦于将数字推理与物理实验验证相结合,Robin、STELLA、Agent Laboratory、Virtual Lab等智能体已经有了相关进展,代表了生物医学研究中向多智能体协同发展的早期趋势。

    2、AI在临床推理的表现优于医生

    在实验评估中,OpenAI的o1-preview已经超越了大多数现有的真人医生的临床推理基准,但它们反映的是孤立的认知评估,而非现实世界的临床整合。

    3、AI摘要影响用户健康理解

    在五类主要查询类型中,平均�%�%的健康相关查询会触发谷歌的AI Overview,影响着大多数用户对所提问题的初步理解。

    七、AI教育普�%国家,但课程与师资滞后

    在全球范围内,大学和K-12阶段的学生都在大量使用AI工具,但针对AI的专门课程和教师培训仍然有限。

    1、AI研究转向研究生阶段

    2024年�年间,美国四年制大学的计算机科学入学人数下降�%,但AI相关研究生项目持续增长。

    2、全球AI教育已普�%,中国进展亮眼

    目前超�%的国家已向中小学生提供计算机科学教育,但AI教育的普及速度较慢,其中,在中国,北京、广东和杭州�𻂍月发布的《中国中小学人工智能教育通识指南(2025年版)》和《中小学生生成式人工智能使用指南(2025年版)》之后,均�-26学年开始要求开展AI教育。

    3、印度人最喜欢在领英中体现AI技能

    根据领英数据,印度用户最喜欢在个人资料中体现AI技能,𱓵.0的渗透率领先,意味着其会员个人资料中AI技能的出现频率几乎是全球平均水平的三倍,其次是美国(2.0)和德国(1.8)。

    八、中美模型发布量占垄断地位,中国领跑基础设施

    在全球范围内,各国政府开始投资建设并维持自身在构成该技术的基础设施、模型等方面的能力。

    1、中国在国家超算数量上大幅领先

    AI计算基础设施,包括高性能GPU集群和AI优化型超级计算机,已成为AI主权投资最显著的领域之一。根据Epoch AI追踪用于训练先进AI模型的大规模GPU集群的数据,2010年�年间,国家支持的AI超算在大多数地区都有所扩展。其中,中国拥有最多,�个。

    2、中美大模型发布数量占主导地位

    在AI模型开发数量方面,中国和美国依旧占主导地位。根据Epoch AI追踪公开报道的模型发布数据,2018年�年间,美国累计发布的模型数量�个增长�个。中国�年�年间模型发布数量�个增长�个,增长超过五倍。由于开源生态的逐渐完善,越来越多的地区正在构建和部署自己的模型。

    结语:中美AI实力差距缩小,形成相互制约促进关系

    从报告来看,中美在模型性能上已形成动态平衡,中国凭借论文专利、开源生态、基础设施布局和工业应用优势,在全球AI产业链中占据关键位置;而美国在资本、数据中心和闭源创新上仍具领先。

    未来胜负手,或许将在于谁能更好解决能源约束、提升真实世界可靠性和实现普惠落地。通过负责任的治理、绿色基础设施建设和人机协同创新,AI红利将更均匀地惠及全球,避免技术鸿沟继续扩大。

    【纠错】【责任编辑:我说琦玉氏】