美国AI对华领先优势已消失？斯坦�页AI报告划重点

智东西编译程茜王涵编辑李水青

智东񕻺�日消息，昨日晚间，美国斯坦福大学以人为本AI研究院（HAI）发布长�页的《AI指数报�》，报告提到全球顶尖AI模型的性能格局，正呈现中美交替领先的态势。

这一长篇报告全面统计了中美AI模型竞争态势、开闭源模型竞争、AI投融资、算力等领域的最新数据和进展。

《AI指数报�》核心信息提炼如下：

1、顶尖模型：2025年AI产业界产生�%的顶尖模型，若干模型达到或超过人类基线。全球顶尖模型贡献方前三为OpenAI、谷歌、阿里巴巴。

2、中美差距：顶尖模型仍集中在全球少数国家手中，过去一年中美模型差距在近乎持平到个位数的区间内波动。

2025𻂊月，DeepSeek-R1仅𱓲.4%的差距落后于当时领先的美国模型o1-2024-12-17。截�𻂋月，美国Claude Opus 4.6领先字节的Dola-Seed-2.0 Preview，差距𰹆.7%。

3、学术论文：中国AI论文发表数量、引用次数、专利产出上位居全球第一。

4、算力需求：2025年全球总算力规模达�万块H100等效算力。数据中心层面，美国共运�个数据，中国排񌾼�个。

5、AI投资：全�年AI总投�.9亿美元（约合人民𺰍.97万亿元），私募投资中生成式AI企业投资同比增�%。地域分布上，AI总投资额美国第一、中国第二。此外，2000-2023年间，中国政府引导基金已向AI企业投入�亿美元（约合人民𺰋.25万亿元）。

6、AI发展风险：当下AI发展需要警惕三大风险：最强模型透明度变低；基准测试的可用性降低；AI实用性不足，大模型拿下奥数金牌却看不懂时钟。

《AI指数报�》联合主席约兰达·吉尔（Yolanda Gil）、雷蒙德·佩罗（Raymond Perrault）在报告中写道，生成式AI仅用三年时间，就实现了�%的全球人口级渗透，远超个人电脑与互联网。AI有望成�世纪最具变革性的技术，但若缺乏审慎引导与规范，其发展红利恐难以均匀分配。

多家外媒在分析报告时提到，在AI领域，中国与美国的差距几乎已经消失。

一、AI论文、引用、专利数中国第一，美国运�个数据中心、中�个

2025年整体来看，支撑AI发展的资源投入仍在持续增长，但其中有两大风险。

首先，重磅模型发布数量较上年有所减少，前沿AI系统愈发集中在极少数机构手中，但模型的训练代码、数据集规模、参数量等核心信息开源大幅减少。

其次，�年以来这些模型背后的算力需求每年增长񏉿.3倍，但几乎所有算力都依赖中国台湾的台积电，导致全球硬件供应链很脆弱。

1、产业界主�%以上顶尖AI模型，但最强模型透明度变低

2025年，超�%的标杆AI模型由企业打造，报告显示，2025年美国共发�个标杆AI模型，位居全球第一；中国发�个，位列第二；韩国发𺰣个，加拿大、法国、中国香港、英国各发𺰟个。

在产业界，2025年全球顶尖模型贡献方为OpenAI（19个）、谷歌（12个）、阿里巴巴（11个），在学术界，过去十年产出最丰硕的机构为清华大学（26个）、斯坦福大学（26个）、卡内基梅隆大学（25个）。

但OpenAI、Anthropic、谷歌等头部厂商的多款超大规模模型，已不再公开训练代码、参数量、数据集规模、训练时长等核心技术细节。2025年，95个标杆模型中�个未公开对应的训练代码，𱎶个将代码完全开源。

2、总算力规模达�万块H100等效算力

2008年�年间，机器学习硬件的峰值计算性能呈指数级增长，FP16、Tensor-FP16/BF16等低精度格式，已成为多数训练与推理场景的标准配置。

主流芯片厂商的AI算力供给持续扩张，�年起，总算力规模以每年񏉿.3倍的速度增长，达到�万块H100等效算力。

2025年美国运�个数据中心，数量是其他任何国家�倍以上；德�个、英�个、中�个紧随其后，其余多数国家的数据中心数量均不�个。

3、中国AI出版物、AI论文引用量，领跑全球

2024年，中国�.8%的AI出版物占比位居全球第一，欧洲�.1%，印度𰹋.6%；在AI论文引用量上，中国同样�.6%的占比领跑，欧�.5%、美国�.6%。

高引用论文中，美国居高引论文数量第一，但份额持续下滑，中国份额持续攀升，�年�篇增�年�篇。

4、中国AI专利数量全球第一，占比�.2%

全球已授权AI专利数量�年�件飙升�年�件。2023-2024年，授权专利量同比增񝛾.2%。其中，中国占据全球绝对主导地位，占全球总量�.2%，美国占�.1%位居第二。

5、模型规模扩张远超能效提升

训练环节，机器学习硬件的能效持续提升，但模型规模的扩张速度远超能效提升，因此训练前沿系统所需的总功率仍在持续增长。大模型通常碳排放更高，但DeepSeek V3的碳排放约�吨，远低于同规模其他模型。

推理环节，2025年能耗排名�的模型中，DeepSeek V3.2 Exp与DeepSeek V3.2单查询能耗最高，�Wh；GPT-5（high）�.9Wh紧随其后。即使同年发布的模型，能耗与碳排放也存在巨大差异，这表明推理能效存在显著分化，模型能力强弱与环境成本并非正相关。

二、中美模型交替领先，头部模型分差缩小

当下，头部模型之间的性能差距正在持续缩小，且中美顶尖模型之间的性能鸿沟也在缩小。这或许意味着行业竞争焦点将转向成本、可靠性与真实世界实用性。

1、中美模型差距彻底收窄

过去一年，中美模型的性能差距始终在近乎持平和个位数小幅领先之间波动。

截�𻂋月，在Arena Leaderboard的人类投票评估中，Anthropic、xAI、谷歌、OpenAI四家头部厂商的模型Elo分差不�，阿里巴巴、DeepSeek等紧随其后。性能差距收窄后，行业竞争焦点从基准跑分转向成本、延迟、可靠性、垂直领域优化等工程化能力。

2、开闭源模型差距被拉开

开源与闭源模型的性能差距�年短暂收窄后，2025年再度扩大。截�𻂋月，头部闭源模型领先开源模𶭱.3%；Arena排行榜�模型中，6款为闭源模型。

3、基准测试可靠性持续下滑，无效问题率最高�%

用于衡量AI进展的基准测试，正面临越来越严重的可靠性与刷榜问题。9个主流基准中，无效问题率从MMLU Math񊄪%到GSM8K�%不等。

4、奥数拿金牌，却无法准确读时钟

AI可斩获国际数学奥林匹克（IMO）金牌，却无法准确读表，凸显能力“锯齿状前沿”（大模型能力分布极度不均衡）。

Gemini Deep Think在IMO中夺得金牌，但顶尖模型读取模拟钟表的正确率仅�.1%。AI智能体在真实计算机任务上的成功率�%跃升至�%，可跨操作系统运行，但在结构化基准测试中仍有񏉽/3的尝试失败。

5、AI能力持续超越基准，人类级测试快速饱和

AI能力的提升速度，已远超为衡量它而设计的基准。原本设计用于多年追踪进展的高难度测试，在数月内就被模型饱和，大幅压缩了基准的有效生命周期。

三、生成式AI普及增速远超PC、互联网，全球AI投资�亿美元

生成式AI在面向大众市场推出后，三年时间实现了�%的人口渗透率，增速超过个人电脑与互联网，这种快速普及正在转化为实实在在的价值：截�年初，美国消费者从生成式AI中获得的年度剩余价值，预计达�亿美元。

▲2025年关键AI事件

1、全球企业AI投资翻倍，美国主导全球私募AI投资

2025年，全球AI总投资达�.9亿美元，同比增�.9%。2025年全球AI私募投资总额达�.7亿美元，同比增�.5%，其中生成式AI企业贡献�.9亿美元，占全部私募AI投资的近一半，同比增长�%。

从投资总额和新融资企业数量来看，全球AI私募投资都高度集中在少数国家。

2025年的AI总投资额美国为�亿美元位居全球第一，中�亿美元位居第二，英�亿美元位居第三。在美国，超半数私募AI投资流向生成式AI，规模�亿美元；中国与欧洲的生成式AI投资合计�亿美元。

但报告特别提到，私募数据严重低估中国AI总投入，2000-2023年间，中国政府引导基金已向AI企业投入�亿美元。

此外，2025年AI初创企业私募投资按赛道拆分显示，资本大幅向AI基础设施搭建与规模化的上游环节倾斜。

2、AI公司营收爆发式增长，算力成本同步创历史新高

AI公司营收以历史最快速度增长，但算力成本与基础设施开支也同步创下纪录。头部企业短期内实现可观营收规模，同时算力开支同比大幅攀升。

如下图所示，OpenAI、Anthropic、xAI、Mistral AI、智谱等头部AI企业的年化营收估算，在近年实现了快速增长。

主流云服务商加速资本开支，2025年谷歌年度资本开支�亿美元。

3、生成式AI三年渗透率�%，速度超PC、互联网

生成式AI仅用三年实�%的渗透率，增速超过个人电脑与互联网。

2025年，企业AI adoption率持续上升，受访组织中生成式AI已�%的企业中用于至少一项业务职能，中国与欧洲同比增速最高。AI Agent在几乎所有业务职能中的部署率仍仅为个位数，处于早期阶段。

4、AI对就业市场影响不均，1/3企业预期裁员

在就业市�-25岁软件开发者的就业率�年下降�%。

雇主调研中，1/3组织预期未来一年将裁员，近半数受访组织预期岗位无变化。服务运营、供应链、软件工程等领域的裁员预期最高。几乎所有公司中，预期裁员规模均已超过实际已发生的裁员。

四、负责任AI发展严重滞后于AI能力

最新研究表明，提升某一项负责任AI维度，往往会以牺牲另一项为代价：如隐私保护的提升，可能导致公平性下降；安全性的增强，可能伴随准确率降低。报告显示，目前尚无框架可平衡这些取舍；对于公平性、隐私性、可解释性等维度，也缺乏可追踪长期进展的标准化数据。

1、负责任AI基准测试增长，但严重滞后于AI技术迭代

几乎所有前沿模型厂商，都会披露MMLU、SWE-bench等能力基准的结果，但负责任AI基准的报告率始终极低。且有记录的AI安全事件持续攀升，AI事件数据�年记�起，2024年�起。

在一项用于区分已知事实与主观信念的全新基准KaBLE上，26款顶尖模型的幻觉率区间�%�%：GPT-4o的准确率�.2%跌�.4%，DeepSeek R1�%降�.4%。当错误陈述被包装为他人的信念时，模型无法有效甄别。

2、AI在英语外表现大幅滑坡，方言差距更显著

AI在英语场景表现最优，非英语场景的性能差距大于全球基准的表面数据。在HELM阿拉伯语测试中，专为阿拉伯语训练的专用模型，表现超越了GPT-5.1、Gemini 2.5 Flash。

在斯洛文尼亚常识推理测试中，多款顶尖模型用区域方言测试时，准确率较标准语版本下跌�%。

3、AI企业透明度不升反降

基础模型透明度指数（FMTI）�-2024年�分升�分后，2025年平均得分回落�分。在训练数据、计算资源、部署后影响等核心维度，企业披露仍存在缺口。

五、AI4S论文年�%，但复现任务遭遇瓶颈

2024年诺贝尔化学奖授予了德米斯·哈萨比斯、约翰·江珀和戴维·贝克，以表彰他们在AI驱动的蛋白质结构预测与设计方面的贡献。到�年，AI不再局限于优化单个流程环节，而是开始替代整个科研工作流。然而，最前沿的智能体在论文级复现任务中的成功率不�%，与实际科研还存在较大壁垒。

在Web of Science数据库中，自然科学领域与AI相关的论文发表量�年�篇增�年的�篇，一年内增长�%。其广泛性表明，AI方法正成为各学科科研实践中常规组成部分。

六、AI临床推理超越医生，AI摘要开始影响用户健康理解

2025年，AI在医学领域取得了多方面进展，但强大的模型性能并未完全地转化为现实世界的临床影响力。

1、多智能体协同成为生物医学研究发展趋势

2025年，科学发现的自动化探索聚焦于将数字推理与物理实验验证相结合，Robin、STELLA、Agent Laboratory、Virtual Lab等智能体已经有了相关进展，代表了生物医学研究中向多智能体协同发展的早期趋势。

2、AI在临床推理的表现优于医生

在实验评估中，OpenAI的o1-preview已经超越了大多数现有的真人医生的临床推理基准，但它们反映的是孤立的认知评估，而非现实世界的临床整合。

3、AI摘要影响用户健康理解

在五类主要查询类型中，平均�%�%的健康相关查询会触发谷歌的AI Overview，影响着大多数用户对所提问题的初步理解。

七、AI教育普�%国家，但课程与师资滞后

在全球范围内，大学和K-12阶段的学生都在大量使用AI工具，但针对AI的专门课程和教师培训仍然有限。

1、AI研究转向研究生阶段

2024年�年间，美国四年制大学的计算机科学入学人数下降�%，但AI相关研究生项目持续增长。

2、全球AI教育已普�%，中国进展亮眼

目前超�%的国家已向中小学生提供计算机科学教育，但AI教育的普及速度较慢，其中，在中国，北京、广东和杭州�𻂍月发布的《中国中小学人工智能教育通识指南（2025年版）》和《中小学生生成式人工智能使用指南（2025年版）》之后，均�-26学年开始要求开展AI教育。

3、印度人最喜欢在领英中体现AI技能

根据领英数据，印度用户最喜欢在个人资料中体现AI技能，𱓵.0的渗透率领先，意味着其会员个人资料中AI技能的出现频率几乎是全球平均水平的三倍，其次是美国（2.0）和德国（1.8）。

八、中美模型发布量占垄断地位，中国领跑基础设施

在全球范围内，各国政府开始投资建设并维持自身在构成该技术的基础设施、模型等方面的能力。

1、中国在国家超算数量上大幅领先

AI计算基础设施，包括高性能GPU集群和AI优化型超级计算机，已成为AI主权投资最显著的领域之一。根据Epoch AI追踪用于训练先进AI模型的大规模GPU集群的数据，2010年�年间，国家支持的AI超算在大多数地区都有所扩展。其中，中国拥有最多，�个。

2、中美大模型发布数量占主导地位

在AI模型开发数量方面，中国和美国依旧占主导地位。根据Epoch AI追踪公开报道的模型发布数据，2018年�年间，美国累计发布的模型数量�个增长�个。中国�年�年间模型发布数量�个增长�个，增长超过五倍。由于开源生态的逐渐完善，越来越多的地区正在构建和部署自己的模型。

结语：中美AI实力差距缩小，形成相互制约促进关系

从报告来看，中美在模型性能上已形成动态平衡，中国凭借论文专利、开源生态、基础设施布局和工业应用优势，在全球AI产业链中占据关键位置；而美国在资本、数据中心和闭源创新上仍具领先。

未来胜负手，或许将在于谁能更好解决能源约束、提升真实世界可靠性和实现普惠落地。通过负责任的治理、绿色基础设施建设和人机协同创新，AI红利将更均匀地惠及全球，避免技术鸿沟继续扩大。

【纠错】【责任编辑:我说琦玉氏】

深度观察

新华全媒头条丨弗罗因德：目标尽快续约整个教练团队乌尔比希有完美的平台