全文翻译“中美经济与安全审查委员会”的研究报告《两个环中国开放人工智能战略如何巩固其产业主导地位》(三)
关键发现
中国在人工智能领域选择全力推行开源模式。多数国内实验室不仅公开模型源代码和参数权重,其高端产品的使用费用也远低于国际竞争对手。这种策略加速了全球对中国人工智能技术的接纳进程,形成了良性循环:技术的广泛采用推动模型迭代升级,而持续的技术应用又进一步促进技术普及。截至本文发布时,阿里巴巴旗下Qwen模型已在HuggingFace平台上构建起规模最大的模型生态系统,衍生出超过10万个子模型。这种开放的生态系统使中国能够在计算资源受限的情况下,持续在前沿领域实现创新突破。中国实验室已成功缩小与西方顶尖大型语言模型之间的性能差距,并在架构设计和训练方法方面取得重大进展,相关成果现已成为行业标准。开放模型的激增为人工智能领导地位开辟了替代路径。中国的战略重点在于通过在制造业、机器人技术和科研领域部署具身人工智能(embodiedAI),实现数据整理与优化。这些领域广泛使用的专业现实数据可能形成优势,而美国专有模型即便在基准测试中保持技术优势,也难以轻易复制这些优势。中国开放型AI模型战略与其制造业优势形成良性循环。欧盟委员会2025年年度报告指出,中国工业基础在相邻领域形成了“相互联动的创新飞轮效应”。开放模型通过推动低成本AI技术在工厂、物流网络及机器人领域的广泛应用,加速了这一发展态势,从而在现实世界中产生显著效益。技术——2020年,随后是2022年的“20项数据措施”以及2023年国家数据管理局(NDA)的成立,以实现这一愿景。中国在将这一愿景转化为实践方面具有结构性优势:无与伦比的制造业基础、完善的物联网(IoT)和5G基础设施,以及积极补贴实体经济领域人工智能应用的政策体系。由此形成与第一反馈循环并行的第二反馈循环——广泛的工业部署将数据反哺模型优化,而模型优化又推动更复杂的部署应用。正是这两个循环(数字与物理)的交汇点,赋予了中国开放战略复合驱动力,同时也对美国人工智能领导地位构成了最严峻的长期挑战。图5:HuggingFace平台上下载量前十的模型(2025年11月至12月)注:*数据范围为2025年11月8日至12月8日。大规模模型指参数量超过30亿的模型。以各模型为基础模型的模型数量统计包含重新上传至Hug-ging Face平台的模型,具体涵盖微调模型、适配器(即通过额外可训练参数进行微调)、二次微调、模型合并以及量化技术(一种降低内存占用和计算成本的压缩技术)。来源:委员会工作人员基于Hugging Face进行的分析,访问日期:2025年12月8日。第二环路:部署生成数据
随着互联网规模数据趋于有限,通过实际部署获取高质量、应用特定数据的能力,可能成为中国在人工智能领域获得竞争优势的关键要素。EpochAI公司预测,美国顶尖人工智能企业可能在2026至2032年间耗尽可用于训练AI语言模型的高质量公开训练数据,随着竞争格局向企业专有数据(针对特定应用场景)转移,这将重塑行业竞争格局。中国人工智能学者将数据视为竞争机遇。中国科学院院士、机器学习学者魏南娥在2025年9月提出,未来进展将不再依赖于构建更大规模模型,而更多取决于获取高质量、多样化数据。64以中国联网工厂和物联网基础设施为例,该国具备大规模采集专业工业数据的条件。65例如广东某智能工厂中5G高清摄像头采集的数据,使人工智能得以提升质量检测水平,设备维修率降低20%,每年节省成本超100万元人民币(约合14万美元)。66该基础设施在工厂、物流网络及智慧城市中形成了数百万个数据采集点。AgiBot、Fourier等中国领先机器人企业也发布了开放训练数据集,为具身人工智能(与物理世界交互的系统)开发拓展了数据资源池。67这正是实体经济反馈循环的实际体现。然而,中国实验室也面临着显著的数据限制。中国数据安全法对个人数据施加了严格规定,限制了微信、支付宝等中国超级应用与其他开发者之间的数据共享。68中国网页也不断被审查机构删除,而外国数据提供商可能会屏蔽中国IP地址。692025年4月,Z.ai联合创始人唐杰在人民日报撰文指出,中国高质量数据资源仍处于“碎片化和分散化”状态,已成为提升国内模型的主要瓶颈,并强调习近平关于将人工智能和大数据与实体经济融合的号召。70近期扶持中国数据标注产业的政策表明,高质量标注数据的供给仍是额外制约因素。为弥补这些不足,中国政府于2025年3月构建了分层制度框架:由国家数据管理局(NDA)主导建设的国家公共数据资源注册平台。72NDA报告显示,中文数据占国内多数中文模型训练数据的60%-80%。73为应对数据保护法规相关关切,中国政府正积极推动开放数据共享平台建设,并资助大型开放数据集项目,例如北京人工智能研究院开发的多语言多模态FlagData数据集。74为进一步强化监管力度,中国政府还推出额外激励措施。正如欧盟委员会在2024年年度报告中指出,中国财政部于2023年颁布会计准则,允许企业在资产负债表中将符合条件的数据资源确认为无形资产或存货——这使中国成为全球首个建立国家数据资产会计准则的国家。75这些举措共同体现了系统性制度建设,旨在将中国的部署优势转化为持久的数据资产。环路收敛之处:小型模型与中国结构性优势
两种反馈循环——数字反馈与物理反馈——为中国人工智能战略提供了复合驱动力。将二者联系起来的机制,是当前向适用于现实场景的小型化、专业化人工智能模型的转型趋势。美国人工智能战略的核心叙事始终聚焦于前沿规模——依托海量计算资源训练的巨型模型。但越来越多的证据表明,对经济和工业应用最具决定性影响的并非前沿大型语言模型(LLM),而是针对特定操作任务进行微调的小型语言模型(SLM)。英伟达研究人员在最新立场文件中指出,小型模型在代理式AI系统中“承担了大部分操作子任务”,其响应速度更快、错误率更低,且成本仅为前沿替代方案的十分之一至三十分之一76。该文件描绘了一个“异构化”未来图景:大型模型仅保留用于偶尔需要的复杂推理场景,而小型专用模型则驱动着绝大多数实际部署的AI应用77这一发展轨迹对中美竞争具有深远影响,因为小型模型正是开放生态系统最能高效产出的人工智能类型——而中国在全球开放生态系统中占据主导地位。小型模型开发的经济模式与前沿训练存在根本性差异。针对特定工业任务对小型模型进行微调所需的计算资源,仅需从前端大语言模型从零训练所需资源的零头,这使得更广泛的企业群体能够轻松采用。开放基础模型进一步降低了准入门槛:开发者无需从零构建模型,只需数日即可根据实际应用场景对高性能基础模型进行适配,而非耗时数月。中国的开放生态系统已经在大规模上产生了这种动态。如前所述,2025年末HuggingFace上下载量最高的模型并非前沿的大型语言模型,而是一个小型、专门化的视频字幕模型——字节跳动的Tarsier2-Recap-7b,该模型基于阿里巴巴的Qwen2-VL-7B-Instruct进行微调。78仅阿里巴巴Qwen家族的衍生模型就占HuggingFace上超过10万个模型,其中许多是由第三方开发者创建的小型、任务特定的适配版本。79这种模式——开放基础模型、社区驱动的专业化、快速迭代——正是为满足部署转型需求而优化的AI生产方式。小型模型是中国数字反馈与物理反馈循环相互强化的核心机制。数字反馈环路(开放模型传播与社区迭代)持续构建功能完备、适应性强的基础模型库;物理反馈环路(覆盖全国制造业基地、物流网络及机器人产业的部署应用)则为这些模型提供了实际应用场景。这种技术连接具有双向性。以广东省某工厂部署的质量检测模型为例,其并不需要前沿级计算能力——只需基于生产线数据进行微调的小型视觉模型,并在边缘设备上运行即可。这种部署方式产生的专有运营数据会反哺模型优化,而优化后的模型又能支持更复杂的部署方案,从而生成更丰富的数据。相较于前沿级训练,这种循环模式不仅运行速度更快、成本更低,最关键的是完全不受制于先进半导体技术的获取限制。中国在这一进程的每个阶段都展现出结构性优势的叠加效应。开放的生态系统为其提供了基础模型,庞大的制造业规模构成了实施平台,物联网与5G基础设施构建了数据采集架构,而北京从《国家发展计划》到地方人工智能应用补贴等政策工具,则为整个循环机制提供了有力支撑。目前尚无其他国家能以同等规模实现这种优势组合。若人工智能价值创造的重心从前沿训练转向已部署的小型模型(如英伟达等行业领军企业所建议),其对竞争格局的影响将十分显著。美国在人工智能领域的优势主要集中在前沿技术层面:拥有规模最大的训练数据集、最先进的芯片技术以及资本密集型模型。这些优势对科研探索和特定消费应用场景仍具有重要价值。然而,在制造业、物流系统、科学研究及机器人技术等领域,人工智能的价值创造可能并非由这些优势决定——这些领域更注重部署规模、迭代速度和运营数据获取能力,而非单纯的技术基准表现。美国出口管制政策通过限制先进半导体技术的获取来约束前沿训练技术的发展。然而这些措施并未触及小型模型的部署周期——这类模型仅需基础计算能力即可运行,依托公开基础模型构建,并通过实际应用而非预训练获得优势。若工业人工智能领域最关键的技术模型都具备小型化、专业化和开源特性,当前美国政策框架可能正在错位竞争关键环节。中国领导层显然已意识到这一发展趋势。北京推出的人工智能+战略、机器人产业政策,以及将部署数据转化为国家资产的制度框架,均体现了以实际应用型人工智能为核心的战略布局,而非追求前沿规模。中国在开放生态系统领域的主导地位与其...制造业基地能够形成持久竞争优势,这种优势的累积过程既不依赖于前沿模型竞赛,也不受旨在延缓其进程的控制措施影响。持续动能:从实验室到工厂
尽管中国主流模型在性能上仍落后于美国封闭式模型,但其开放的生态系统、政策导向以及庞大的制造业基础——这些构成实体经济反馈循环的基石——将有助于在人工智能的两大高影响力应用领域(科研与机器人技术)中获得竞争优势。科学研究是中国“人工智能+计划”的核心战略重点。乔治城大学安全与新兴技术中心收集的早期数据表明,开放模型的可适应性显著提升了学术研究者的应用效率80。这类研究成果不仅推动了人工智能技术发展,更强化了产业界与学术界之间的良性互动循环。值得关注的是,计算机视觉初创企业Megvii、中国科学院与华中科技大学联合研发的新型视觉语言AI模型,通过优化视觉信息编码技术,成功实现了在消费级GPU上高效运行的同时,仍保留大型系统部分核心功能。机器人技术与具身人工智能构成了第二个开放性优势显著的领域——在此领域中,物理经济反馈循环机制直接发挥作用。通过降低适应性门槛,开放模型使机器人团队能够整合先进语言处理与多模态能力,无需重复进行昂贵的预训练过程,从而加速物理环境实验的开展。82以上海人工智能实验室实习生机器人团队为例,他们基于阿里巴巴Qwen2.5-3B-Instruct模型开发了InternVLA-M1系统,该团队将其描述为“一套用于空间定位与机器人控制的统一框架,推动指令跟随机器人向可扩展的通用姿态智能方向发展”。除了短期应用之外,这种对实际部署的重视为具身人工智能发展带来了关键优势:整合传感器与执行器的经验、来自真实世界交互的数据,以及关于人工智能系统在不可预测物理环境中表现的迭代学习过程。84值得注意的是,许多中国研究者认为在物理世界中部署人工智能是通向通用人工智能(AGI)的技术路径,他们强调构建多个实用模型的系统,而非单一的变革性超级智能模型。中国顶尖科学家们提出了这一观点。中国科学院神经科学研究所科学主任牟明璞指出,大型语言模型必须与物理世界进行交互,才能形成动态演进的“世界模型”,即能够理解物理世界运行规律的人工智能系统。86北京通用人工智能研究院院长朱松春强调,人工智能研究应从推理与数学模型转向认知机制与价值对齐领域。学术界学者正积极探索将这一观点付诸实践的途径。由国家自然科学基金资助、清华大学(具身人工智能研究枢纽)开展的研究,致力于探索从*Megvii因在中国监控国家中的作用,于2019年10月被列入实体清单。美国商务部,特定实体的添加实体清单中的实体,2019年10月9日。并非所有中国AI开发者都采用单一技术路线,例如DeepSeek、阿里巴巴、MoonshotAI、Zhipu和百度等公司都在探索不同的技术路径。AfraWang,《“中国AI”的拓扑结构》,AfraWangs(I)Substack,2025年9月11日。。大语言模型与世界模型在具身人工智能中的应用。研究人员指出,具身人工智能依赖大语言模型对文本、图像、音频等多模态输入进行编码处理,执行语义推理与任务分解,并将这些解析结果转化为可操作输出。简而言之,大语言模型作为具身人工智能系统的认知引擎,能够将高层次理解转化为与物理世界的定向交互。通过物理交互产生的反馈回路与大语言模型的持续交互,可不断优化系统的世界模型,这种基于现实经验积累而非大规模预训练的方法,或将为通用人工智能的发展开辟新路径。中国学者的研究议程直接映射于国家政策之中。《第十五个五年规划纲要》草案呼吁中国通过推动多模态技术、智能体及具身人工智能等领域的模型创新,“探索通用人工智能的发展路径”,并借助“高价值应用场景推动通用模型与行业专用模型的实际应用及迭代升级”。该规划将实体经济反馈循环确立为国家战略。90这正是实体经济循环理论的终极体现:部署催生数据,数据优化模型,优化后的模型又催生更复杂的部署方案——这一良性循环的推进完全独立于前沿计算资源的获取。美国型号在关键应用领域仍居领先地位
现有数据显示,中国在推广开放模型方面取得的成功,尚未显著转化为聊天机器人或视频生成等应用的市场份额增长——这些领域本蕴藏着技术进步带来的巨大盈利潜力。利用AI模型驱动应用是技术应用进程中的关键阶段,其战略价值已超越模型性能本身,更在于实际应用中的实用价值与系统集成能力。根据微软对全球各国终端用户人工智能应用情况的评估,中国应用率落后于美国,仅为16.3%,而到2025年下半年将达到28.3%,不过该研究对中国地区的覆盖力度并不均衡。91兰德公司对美国和中国主流大型语言模型(LLM)网站流量的分析同样显示,2025年8月美国模型占据了全球LLM网站访问量的93%。92总部位于中国的全球人工智能产品排名机构AICPB追踪的全球网络流量数据也表明,在多平台汇总的数据中,美国在各类应用场景中仍保持领先地位。93截至2025年12月,美国AI工具在聊天机器人、代码助手、搜索引擎、图像生成器和视频生成器等榜单上均位居榜首,而中国AI工具则处于落后状态(见表3)。人工智能代理公司是一个显著例外,t其中排名前三的企业均与中国存在业务关联,尽管设立注册地仍面临诸多挑战。中国奇虎360旗下的NanoAI在月访问量方面领先总部位于美国的GenSparkAI(见表3)。不过GenSpark由两位百度前高管共同创立。位列第三的95Manus总部设于新加坡,但该公司在中国成立时获得了腾讯的资金支持。据报道,这家人工智能初创企业正接受中国监管部门的调查。清华大学在推动中国具身人工智能(embodiedAI)发展方面发挥着重要作用,引领全国具身人工智能研究论文发表数量。2022年至2025年9月期间发表43篇论文,并于2025年前成立18家公司。WilliamC.Hannas等人,《中国具身人工智能:通向通用人工智能之路》,安全与新兴技术中心,2025年12月,第18–19页。–content/uploads/CSET–Chinas-Embodied-AI.pdf。AI代理是模块化、基于大语言模型(LLM)的系统,专为特定任务自动化而设计。它们与代理式AI(即为用户执行功能的AI模型,例如操作网页浏览器)存在本质区别。RanjanSapkota、KonstantinosI.Roumeliotis与ManojKarkee合著的《AI代理与代理式AI:概念分类、应用与挑战》发表于arXiv,2025年5月15日。可能违反出口限制和其他法规,自2025年12月被Meta收购后。*表3:2025年12月按类别划分的美国与中国最受欢迎AI网络工具注:*标示类别领先者,基于2025年12月该AI产品的月访问量。来源:委员会工作人员根据AICPB《全球用户人工智能排名》进行的分析,访问日期:2026年1月23日。中国模型在电力应用领域相较于美国模型存在滞后现象,这可能由多重因素导致。尽管中国模型性能与美国顶尖模型不相上下且成本显著更低,但出于政治安全考量,开发人工智能应用的企业客户仍可能优先选用美国模型。此外,相较于追踪模型下载量和衍生版本上传量来评估模型普及度,实际应用中对人工智能模型使用情况的量化评估存在较大难度。有关中国商务部对此次收购的调查的更多细节,请参阅Graham Ayres等人,《2026年2月中国公报》,美中经济与安全审查委员会,2026年2月4日。。(有关按模型国籍衡量应用程序使用情况所面临挑战的更多细节,请参见附录II:“应用程序中人工智能采用率测量的挑战”)。尽管目前处于领先地位,美国也不应掉以轻心。中国人工智能企业强调需要改进应用中的模型集成。百度首席执行官甚至认为,中国互联网科技巨头平台的广泛性为开发驱动应用的模型提供了优势,并指出“我们[中国]可能无法匹敌谷歌和OpenAI在模型训练上的投资,但我们更接近应用层面。”96如果中国科技巨头成功缩小这一差距,上述记录的复合动力学效应可能从模型开发延伸至应用层。与此一致,百度、阿里巴巴、腾讯和字节跳动目前正在努力整合各自的基模型、开发者基础设施、企业生产力工具、营销创意平台及消费应用。美国应对措施
在DeepSeek取得成功后,除Meta之外,美国多家大型AI企业纷纷加入开放生态系统。2025年8月,OpenAI发布了两款开放权重模型——这是自GPT-2以来的首次公开,此前CEO山姆·阿尔特曼曾承认公司在开放模型领域“与历史潮流背道而驰”。982026年3月,英伟达推出Nemotron3开放权重模型,该模型专为自家硬件平台设计并支持复杂智能体AI系统,彰显了该公司在开放AI开发领域的坚定承诺,同时通过巨额研发投入推动开放权重模型创新。99其他举措如ATOM项目旨在培育美国本土实验室以推动开源AI竞争发展,但美国商业开放生态系统的整体健康状况仍存不确定性。然而,美国开源生态系统最杰出的代表人物却正朝着相反方向发展。Meta于2025年4月发布了Llama4系列,包含Scout和Maverick两款轻量级模型,但其最强大的Behemoth模型却未公开发布。100到2025年底,有报道称Meta下一代模型(代号Avocado)将采用封闭式API架构,摒弃Llama系列标志性的重量级下载模式。101这一转变部分源于业界担忧:中国实验室(尤其是DeepSeek)利用Llama的开放架构加速自身能力提升——本文正是记录了这种动态发展态势。102Meta首席执行官马克·扎克伯格曾公开声明,公司不会将具备超级智能能力的模型作为开源版本发布。103这一战略转向引发了领导层动荡,包括著名人工智能科学家严磊坤从Meta基础人工智能研究实验室离职。104如果Meta持续退出开放领域,美国将在中国国家支持的开放开发加速发展的关键时刻,失去一个主要的前沿模型开发商来支撑其开放AI生态系统。美国政策制定者近期也纷纷支持开放模型,将其视为全球人工智能竞赛中的战略利器。《2025年人工智能行动计划》明确指出开放模型对维持美国创新领导地位至关重要,这反映出专家共识日益增强:开源人工智能技术能加速科研进程、扩大技术普及范围,并为封闭模型提供替代方案。105该计划提议建立国家级计算市场平台,以缓解大型人工智能企业使用专有GPU集群造成的资源瓶颈问题。除了私营部门,美国能源部的“创世纪计划”还动员了17家国家实验室、企业和学术界,以加快人工智能驱动的科学发现、能源创新和国家安全——包括对机器人技术、自主实验室和具身人工智能的投资。针对中国在人工智能普及应用方面的重点布局,美国业界与政策制定者均呼吁在追求通用人工智能(AGI)与实际应用推广之间寻求平衡。谷歌前首席执行官埃里克·施密特主张应同步推进超级智能技术的研发与实际应用推广。那些影响日常生活的低效模型及其大规模应用。108美国空军退役中将、美国国防部联合人工智能中心主任杰克·沙纳汉同样强调,必须“将人工智能作为实用工具加以利用——既是创新驱动力,又是推动美国经济与社会发展的可量化倍增器”。109然而这些应对措施主要聚焦于竞争的数字层面——开放模型开发与计算资源获取——却忽视了中国在部署驱动型数据优势领域最具结构性优势的环节。