三年跃迁中国AI凭什么逆袭美国?

AI快讯 2025-06-28
中美 AI 关系,将会呈现 “斗而不破” 的状态。


Artificial Analysis 是一家专注于 AI 能力测评的权威机构,它通过运用大量数据进行系统性分析,帮助工程师和企业精准把握 AI 的能力,进而做出合理的战略决策。2025 年 6 月中期,该机构发布了《2025 年第二季度中国 AI 亮点报告》。这份报告对中国 AI 在全球的地位进行了梳理,同时对中美在语言模型领域的实力进行了对比。


先来看一些具体数据和案例。自 2022 年 ChatGPT 发布后,中美 AI 之间的差距曾一度较为明显。然而到了 2025 年 5 月,这一差距已缩小至不足三个月,这充分彰显了中国 AI 实验室和企业在近年来取得的巨大进步。例如,DeepSeek R1(2025 年 5 月)在 Artificial Analysis Intelligence Index 中获得 68 分,阿里巴巴的 Qwen3 235B A22B 得分 47 分;与之相比,OpenAI 的 o3 同样是 68 分,Gemini 2.5 Pro 则为 67 分,可见中美两国在这方面的差距已微乎其微。


中国是如何实现这一跨越的呢?简单来讲,依靠的是技术性能提升和战略上的突破。以 DeepSeek 的 R1 模型为例,通过强化学习(RL)优化,其推理能力得到显著提升。该模型在 2025 年 5 月发布时,已是全球智能程度较高的开源模型之一,它拥有 671B 的参数规模,其中活跃参数为 37B,并且在多个评测标准,如 MMLU - Pro、GPQA Diamond 等中表现优异。


再看战略上的突破。中国头部实验室普遍采用开放权重策略,即公开旗舰模型的权重,以此加速技术共享和扩散,这与美国头部公司的闭源策略形成鲜明反差。比如,阿里巴巴发布的 QwQ 32B Preview 在 2024 年 11 月首次超越 Meta 的 Llama 3.1 405B,成为当时最智能的开源模型。这种开放的态度不仅推动了技术的进步,还吸引了全球开发者的关注与参与。不仅如此,中国企业还在持续探索新的应用场景和技术路径。像阿里巴巴,不仅专注于语言模型的研发,还推出了覆盖图像生成、视频生成等多种模态的模型,这种多模态布局使企业在不同领域都能保持较强的竞争力。


所以,中美前沿语言模型差距的缩小,首先得益于技术创新;但除了技术突破,真正让中国 AI 走得更远、更快的,其实是 “开放权重” 这张 “战略底牌”。


那么,什么是开放权重呢?有些公司将自己最先进的模型保护得密不透风,生怕被他人知晓;而另一些公司则反其道而行之,不仅公开模型,还将模型的核心 “大脑”—— 权重展示给大家。这看似不可思议,毕竟模型的训练耗费了大量的资金和时间,直接公开难道不怕被别人利用吗?但中国众多 AI 实验室和企业却选择了这条道路。原因在于,他们深知闭门造车不如开门迎客。


这种 “开放” 的做法,有诸多好处。其一,它大大降低了技术门槛。如果想进行 AI 开发,直接下载一个已训练好的模型,在此基础上进行优化、调整甚至二次创新即可,就如同搭积木,别人打好了地基,后续开发者只需往上添加积木。其二,能加速技术扩散。一个模型一旦开源,全球的开发者都能参与其中,提出建议、修改代码、开发新应用,如此一来,模型的迭代速度会大幅加快。最为关键的是,它构建了一个生态。在这个生态中,谁能更好地运用模型,谁就能创造价值,进而又推动模型本身的发展。


中国 AI 圈对 “开放权重” 的运用得心应手。字节跳动的 Seedream 3.0(2024 年 12 月)作为图像生成领域的开源模型,不仅在国内被广泛应用,还吸引了大量海外开发者参与二次开发。腾讯的 Hunyuan 2.0(2025 年 4 月)在自然语言处理领域,其权重完全公开后,成为国内企业定制化服务的首选模型。此外,阿里巴巴、华为等头部机构在过去一年里也纷纷推出自己的旗舰开源模型,并公开权重。这些举措并非偶然,而是中国 AI 界的一种共识:开放并非放弃控制,而是赢得影响力的有效方式。


然而,与美国相比,差距究竟在哪里呢?目前,OpenAI、Anthropic、Google 等美国公司依然坚持 “闭源” 策略。他们虽然会发布一些 API 接口或者模型推理能力,但核心的模型权重并不对外公开。这背后存在商业考量,比如保护知识产权、维持竞争优势、防止模型被滥用等。但从另一个角度看,这意味着他们的模型只能由内部团队或授权用户进行优化,外部开发者很难真正参与其中。


这就如同一场 “技术民主化” 的实验,谁能掌握更多的开发者,谁在未来的影响力就更强。当然,开放权重也存在风险。首先是商业模式问题。如果模型完全开源,传统的 “卖模型”“收许可费” 等盈利方式将不再适用。所以,目前国内也在积极探索新的商业模式,例如提供高级技术支持、定制化服务、商业化插件等,以此来弥补开源带来的收入缺口。其二是安全风险。模型一旦开放,其使用边界难以控制。有人可能会利用它生成虚假内容、进行恶意攻击甚至实施自动化诈骗。不过,这些问题并非中国所独有,而是整个行业都面临的新挑战,关键在于如何建立合理的监管机制和伦理规范。


可以看出,中国的 “开放权重” 更像是一种战略思维。它通过降低门槛、加速扩散、构建生态,让 AI 技术成为更多人能够参与、从中受益的基础设施。而这,正是中国 AI 能够在短短几年内实现快速追赶,并在某些领域实现反超的重要原因之一。


依靠技术创新、开放权重,中国 AI 实现了对美国的快速追赶。但新的问题随之而来:技术如何转化为产品?又是谁在推动这些模型真正落地并被大众使用呢?答案就藏在中国 AI 的 “企业生态” 之中。


这是一个由众多公司在各自擅长领域协同发力形成的生态体系,类似一支球队,有人负责组织进攻,有人负责防守反击,还有人随时准备替补上场。中国的 AI 产业便是如此发展起来的。


第一类角色是大科技公司,如阿里巴巴、腾讯、华为、百度等。它们在生态中承担着搭建平台、提供算力、开发底层模型的重任,可以将其视为 AI 时代的 “基建队”。阿里巴巴不仅自主训练大模型,还推出了 ModelScope(魔搭)平台,方便开发者下载、测试、部署各种 AI 模型。华为推出 Pangu 系列大模型,并配套自家的芯片和云服务,为整个行业提供底层支持。腾讯的 Hunyuan 系列模型在 2025 年 4 月公开权重后,迅速成为国内企业定制化服务的热门选择之一。这些大公司打造了开放、共享、可扩展的技术平台,吸引更多人参与到 AI 的发展中来。


第二类角色是 AI 初创企业。这类公司数量日益增多,它们的共同特点是不求全面,只求在某一领域做到极致。例如,Moonshot AI 专注于长文本处理,它的 Kimi 模型支持超长上下文,适合进行文档分析、法律辅助等任务;MiniMax 主打轻量级模型,追求在手机、边缘设备上高效运行,更契合中小企业的需求。这些初创企业的存在丰富了 AI 生态,它们不像大公司那样业务广泛,而是在一个方向上深入钻研,反而更容易做出特色和竞争力。


第三类角色容易被忽视,但却最为接地气,即跨界玩家。所谓跨界,指的是原本并非从事 AI 行业的公司,如今也将 AI 作为核心能力应用于自身业务。小米原本主要专注于手机和智能家居领域,现在也推出了自己的 AI 模型 MiMo - 7B,并将其融入小爱同学中,让语音助手更加智能。百度以搜索业务起家,不断迭代文心一言,尝试将 AI 融入搜索、广告、自动驾驶等多个业务线。360 则直接推出 “智脑” 产品矩阵,把 AI 整合进安全软件、浏览器、办公工具等已有产品中,让 AI 更加贴近用户。这类公司的优势在于拥有用户基础、应用场景和落地经验。它们无需从头开始研发 AI 技术,只需将 AI 作为 “增强剂” 融入现有产品和服务,就能创造实际价值。


这三类角色分工明确:大公司提供底层模型和平台支持;初创企业专注模型创新和技术突破;跨界玩家负责快速落地和商业变现。各方共同构建起一个多方共建、人人可用的技术平台。中国 AI 的发展,正是依靠这样一个多层次、多角色、协同运作的企业生态。也正是这个生态,让中国在面对美国这样技术基础强大的对手时,依然能够走出一条属于自己的发展道路。


这条道路最终将通向何方?中美之间的 AI 竞争,是走向合作,还是彻底走向对抗?


AI 若要真正融入人们的生活,仅仅具备聊天、写文章的功能是远远不够的。它还需要能够理解图片、听懂语音,甚至生成视频,这样才能为人们带来理想的 “智能体验”。换句话说,未来 AI 必然是 “多模态” 的,它需要理解文字、图像、声音、动作等多种信息,并能在这些模式之间自由切换。


那么,中国的多模态能力与美国相比,处于何种水平呢?从语言模型方面来看,通过历史数据对比,中美之间的差距已非常小,基本处于同一水平。


在图像生成领域,国外起步较早,Midjourney 和 Stable Diffusion 在设计师群体中几乎无人不知。不过近年来,中国模型也在不断追赶。字节跳动推出的 Seedream 3.0 在 2024 年底发布后迅速走红,其图像质量、细节还原度可与 Midjourney V6 相媲美,ELO 值达到 1111,与 V6 的 1150 仅相差一点。阿里巴巴的 Seedream 系列也在持续迭代,尤其加强了对中文提示词的支持,更符合国内用户的使用习惯。这表明中国在该领域已与美国站在同一起跑线上,未来谁能更胜一筹,取决于谁能更快满足用户需求并将技术落地到实际产品中。


视频生成是难度最大的领域。如果说图像生成是 “比拼细节”,那么视频生成则是 “综合能力大考”。这是因为视频生成不仅要处理每一帧的画面内容,还要保证帧与帧之间的连贯性、动作的流畅性,甚至要考虑音画同步、镜头运动等诸多因素。目前,该领域的领先者是 Google,其推出的 Veo 3 模型 ELO 值高达 1247,是当前极为强大的视频生成模型之一。但它并非不可超越。中国快手推出的 Kling 2.0,阿里发布的 Wan 2.1 版本,ELO 值分别达到 1053 和 1039。虽然与 Veo 3 相比仍有差距,但它们已具备不错的视频生成能力,尤其在短视频、广告创意等场景中表现突出。更重要的是,这些模型是基于中国本土应用需求开发的,对中文提示和本地化场景的支持更为强大。


实际上,中国正在全面发力多模态领域,并且采用集中力量打组合拳的方式。大科技公司已开始将语言、图像、视频能力整合到同一个平台。阿里巴巴 ModelScope 不仅提供文本模型,还开始支持图像生成和视频编辑功能;华为 Pangu Ultra 系列也逐步加入视觉、语音模块;腾讯 Hunyuan 直接推出一站式多模态接口,开发者可一次调用多个能力。这种做法的优势明显,不再让每个模态各自为战,而是使它们协同起来,形成完整的 AI 能力体系。因此,中国 AI 发展已形成系统性布局。从目前的表现来看,中国正逐步成为全球 AI 多模态创新的重要参与者。


发展速度固然重要,但方向是否正确同样关键。中美之间这场关乎未来的 AI 竞争,其影响力早已超越技术本身,涉及政策、产业、安全、伦理等多个层面。


事实上,在许多方面,双方都存在合作的基础和必要性。AI 是一个高度依赖开放与协作的技术领域,如果完全切断交流,不仅会减缓创新速度,还可能造成资源浪费和重复研发。


具体而言,有以下三个方面可以合作:其一,基础研究需要共享与互通。尽管当前存在一些限制,但在基础模型、算法优化、评估方法等方面,全球仍有广阔的协作空间。像 Transformer 架构、扩散模型等关键技术,最初都是由多个国家的研究者共同推动的。若这种开放精神得以延续,将为 AI 发展创造更多可能。其二,行业标准需要共建。模型评估标准、伦理规范、安全机制等都需要全球达成共识。目前,已有多个国际组织,如联合国教科文组织、IEEE、OECD 等在推动 AI 治理框架建设,中美作为两大 AI 强国均参与其中。虽然双方推进节奏不同、立场存在差异,但这至少表明大家都意识到 AI 发展需要规则,且规则需要共同制定。其三,商业利益驱动合作。政府层面有时会限制出口和技术转让,但企业之间的合作动力始终存在。一些中国企业希望使用英伟达的芯片进行训练,而美国企业也渴望进入中国市场。这种相互依赖的关系,为双方合作提供了空间。


当然,也必须正视现实:中美 AI 竞争中确实存在明显的对抗趋势。美国已明确将 AI 列为 “战略技术”,并对中国实施出口管制,例如禁止向中国出售高端 GPU 芯片。中国则加大自主研发力度,推出华为昇腾、寒武纪、壁仞等国产算力平台,努力减少对外依赖。这种 “脱钩” 趋势若进一步加深,可能会形成两个平行的技术体系。


不仅如此,AI 的应用场景也开始被政治化。美国担心中国利用 AI 进行 “信息操控”;中国则认为西方在打压中国企业的全球扩张。两国对 AI 的理解和治理理念也截然不同:美国强调自由创新、市场主导;中国更注重可控发展、社会影响。这种差异导致两国在 AI 治理理念上难以统一,例如数据隐私保护方式不同、对 AI 风险的认知不同、政策执行机制也不一样。长此以往,可能会形成两套不同的 “AI 文明”。


那么,最终的走向会如何呢?既不会完全合作,也不会全面对抗,更有可能出现 “有限合作 + 局部脱钩” 的状态。即在一些基础研究、学术交流、行业标准等领域保持合作;在核心技术和国家安全相关领域加强管控;在商业市场中,既有竞争也有互补。


换句话说,中美 AI 关系将会是 “斗而不破” 的状态。这就如同下围棋,每一步都需要权衡利弊,既要坚守自身优势,又要给对手留出一定空间。AI 的未来,并非取决于哪一方更强大,而是在于能否找到一个 “共存” 的平衡点。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章