大模型竞争:落后生的两条追赶路线
在大模型竞赛的赛道上,部分处于下风的厂商正积极调整策略,试图扭转局势。中美大模型公司如今都集体进入了动荡期,它们各自采取不同的方式,在这场激烈的竞争中努力追赶先行者的步伐。
一直以来,苹果在 AI 领域的表现都被外界诟病落后。不过最近,苹果有了一些新动态。一方面,苹果 AI 与机器学习战略高级副总裁约翰・詹南德雷亚被爆淡出核心管理层,遭遇降职处理;另一方面,有消息传出苹果有望收购明星 AI 搜索创企 Perplexity。若以 5 月份 Perplexity 完成新一轮融资后的 140 亿美元估值计算,一旦收购成功,这将刷新苹果的并购纪录,超越 2014 年以 30 亿美元收购 Beats 的交易。通过此次收购,苹果意在补强自身在 AI 领域的人才和技术储备。
与此同时,Meta 的创始人马克・扎克伯格也在积极行动。由于 4 月份 Meta 新一代开源模型 Llama 4 的表现未达外界预期,扎克伯格产生了重组 AI 团队的想法,并迅速付诸实践。他不仅豪掷 143 亿美元,计划将 Scale AI 联合创始人兼 CEO Alexandr Wang 招致麾下,还被爆正在接触前 OpenAI 首席科学家伊利亚・苏茨克弗初创公司 SSI(Safe Superintelligence)的 CEO 丹尼尔・格罗斯,以及前 GitHub CEO 纳特・弗里德曼。扎克伯格亲自组建了一个全新的、预计规模在 50 人的 AI 实验室,并将其视为大规模重组 Meta AI 业务的一部分,而 Alexandr Wang 有望成为该实验室的主管。据外媒 The Information 爆料,早在 4 月中旬,扎克伯格就与 Alexandr Wang 进行了接触,为了邀请王加入 Meta,愿意支付数十亿美元。但 Alexandr Wang 起初将自身和身后 Scale AI 的报价提高至 200 亿美元,经过一个多月的谈判,双方最终达成 Meta 以 143 亿美元收购 Scale AI 49% 股份,且 Alexandr Wang 需在 Meta 工作五年以上才能拿到绝大部分收购现金的方案。此外,扎克伯格还曾试图收购伊利亚创办的 AI 初创公司 SSI,按照 4 月份 SSI 完成 20 亿美元融资后的估值计算,这笔收购可能要花费 320 亿美元,不过遭到了伊利亚的拒绝。之后,扎克伯格便将目标转向了 SSI 的现任 CEO 格罗斯,目前对格罗斯和弗里德曼的招募还在进一步谈判中。
谷歌同样在进行内部调整。有爆料称,谷歌将任命 DeepMind CTO 科拉伊・卡武克奥卢担任谷歌首席 AI 架构师,负责统筹未来 AI 产品开发,直接向 CEO 桑达尔・皮查伊汇报。这一人事变动是谷歌重组其 Gemini 应用团队,加快追赶 OpenAI 步伐的新举措。与扎克伯格担心 Llama 在模型性能上落后不同,谷歌凭借 Gemini 系列模型在性能上逐渐逼近 OpenAI,但却意识到自家产品与 ChatGPT 在用户规模上存在巨大鸿沟,如何弥补产品滞后的短板成为谷歌的当务之急。
国内的情况也不例外。被 DeepSeek 冲击的 AI 六小龙们,自去年下半年起便进入了密集的高管离职潮。与苹果、Meta 等重金抢人的策略不同,六小龙几乎都选择裁员来收紧资源分配。在新的大模型竞争周期中,曾经高举高打模型和应用双轮驱动的六小龙,不得不重新将技术迭代确立为公司的最高优先级。受此策略转变影响,一批负责应用和商业化的高管相继离开,如前智谱 COO 张帆、前 MiniMax 商业化负责人魏伟、前月之暗面核心产品负责人明超平、前阶跃星辰 “冒泡鸭” 产品负责人张心皓(尚未离职,转为内部顾问)等。
中美大模型厂商集体进入动荡期,其核心原因之一是在新一轮竞争中暂时处于劣势,不得不通过组织调整来追赶领先者。
对扎克伯格而言,推动他重组 Meta AI 团队、重金招募 Alexandr Wang 的重要原因,是 Meta 在人工智能竞赛中逐渐落后。2023 年初 Llama 1 发布后,Meta 凭借开源在大模型竞争中占据了一席之地。然而,今年 4 月初发布的 Llama 4 却遭遇大量负面评价,被质疑用特调版本刷榜和数据过拟合测试 。尽管 Llama 技术人员否认了数据过拟合造假传闻,但使用特调版本却是事实。早在 1 月份 DeepSeek R1 爆火后,Meta 内部就曾担心尚未发布的 Llama 4 在性能上无法赶上 DeepSeek R1,当时有 Meta 员工在相关平台爆料,Llama 4 在基准测试中已经落后于 DeepSeek。
谷歌虽然依靠 Gemini 2.5 系列在模型性能上几乎追平了 OpenAI,但产品方面却远远落后于 ChatGPT。根据谷歌流出的内部报告,截至 2025 年 3 月,Gemini 全球日活跃用户 3500 万,月活跃用户 3.5 亿,而 ChatGPT 的日活跃用户为 1.6 亿,月活跃用户为 6 亿。OpenAI CEO 山姆・奥特曼更是多次表示 “ChatGPT 取代搜索” 的观点,这让以应用起家的谷歌十分在意这场 AI 时代 “注意力资源” 的争夺。
国内的六小龙则如同 Meta 的 Llama 一样,陷入了技术自证的危机。而且与 Meta 不同的是,从 2024 年下半年开始,融资环境急剧恶化,这使得六小龙的技术追赶之路更加艰难。零一万物明确放弃 AGI,百川智能转向医疗垂类场景,坚持模型和应用双轮驱动的其他几家公司也几乎同时放弃扩大应用规模的计划,转而将有限资源投入到模型迭代上。在这样的背景下,裁减负责产品应用和商业化推广的核心高管,成为六小龙应对困境的无奈之举。
无论是砸钱抢人,还是裁员节流,这背后反映出当下大模型竞争中两种不同的追赶策略:对于财大气粗的大厂来说,它们可以用金钱换时间,实现效率最大化;而资金相对紧张的创业公司,只能收缩有限资源,实现价值最大化。
国内字节等大厂已经率先展示了用金钱换时间的策略。张一鸣带领字节 AI 团队,通过砸钱抢人,从 2023 年的落后状态,经过一年的发展,在 2024 年底成功跻身国内第一阵容。而在有限资源内实现媲美行业头部的模型性能方面,国内的 DeepSeek 做出了表率。DeepSeek 的梁文锋凭借一系列工程创新,以不足 OpenAI o1 十分之一的资金成本,自研出性能足以媲美 o1 的 R1。
无论是字节的后来居上,还是 DeepSeek 的异军突起,它们能够在大模型行业占据头部地位,除了舍得投入资金吸引人才外,更重要的是明确展现出追求 AGI(通用人工智能)的雄心壮志。正如有 AI 领域在读博士所说,在高度人才密集的大模型行业,获取并吸引源源不断的年轻人才加入,才是通向 AGI 的关键。面对扎克伯格的疯狂挖人,OpenAI CEO 奥特曼回应称,尽管 Meta 向 OpenAI 团队中的一些人开出高额签约奖金,但 OpenAI 最优秀的人才都没有接受邀约,因为他们认为 OpenAI 在实现超级智能上更具可能性。梁文锋在与大厂争抢人才时,也强调 DeepSeek 在做最难的事,解决世界上最难的问题,这对顶级人才具有很大的吸引力。从 OpenAI 到 DeepSeek 的成功可以看出,在大模型时代,想要实现创新,单纯砸钱是不够的,为人才提供施展抱负的空间更为重要。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。