2025 年 11 月,姚顺雨穿着休闲短裤、踩着拖鞋出现在腾讯的一场内部会上。这位 27 岁的 OpenAI 前研究员、提出过 ReAct 范式的技术天才刚被腾讯以重金招入麾下不久。
入职后,他的一项重要任务是帮腾讯找到混元大模型长期表现欠佳的原因,并将情况直接上报给集团总裁刘炽平;姚顺雨细致地检查每一个环节,不时和同事、实习生交流至半夜——这些是他的前任们很少会做的。很快他成为了腾讯大语言模型的一号位。
“混元的评测出了大问题。” 一位在场人士转述姚顺雨在会上发言,意思是模型过度追逐在榜单上的成绩,将打榜的语料放入训练集以致数据被污染,尽管模型很会答题,在真实场景里的表现却不稳定。他希望团队以后不要打榜,也不要盯着榜单做事。会上,混元的相关负责人也提到了模型过去在数据、预训练、infra 上的问题。
过去两年多,这家中国市值最高、掌握着最大流量入口的互联网公司,在 AI 上的节奏相对谨慎——无论是投入力度,还是组织与产品推进速度,都落后于阿里巴巴与字节跳动。直到 2025 年,这种状态开始改变:高薪招揽技术人才、大规模重组模型与 AI 产品团队、持续向 “元宝” 倾斜资源。姚顺雨的到来,成为这一系列变化中最明确的拐点。
“把以前的节奏和惯性彻底打乱,才是回到正轨的第一步。” 一位混元大模型人士说。
腾讯在重振旗鼓,阿里则想试图定义 AI 叙事。
阿里提出了一个新概念:通云哥——通义实验室、阿里云与平头哥,即 AI、云计算和芯片三位一体发展。阿里认为自己是中国为数不多拥有全栈式 AI 能力——从芯片、大模型、云服务到产品的科技公司。这也是 Google 讲的故事。
三大互联网巨头中,阿里的主业赚钱效率最低。据报道,今年前三季度字节跳动的净利润在 400 亿美元左右;同期,腾讯与阿里的净利润为 300 亿美与 100 亿美元左右(自然年口径)。但这没有影响它投入的决心。
一位知情人士透露,阿里正考虑将未来三年投入到 AI 基建与云计算上的 3800 亿元提升至 4800 亿。在国内,阿里有自研的芯片真武 810E;在海外,它也在 “用一辆辆卡车来运采购的 GPU。” 一位知情人士说。最激进的时候,“连 RTX 4090 这类消费级显卡也大量买入,用来搭建推理集群、补充推理吞吐。”
2025 年 12 月,千问 App、蚂蚁旗下的灵光、阿福每天的拉新投放费用都在 1000 万元以上;千问 App 的单日投放峰值一度达到 1500 万元。
对字节跳动来说,“AI 是一件能影响整个世界的机会。” 一位接近字节跳动高层人士说。从 TopBuzz、TikTok 到 TikTok Shop,成立以后这家公司一直在寻找这样的机会,“越接近世界中心的事情探索价值才越大。”
相比腾讯与阿里分别在模型与产品上有劣势,字节跳动的能力更综合。豆包在 2025 年底成为了国内第一个日活跃用户数破亿的 AI 产品;豆包大模型的日均 Token 处理量达到 63 万亿,半年增长超 200%。
2023 年,字节跳动创始人张一鸣曾说,当下这个时代的操作系统级机会就是 AI + 计算。
2026 年字节会全面加速 AI 业务的全球化,东南亚等地区是重点,美国暂时不会进入。据了解,字节的目标是在大模型上至少成为全球第三。截至 2025 年底,豆包的海外版本 Dola 全球日活跃用户数突破 1000 万。
中国的这一轮大模型热潮始于 2023 年。在明星创业公司最受关注的早期阶段,互联网巨头们并不算显眼。三家选择了不同的路径:腾讯更重视 AI 的应用落地,因此相对低调地等待模型能力成熟;阿里将大模型推向开源,押注于做大生态,从而为云业务打开增量空间;字节跳动起步较晚,只能通过饱和式投入,尽快补齐技术短板。
直到 2025 年初, DeepSeek 为整个行业重新画了一条起跑线,巨头活跃了起来,战场有了硝烟的味道。
2026 年春节成为了这场战争的引爆点。