曦望联席CEO王勇：启望S3研发完成，年中流片年底回片量产

专注于推理 GPU 的曦望（Sunrise）昨日发布新一代推理 GPU 芯片启望S3，并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。

曦望联席CEO王勇在发布会上表示，AI行业正在进入以应用落地为核心的下半场，推理逐步超越训练，成为主要算力消耗场景。相比训练阶段的一次性高投入，推理更强调长期交付能力、单位成本和系统稳定性，这也正在改变GPU的竞争逻辑。

据王勇透露，启望S3芯片内部研发基本已经完成，将于今年年中流片年底回片量产，启望S3会是一款2026年上市的极具性价比，具有十倍以上性价比提升的推理型GPU。

“按照量产一代发布一代预研一代的节奏。未来两年，我们还会推出高性能启望S4推理GPU以及安全可控启望S5-GPU芯片。”

以下是曦望联席CEO王勇演讲实录：

曦望联席CEO王勇：启望S3研发完成，年中流片年底回片量产

王勇：我觉得曦望这家公司特别让我感触很深，因为我们在商汤孕育了几年之后，又脱胎换骨成为曦望。

今天我在这里给大家带来我们启望S3以及相关产品，这将是开启推理GPU里程碑式的产品。

大家都知道大模型已经进入了下半场，就像刚才冰总讲的，最初的时候，大模型从ChatGPT的llama开始。随着去年DeepSeek，尤其是DeepSeek满血版带来特别惊艳表现的开源大模型以来，那大模型在各类垂域场景应用非常广泛。过去一年推理的token增长了100倍，也就是说，在云端，在边缘侧，在端侧，推理的业务大大超过了训练。我们曦望认为推理超越信任现在成为案例的核心驱动力。

随着最近AI agent以及飞利浦AI这一系列热门应用进一步普及。我们曦望看到，推理token仍然会以几十倍的速度去往前成长。随着这个成长，我们认为曦望 All In推理这件事儿就变得特别正确。行业在过去一年，大多数的用于推理的芯片仍然是训推一体的，那么训推一体的芯片，它面临的几个大的困境。首先芯片的成本高昂，供应不稳定。第二，使用成本也高，能耗和算力比不经济，最后它的适配和运维投入非常大。

对于曦望来说，针对这些行业的痛点，我们提出了自己前瞻性进行了布局，战略性地选择了专注于研发推理GPU。过去几年在集团孵化的过程中，我们的产品都是从真实的场景需求出发，依托对AI行业的深度洞察，在不断地满足极致的需求的过程中迭代出来的。

我们说曦望是一家更懂AI也更懂芯片的公司。我们有一群平均超过15年行业经验的芯片老兵，同时还有一群天才的大模型架构师和研究员组成。我们能够更加准确地切中行业的痛点，为行业提供曦望的解决方案。

我们拥有全栈资源的GPGU架构，覆盖从自研的指令集到GPGUIP到SOC到硬件系统。经过过去S1、S2从研发到产品的打磨，以及S3研发的打磨，显示出我们的研发团队有极强的芯片研发能力和架构迭代能力。因为更懂AI，所以贴近用户需求，我们更早提出了用大容量的DDR来替代HBM, 用高性价比的大模型推理芯片来替代训推一体芯片的概念。在战略上率先all in推理GPU市场。

接下来，我来介绍一下我们的产品路线图。从2018年开始，我们就开始着力研发第一代S1推理芯片。在2020年量产取得了上万片的场景落地。

从2020年开始，我们着力打造了启望S2高性能的GPGU架构芯片。这款芯片我们对标了当时行业最头部的GPU企业最有竞争力的产品，自定义的指令集，自研的GPGPU架构和相应的IP，这款芯片在2021年流片，在2023年取得了非常好的产品化的路径。最终在之江实验室的送测上也取得了非常好的国内一线的性能指标。尤其在去年，DeepSeek满血版的适配，显示这款芯片的技能居于国内头部的地位。

今天我们要发布的是依托我们all in推理的理念，做了一款极致性价比的GPU芯片——启望S3。这款芯片目前内部研发基本已经完成，将于今年年中流片年底回片量产，启望S3会是一款2026年上市的极具性价比，具有十倍以上性价比提升的推理型GPU。

曦望联席CEO王勇：启望S3研发完成，年中流片年底回片量产

曦望联席CEO王勇：启望S3研发完成，年中流片年底回片量产

财经数据更多>>