英伟达将在 GTC 2026 上发布基于 Groq 技术的推理芯片

英伟达将在 GTC 2026 上发布基于 Groq 技术的推理芯片

英伟达将在 GTC 2026 上发布基于 Groq 技术的推理芯片

英伟达 将于下月在圣何塞举行的 GTC 开发者大会上发布一款专为 AI 推理计算设计的新处理器,该处理器基于 2025 年平安夜达成的里程碑式 200 亿美元交易中从初创公司 Groq 收购的芯片技术打造。尽管英伟达公布了创纪录的季度收益,但本周股价仍大幅下跌,两个交易日内下跌约 7%。

Groq 收购案与推理市场转向

这款新芯片预计将被命名为 LPX,代表着英伟达在快速增长的 AI 推理市场上最雄心勃勃的进军——AI 推理是指训练好的 AI 模型被投入使用以生成响应并为实际应用提供支持的阶段。其核心是来自 Groq 语言处理单元(Language Processing Unit)的技术,该技术使用片上 SRAM 而非外部内存,推理速度可达每秒 500 到 750 个 token,远超标准 GPU 设置通常每秒约 100 个 token 的速度。

英伟达于 2025 年 12 月 24 日完成了对 Groq 的收购,获得了这家初创公司的知识产权,并雇用了其约 80% 到 90% 的员工,包括创始人 Jonathan Ross——他是谷歌 TPU 的原始设计者。首次报道此次交易的 CNBC 称这是英伟达有史以来最大规模的收购。CEO 黄仁勋在给员工的邮件中写道,这项协议将使英伟达"能够将 Groq 的低延迟推理技术整合到英伟达工厂架构中,将其扩展到服务更广泛的 AI 推理和实时工作负载"。

LPX 对 AI 领域意味着什么

根据半导体研究刊物 SEMIVISION 的预览报道,英伟达计划在 GTC 大会上推出升级版 LPX 机架,每个机架配备 256 个 LPU,是初始 64 个 LPU 配置的四倍。该系统的设计目的并非取代英伟达基于 GPU 的训练硬件,而是作为补充,让 OpenAI 等 AI 开发者客户能够在 GPU 上训练模型,然后在同一 CUDA 生态系统内的 LPU 增强硬件上部署模型以实现超快速推理。

GTC 2026 大会定于 3 月 16 日至 19 日在圣何塞举行,黄仁勋曾向媒体表示,公司将在大会上推出一款"震惊世界"的芯片。

尽管创纪录的盈利,股价仍承压

GTC大会前的准备工作被英伟达股价艰难的一周所掩盖。该公司公布第四财季营收为681.3亿美元,同比增长73%,超出分析师预期,并指引第一财季营收约为780亿美元。但投资者在消息公布后抛售股票,股价周四下跌5.5%,周五再次下跌,创下自11月以来最大单周跌幅。据CNBC报道,投资者担忧超大规模云服务商正在开发自己的定制AI芯片,以及对AI支出可持续性的更广泛质疑,这些因素打压了市场情绪。