当地时间周二,英伟达在加州圣克拉拉举办的AI基础设施峰会上发布了最新的 Rubin CPX GPU。这款芯片专为处理百万级Token的代码生成和视频生成任务而设计。

英伟达 Vera Rubin 芯片(图片来源:英伟达)
在人工智能领域,Token(标记)是一种基础处理单位,可以代表一个词、一个子词,甚至是视频或音频中的片段。无论是使用 ChatGPT、Claude、Gemini 还是 Grok,这些模型都会将用户输入的文本或指令拆分成若干 Token,并基于这些 Token 进行分析和生成回答。
Rubin CPX 将与英伟达的 Vera CPU 及 Rubin GPU 配合使用,构成 Vera Rubin NVL144 CPX 平台的一部分。其中,“NVL144” 表示该系统配备 144 个 GPU。
英伟达首席执行官黄仁勋表示:“Vera Rubin 平台将再次推动 AI 计算实现跨越式发展——不仅推出新一代 Rubin GPU,还引入了一类全新处理器架构——CPX。正如 RTX 曾彻底革新图形处理与物理模拟领域,Rubin CPX 是首款专为‘超大规模上下文 AI’打造的 CUDA GPU,可支持模型在数百万个 Token 的知识范围内同时进行推理与运算。”
据官方介绍,Vera Rubin NVL144 CPX 的 AI 性能将达到现有 Grace Blackwell 架构 GB300 NVL72 系统的 7.5 倍。英伟达表示,该平台将显著提升客户的 AI 商业化能力,并测算出:每投入 1 亿美元,预计可实现高达 50 亿美元的基于Token的收益。
Rubin CPX 预计将在 2026 年底正式上市。