凤凰彩票官网首页 - Welcome

你的位置：凤凰彩票官网首页 - Welcome > 快乐彩 > 凤凰彩票官方网站英伟达惧怕宇宙的芯片

凤凰彩票官方网站英伟达惧怕宇宙的芯片

发布日期：2026-02-25 11:14 点击次数：200

凤凰彩票官方网站英伟达惧怕宇宙的芯片

公众号难忘加星标⭐️，第一时期看推送不会错过。

2026年2月14日，情东说念主节。黄仁勋、SK集团董事长崔泰源以及来自英伟达和SK海力士的约30名工程师在圣克拉拉一家名为99 Chicken的韩国炸鸡店享用炸鸡和啤酒。晚餐后，《韩国经济日报》的又名记者在店外拦住了黄仁勋，央求进行精真金不怕火采访。他复兴说：“有什么问题尽管问。”

以下是他说的话：

“下个月在GTC大会上，咱们将发布一些足以惧怕宇宙的芯片。咱们还是准备了多款前所未见的芯片。”

“每项本事都会遭遇极限，莫得什么是成竹于胸的。但有了像这么的团队（NVIDIA 和 SK 海力士的内存工程师联袂互助），就莫得什么是弗成能的。”

有三件事让我印象深远。

“多款芯片”。并非只发布一款GPU，而是同期推出多款居品。

“每项本事都在靠近极限。”这并非谦卑，而是对三大物理瓶颈的会诊：硅芯片尺寸减弱、电信号传输和内存带宽。

时机选在与SK海力士工程师共进晚餐之后。这激烈标明，存储器逻辑集成对于将来的发展至关繁重。

GTC 2026 将于 3 月 16 日至 19 日在圣何塞举行。在本文中，我将凭据公开信息、学术论文和供应链数据，阐发三种本事上最实在的情状以及一种恒久情状。

免责声明：本文内容为基于公开数据、学术论文和行业答复的本事分析，并非投资冷漠。GTC 2026 的执行公告可能与本文分析有所不同，系数情状均基于作家的推测。居品规格、时期表和性能数据以制造商的官方公告为准。

当先，布景：东说念主工智能芯单方濒临的三重防碍

第一皆墙：内存带宽差距

特拉华大学商量团队于2025年12月发表的一篇微基准测试论文清楚，B200的张量中枢在FP16/FP8下的隐隐量比H200高出1.57到1.59倍。在FP4下，推理隐隐量更是普及至2.5倍。筹谋引擎本人也在逐代显耀普及速率。

问题出在内存上。从 H100（HBM3，约 3.35 TB/s）到 B200（HBM3e，约 8 TB/s），再到 R200（HBM4，约 20.5 TB/s），GPU 的筹谋才气每代普及 3 到 5 倍，而内存带宽仅增长 2 到 3 倍。无论 GPU 的速率有多快，若是无法实时提供实足的数据，它就会闲置。正如我在之前的几篇著作中商量过的，这便是咱们所说的“内存墙”。

第二说念墙：互连电源

Jensen本东说念主在2025年GTC大会的主题演讲中也提到了这个数字。在一个假思的百万GPU集群中，仅可插拔收发器就会破钞数百兆瓦的功率。一个1.6Tbps的可插拔收发器梗概破钞30瓦，而DSP（数字信号处理）就占了其中一半以上。互连功耗正在蚕食筹谋才气。

在每个通说念 200 Gbps 的传输速率下，即使 PCB 板上 14 到 16 英寸的走线距离也会形成梗概 22 dB 的信号损耗。为了赔偿这种损耗，DSP 需要破钞特殊的功耗。铜的物理纵容正成为东说念主工智能数据中心膨胀的信得过瓶颈。

第三说念墙：LLM推理的结构性低效性

微软商量院和华盛顿大学（Splitwise）在 2023 年发表的一篇论文中领悟了一个基技艺实：LLM 推理分为两个阶段：预填充（快速处理，筹谋密集型）息争码（生成标志，内存带宽密集型），这两个阶段对硬件的要求迥然相异。若是在兼并 GPU 上运行这两个阶段，则其中一个阶段会接续打扰另一个阶段。

Splitwise 的商量标明，在疏导的功耗和资本预算下，将两个阶段分开不错提高 2.35 倍的隐隐量。这一理念其后成为 NVIDIA Dynamo（GTC 2025）、vLLM、SGLang 和其他主要推理框架的默许假想，并最终发展成为专用硬件：Rubin CPX。

在本文中，我将以这三个纵容要求为基础，预测Jensen在 GTC 2026 上所说的“将颠簸宇宙的芯片”是什么酷爱。

决策一：Rubin Ultra门路图成为现实

Rubin Ultra当今已列入NVIDIA 2027年下半年的居品门路图。它将四个GPU筹谋芯片集成在一个封装内，配备16个HBM4E显存堆栈（1TB），在NVFP4模式下性能可达100 PFLOPS，功耗为3600W。GTC 2026可能会带来对于居品量产时期表和系统竖立的具体更新信息。

本事中枢：

Rubin R200 是 NVIDIA 的首款芯片级 GPU。它吸收 CoWoS-L 中介层，集成了两个台积电 N3P 筹谋芯片和一个 I/O 芯片。Rubin Ultra 的竖立则翻倍：四个光刻胶尺寸的筹谋芯片、两个 I/O 芯片以及十六个 HBM4E 显存堆叠。

最大的挑战在于其庞大的尺寸。据SemiAnalysis分析，这种封装很可能吸收两个在基板层不绝的中介层，而不是一个越过八个光刻掩模的单个中介层。中间的I/O芯片负责基板层两部分之间的通讯。这意味着需要使用尺寸过大的ABF基板，卓绝了当今JEDEC封装表率端正的120mm × 120mm。

Rubin Ultra NVL576 机架（代号“Kyber”）由 144 个这么的封装构成，总计 576 个筹谋芯片，可提供 15 ExaFLOPS 的 FP4 运算才气，并配备 2，304 个 HBM 内存堆栈。这相称于 GB300 NVL72 性能的 14 倍。

它为何可能在2026年GTC大会上亮相:

内存供适时期表是要津身分。在2026年外洋消费电子展（CES）上，SK海力士发布了环球首款48GB 16层堆叠的HBM4实体内存。此前，36GB的12层堆叠HBM4内存已展现出11.7Gbps的传输速率，并于2025年下半年进入量产。三星也在为Rubin处理器进行HBM4测试。在JEDEC于2025年4月最终详情HBM4的官治安式（2048位接口，单堆栈最高2TB/s，最高16层堆叠）后，系数这个词行业的研发程度将显耀加速。

GTC 2026 可能会公布 Rubin Ultra 的具体坐褥日历以及 Kyber 机架的建筑细节。不外，我个东说念主以为，这可能还不及以成为 Jensen 之前预报的“惧怕宇宙”的时刻。

决策二：全硅光子堆栈

在2025年GTC大会上，NVIDIA发布了两款基于硅光子本事的集结交换机：

Quantum-X （InfiniBand）：展望2025年下半年发货。144个端口 × 800 Gbps = 115 Tb/s

Spectrum-X （以太网）：展望2026年下半年发货。端口数目从128个到512个不等，最高传输速率可达400 Tb/s。

2026 年 3 月的 GTC 大会碰巧在 Quantum-X 崇敬商用部署之前举行。这不单是是一次证明发货的契机，它还可能包括 Rubin Ultra 时间的 NVLink 光互连门路图。

本事中枢：

NVIDIA 的 CPO（共封装光学器件）中的要津器件是微环调制器（MRM）。它不错告成在硅光子芯片上处理每个波长 200 Gbps 的 PAM4 调制，其尺寸比传统的马赫-曾德尔调制器小得多。

这是吸收台积电的 COUPE（紧凑型通用光子引擎）工艺制造的，该工艺将电子电路（CMOS）和光子电路（PIC）集成在 3D 堆叠中，彼此之间的距离仅为几微米。

Quantum-X 开关系统 (Q3450-LD) 的构成如下：

Quantum-X800 开关 ASIC 吸收台积电 4N 工艺，凤凰彩票1070 亿个晶体管

集成在开关专用集成电路 (ASIC) 中的可拆卸光学子组件 (OSA)，共 18 个硅光子引擎。

144 个端口，每个端口速率为 800 Gbps，总带宽为 115 Tb/s

14.4 TFLOPS 集结内筹谋（夏普第四代）

与可插拔建立比拟，能效提高 3.5 倍，集结弹性提高 10 倍。

凭据 NVIDIA 的本事博客，这项本事是自 2016 年以来与台积电互助近十年，并领稀有百项专利复古的。

当今，NVLink 契约主要依靠铜缆传输。在单个机架（举例 Rubin Ultra NVL576）内不绝 144 个封装的就业器，铜缆是皆备可行的。但对于 NVIDIA 的下一代平台 Feynman（展望 2028 年发布），NVLink 需要越过多个机架进行传输。在这种距离下，铜缆的传输才气将濒临物理极限。

NVIDIA 已在 2025 年 GTC 大会上晓示了交换机级别的 CPO（光纤居品）。2026 年 GTC 大会可能会公布下一步狡计：NVLink 光纤架构的具体门路图，这意味着 GPU 之间的互连将从铜缆过渡到光纤。若是已毕，这将完善 AI 制造流程中系数互连层（而不单是是交换机）都吸收光纤的决策。

决策三：Rubin CPX 系统演示

Rubin CPX 是一款仅用于推理的 GPU，于 2025 年 9 月的 AI 峰会上发布。天然它莫得获取太多媒体神志，但这款居品将软件中经过考证的理念（来自 Splitwise/DistServe 的预填充-解码领会）应用到了专用芯片上。

CPX规格和假想理念：

为什么遴荐 GDDR7？在预填充阶段，瓶颈在于筹谋才气，而非内存带宽。跟着序列长度的增多，筹谋运用率接续攀升，而内存带宽运用率却会降至个位数。最终，你却要为险些用不到的不菲 HBM 带宽买单。

CPX 正面惩办了这种糟蹋问题。用 GDDR7 替换 HBM 可将内存资实质问约五分之一。用 CoWoS-S 替换 CoWoS-L 可简化封装。正如 SemiAnalysis 所说，CPX 是“一种以最小资本已毕最大浮点运算性能的假想”。

对于这些数字的评释：NVIDIA 官方公布的 30 PFLOPS 数据使用的是启用自稳妥压缩的 NVFP4。SemiAnalysis 计算其密集 FP4 筹谋才气约为 20 PFLOPS，梗概是 R200 密集 FP4 筹谋才气（约 33 PFLOPS）的 60%。比拟之下，消费级 GPU（举例 RTX 5090）的筹谋才气常常只须数据中心级 GPU 的 20% 驾驭。这是一个显耀的普及。

Vera Rubin NVL144 CPX 机架

单个机架内包含 72 个 R200 GPU 封装（144 个筹谋芯片）+ 144 个 CPX GPU + 36 个 Vera CPU

单机架：8 ExaFLOPS NVFP4，1.7 PB/s 带宽

与 GB300 NVL72 比拟，AI 推感性能普及 7.5 倍

英伟达官方声称：“每投资 1 亿好意思元，即可获取 50 亿好意思元的代币收入”。

2026 年 GTC 大会上可能会出现该机架偏激在 CSP 客户部署中的现场演示。

更宏不雅的视角：推理问题无法仅靠一块通用GPU惩办

CPX 的出现本人就标志着一种计谋编削。NVIDIA 承认，单一的通用 GPU 无法处理系数推理职责负载。

NVIDIA 与 Groq 于 2025 年 12 月达成的契约（200 亿好意思元的授权 + 东说念主才收购）也妥贴相同的模式。Groq 的 LPU 是一种片上 SRAM 架构，额外用于解码（令牌生成）。它皆备不使用 HBM。编译器以皆备详情味的姿色退换数据流，从辛勤毕超低延伸推理。正如 CPX 在预填充流程中移除 HBM 一样，Groq 在解码流程中也移除了 HBM。

当今还莫得集成居品。来回完成于今还不到三个月，而芯片级集成需要数年时期。但各个设施正在渐渐到位。R200负责老练和通用推理。CPX领有预填充功能。Groq的LPU领有解码功能。异构架构的详尽正在渐渐明晰，其中每个推理阶段都对应着单个机架内专用的芯片。

GTC 2026 是否会公布具体的 Groq 集成门路图，当今还不知所以。但 Jensen 曾暗示他准备了“多款足以颠簸宇宙的芯片”，因此很难摈弃价值 200 亿好意思元的推理架构是其中的一部分。

决策 4（恒久）：在 GPU 顶部堆叠内存——3D IC

这并非关乎最终居品，但大致才是Jensen与SK海力士工程师共进晚餐的信得过原因。（这部分老到个东说念主料想。）

现时哨案：2.5D，比肩清楚

H100、B200 和 R200 都吸收 2.5D CoWoS 封装。GPU 芯片和 HBM 内存堆叠比肩位于硅中介层上。GPU 芯片位于中心，周围环绕着六到八个 HBM 内存堆叠。这种封装姿色存在三个问题：

封装尺寸。GPU和 HBM 位于兼并平面，因此封装尺寸较大。Rubin Ultra 封装的尺寸更大。

中介层资本。封装资本的很大一部分来自中介层本人。这便是为什么东说念主们常说“封装比芯片贵”。

物理距离。数据通过中间层从GPU传输到HBM需要几毫米。

将来发展标的：3D IC，垂直堆叠

SK海力士副总裁李康旭（封装开辟负责东说念主）于2025年4月在电子信息工程师学会年会上发表了演讲：

“将DRAM芯片垂直堆叠在GPU上方可能会带来颠覆性的变革。这将显耀质问数据传输延伸，并提高带宽和能效。”

他将这种架构称为3D HBM，并暗示SK海力士狡计从HBM5代（展望2028至2029年）运行引入该架构。KED Global报说念称，SK海力士正在与包括NVIDIA在内的无晶圆厂公司就“将HBM告成置于处理器之上的集成假想”进行洽谈。在此布景下，SK海力士积极招聘逻辑半导体假想师（CPU、GPU）就显得愈加合理了。

{jz:field.toptypename/}

若是这项本事得以已毕，GPU芯片将成为基础芯片。HBM DRAM层告成堆叠在其上，中间层将被移除。GPU内存适度器到DRAM的距离将从几毫米裁汰到几十微米。运用台积电的SoIC-X夹杂键合本事，与当今的CoWoS比拟，移动单个比特的能耗将质问一到两个数目级。这不单是是性能的普及，它将绝对改变东说念主工智能系统的能耗形式。

为什么这件事还没发生

散热方面，GPU功耗高达400至700瓦，并产生庞大的热量。当今，散热片告成装置在GPU顶部以舒服热量。若是将DRAM摒弃在GPU顶部，热量必须先经过DRAM。DRAM结温纵容（85°C）远低于GPU热门温度（150°C以上）。后面供电、告成液冷和微通说念冷却都是潜在的惩办决策，但当今尚无任何本事不错量产。

良率。系数组件在拼装完成后都会进行测试。若是GPU良率为85%，八个HBM堆栈的良率为95%，则总良率为0.85 × 0.95^8 ≈ 56%。这意味着近一半的芯片是废品。已知良品芯片（KGD）测试有所匡助，但这仍然是3D集成电路濒临的一项根人道经济防碍。

展望时期表

HBM4（2026）：吸收台积电N12/N5定制基板。仍为2.5D CoWoS。这是3D打印的“准备阶段”。

HBM4E（2026 年至 2027 年）：可引入夹杂键合本事用于 20 层堆叠结构。仍为 2.5D。

HBM5（2028 年至 2029 年）：SK 海力士门路图上的首个 3D HBM 尝试。与 NVIDIA 的 Feynman 时期表一致。

HBM6 及将来（2030 年及以后）：GPU-DRAM 3D IC 走向主流。

2026 年 GTC 大会上可能出现的情况：与其说是发布制品，不如说是崇敬晓示英伟达与 SK 海力士纠合开辟 3D 芯片。詹森在 99 Chicken 的晚餐大致是发布前的调解会议。

（起头：编译自damnang2）

*免责声明：本文由作家原创。著作内容系作家个东说念主不雅点，半导体行业不雅察转载仅为了传达一种不同的不雅点，不代表半导体行业不雅察对该不雅点赞同或复古，若是有任何异议，接待联系半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第4327期内容，接待神志。

加星标⭐️第一时期看推送

求推选

上一篇：凤凰彩票app 神舟二十三号飞船辐照场准备，3东说念主乘组：港澳航天员要首飞了？

下一篇：凤凰彩票官方网站富养的真相: 不是砸钱看寰宇, 是教孩子看清寰宇

你的位置：凤凰彩票官网首页 - Welcome > 快乐彩 > 凤凰彩票官方网站 英伟达惧怕宇宙的芯片

凤凰彩票官方网站 英伟达惧怕宇宙的芯片

你的位置：凤凰彩票官网首页 - Welcome > 快乐彩 > 凤凰彩票官方网站英伟达惧怕宇宙的芯片

凤凰彩票官方网站英伟达惧怕宇宙的芯片