qinbafrank(@qinbafrank):英伟达最新的GPU少用Dram是怎么回事？昨晚SemiAnalysis这个报道说英伟达主动将下一代AI超级计算机平台——Rubin NVL72机架的CPU侧SOCAMM DRAM容量砍半。消息一出，整个存储板块大跌。详细聊聊： 1、这到底在说什么？ NVIDIA 2026年主力AI机架平台，一柜装72颗Rubin GPU + 36颗Vera CPU，通过NVLink全互联，形成“一块巨型GPU”。GPU侧用HBM4（每柜约20.7TB），CPU侧用SOCAMM——一种可插拔的LPDDR5X系统内存模块，便于维护和故障隔离。原计划：每颗Vera CPU用8个192GB SOCAMM模块（最高约1.53TB/CPU），全柜CPU侧总DRAM约55TB。现在：大部分系统切换到96GB SOCAMM模块，全柜CPU侧DRAM降至约28TB（砍~50%）。关键不变：GPU的HBM4容量和带宽完全没动，核心算力（训练/推理FLOPS）不受影响。 SemiAnalysis估算机架硬件成本（BoM）：从$7.6M 降到 $6.8M（省约10%）。简单说英伟达在“非核心”CPU系统内存上主动降配，只为更快、更稳地出货整机。 2. 核心原因是什么？其实本质是供应链现实打脸，LPDDR5X高密度SOCAMM严重短缺。这次下调原因不是需求不足，是供给瓶颈。16 层超高密度 LPDDR5X 极其困难的封装良率，Hynix/三星无法提供足够数量的192G内存给到客户，为了保证所有Rubin GPU都能有对应的DRAM可以用，英伟达主动进行供应链风控，下调了单机柜用量所以也是英伟达的战略选择，与其等高规格内存、导致整柜延误/缺货，不如主动降到96GB版本，确保所有Rubin GPU都能配齐系统内存，快速进入量产/交付阶段。这其实是变相验证了，当下存储领域处于“供给结构性短缺”状态，而AI对内存需求则是爆炸式增长（HBM + LPDDR5X）。特别是hbm配置完全没有变动 3、而且还有其正面影响 1）加速Rubin部署：成本更低、TCO更好， hyperscalers（MSFT、CoreWeave、xAI等）更愿意大规模采购。MSFT已完成首柜bring-up，降配后量产节奏更快。 2）客户获利：每柜省80万刀，单GPU-hour便宜0.26刀，长期token economics更好，推动更多AI投资。 3）英伟达生态强化：继续把控供应链（直接买内存），进一步巩固AI工厂主导地位。当然CPU侧DRAM配比下降，内存密度降低（原55TB，现在28TB），对极长上下文推理、多Agent并行、超大KV Cache等场景会有影响（可能需要更多跨节点通信或SSD offload）。这应该会利好SSD和光连接用量上升：逻辑当在于 CPU 侧用于承载庞大上下文（KV Cache）的系统内存缩水后，GPU算力瓶颈将无可避免地向SSD侧和互连侧转移，CSP需要采购更多的高性能SSD或者采用更高性能的柜内连接（Scale Up）连接方案，利好NAND企业和光链接企业的需求。本条由@bitget

2026.06.05 03:02

英伟达最新的GPU少用Dram是怎么回事？昨晚SemiAnalysis这个报道说英伟达主动将下一代AI超级计算机平台——Rubin NVL72机架的CPU侧SOCAMM DRAM容量砍半。消息一出，整个存储板块大跌。详细聊聊： 1、这到底在说什么？ NVIDIA 2026年主力AI机架平台，一柜装72颗Rubin GPU + 36颗Vera CPU，通过NVLink全互联，形成“一块巨型GPU”。GPU侧用HBM4（每柜约20.7TB），CPU侧用SOCAMM——一种可插拔的LPDDR5X系统内存模块，便于维护和故障隔离。原计划：每颗Vera CPU用8个192GB SOCAMM模块（最高约1.53TB/CPU），全柜CPU侧总DRAM约55TB。现在：大部分系统切换到96GB SOCAMM模块，全柜CPU侧DRAM降至约28TB（砍~50%）。关键不变：GPU的HBM4容量和带宽完全没动，核心算力（训练/推理FLOPS）不受影响。 SemiAnalysis估算机架硬件成本（BoM）：从$7.6M 降到 $6.8M（省约10%）。简单说英伟达在“非核心”CPU系统内存上主动降配，只为更快、更稳地出货整机。 2. 核心原因是什么？其实本质是供应链现实打脸，LPDDR5X高密度SOCAMM严重短缺。这次下调原因不是需求不足，是供给瓶颈。16 层超高密度 LPDDR5X 极其困难的封装良率，Hynix/三星无法提供足够数量的192G内存给到客户，为了保证所有Rubin GPU都能有对应的DRAM可以用，英伟达主动进行供应链风控，下调了单机柜用量所以也是英伟达的战略选择，与其等高规格内存、导致整柜延误/缺货，不如主动降到96GB版本，确保所有Rubin GPU都能配齐系统内存，快速进入量产/交付阶段。这其实是变相验证了，当下存储领域处于“供给结构性短缺”状态，而AI对内存需求则是爆炸式增长（HBM + LPDDR5X）。特别是hbm配置完全没有变动 3、而且还有其正面影响 1）加速Rubin部署：成本更低、TCO更好， hyperscalers（MSFT、CoreWeave、xAI等）更愿意大规模采购。MSFT已完成首柜bring-up，降配后量产节奏更快。 2）客户获利：每柜省80万刀，单GPU-hour便宜0.26刀，长期token economics更好，推动更多AI投资。 3）英伟达生态强化：继续把控供应链（直接买内存），进一步巩固AI工厂主导地位。当然CPU侧DRAM配比下降，内存密度降低（原55TB，现在28TB），对极长上下文推理、多Agent并行、超大KV Cache等场景会有影响（可能需要更多跨节点通信或SSD offload）。这应该会利好SSD和光连接用量上升：逻辑当在于 CPU 侧用于承载庞大上下文（KV Cache）的系统内存缩水后，GPU算力瓶颈将无可避免地向SSD侧和互连侧转移，CSP需要采购更多的高性能SSD或者采用更高性能的柜内连接（Scale Up）连接方案，利好NAND企业和光链接企业的需求。本条由@bitget_zh赞助，「Bitget 买美股：秒级入场，丝滑交易」

qinbafrank@qinbafrank

2026.05.27 01:09

存储大厂变身“超级乙方”，不得不说长期协议改变存储大厂的业务逻辑和估值逻辑。昨天瑞银一份报告把美光推到万亿美金市值，今天朝鲜日报的报道也让海力士跨越万亿美金市值门槛。核心逻辑跟昨天聊闪迪的长期协议是一致的：存储厂商与客户签订多年期长期供应协议，不再像传统存储行业那样靠季度现货议价，而是用强约束力的合同锁定产能、收入和风险。让未来几年的业绩确定性大大增强。今天韩国的《朝鲜日报》也报道了：三大科技巨头（Alphabet/谷歌、微软、Meta）主动提出出资支持SK海力士在龙仁新建晶圆厂的投资。SK海力士因现金流极为充裕，拒绝了这些资金援助。公司内部认为：把这些“投资提议”当作谈判筹码（leverage），换取更长期、更优惠的供应合同（LTA），继续维持“超级乙方”地位。这跟昨天聊闪迪长期协议是一致的，存储大厂正在利用产能稀缺供给不足的优势，以当下现金储备充裕带来的耐心，把客户的需求转化成更长周期（3-5年甚至更长）的锁定协议，而不是急于扩产。能看出来存储大厂整体的逻辑都是： 1）不接受客户出资控制扩产节奏； 2）用产能稀缺来推动客户锁定长期协议（3年起步，现在更5年），拿货先签长约； 3）总合同金额10-30%的预付款，价格保底，闪迪的长约更夸张客户还要提供抵押和金融担保；以前长约LTA是为了稳需求、防下跌；现在是顺势加价、锁定高位、锁死客户，把行业红利提前锁进财报。LTA 不再只是避险，而是涨价与锁利的工具如果长期协议确实能够在行业下行期平滑盈利波动，那么存储大厂的盈利周期性将显著弱化，其历史上被市场赋予的"周期折价"将失去合理性——这正是瑞银估值重估的核心逻辑起点本条由@bitget_zh赞助，「Bitget 买美股：秒级入场，丝滑交易」