搜索 AI芯片相关的推文

勃勃OC@bboczeng

2026.05.08 23:36

AI 芯片制造商 Cerebras 据称计划在周一上调 IPO 定价 $CBRS 预计将在周一为其 IPO 定价，价格区间为每股 125 至 135 美元。据称，该 IPO 的认购倍数已经超过 20 倍。

显示更多

0

5

6

0

转发到社区

rick awsb ($people, $people)@rickawsb

2026.04.18 18:45

AI芯片的scale up，底层=物理的限制是reticle：光刻机一次只能曝光一个固定大小的区域，上限大约在800mm²左右。这决定了目前单颗芯片的尺寸的硬天花板。行业突破这个限制的难度非常大，接近物理极限，因为光刻的面积和精度往往不能两全（镜头等设备限制），所以只能绕开它。早期是大GPU，但这样做成本和良率都会变得很差。后来逐渐转向另外两条路径：一种是把系统做大，用一块更大的“硅底板”interposer把多个芯片拼在一起；另一种是把芯片拆小，再通过高速连接重新组合。 interposer本质上不做计算，只负责连接。GPU、HBM这些芯片放在上面，通过更细、更密、更短的连线实现高带宽数据交换。AI算力之所以能上一个台阶，很大程度上不是因为算得更快，而是数据在不同芯片之间移动得更快。但interposer本身也会超过reticle的尺寸，这时候就需要用到stitching。做法就像拼瓷砖：一块一块曝光，然后精确对齐，拼成一个整体。难点在于精度控制，边界一旦对不齐，连线就会出问题。这种方式只适用于对精度不那么敏感的结构。像CPU、GPU这类逻辑芯片，对时序的要求极高，任何纳米级误差都可能影响性能，所以不能用stitching。interposer因为只是布线层，没有复杂逻辑，可以容忍这种拼接带来的误差。围绕连接这件事，行业逐渐形成了cowos和emib两种不同的实现路径。一种是做一个统一的大平台，把所有芯片放在同一块interposer上，连接集中在这层完成，带宽能力很强，但成本也高。另一种是不做大底板，只在需要高速连接的地方嵌入一小块桥接结构，按需提供带宽，结构更灵活，制造压力也更小。在AI训练场景下，模型规模大，HBM带宽成为关键，整个平台需要维持极高的数据吞吐，这类设计更依赖大面积interposer。但推理场景的约束不一样，更关注成本、延迟和并发，带宽需求往往集中在局部，不需要整个平台都维持极致带宽。这时候，把芯片拆成多个模块，再用局部高速连接拼起来，会更合适。这也是EMIB这类方案更容易在推理芯片和ASIC里出现的原因。它不需要一整块大interposer，而是在关键位置提供高带宽连接，可以把计算、缓存、IO等模块分开设计，再按需组合。这样的结构更容易控制成本，也更有利于根据不同业务场景做定制化调整。对云厂自研芯片来说，这种灵活性很重要。当然，推理并不完全不需要高带宽。在一些大模型推理场景里，HBM依然重要，对应的封装方案也会更接近训练芯片。但在更广泛的推理需求中，成本和规模才是核心约束，这使得模块化和局部互连的价值变得更高。站在26年一季度末看未来，AI算力的扩展路径其实已经很清晰了。不是把单个芯片做得越来越大，而是把计算拆开，再用更高带宽把它们连接起来。芯片本身的尺寸被reticle锁死了，系统的规模则由连接能力决定。免责声明：本文非投资建议dyor

显示更多

0

16

213

39

转发到社区

麦通MSX@MSX_CN

2026.05.14 09:45

🚀 AI 芯片新贵 Cerebras Systems，将在开盘撮合完成后，由 MSX 同步 Nasdaq 节奏上线现货交易。 “英伟达挑战者”，今天正式上桌。👀 公告详情👇 #MSX# #麦通# #链上美股用麦通# #CBRS# #AI#

显示更多

0

46

66

55

转发到社区

Art of Speculation@ArtofSpecuycky

2026.05.14 19:01

$AVGO 是AI芯片的龙头。但历史告诉你，真正暴富的人买的是龙二 $MRVL 先说一个关于半导体行业的反直觉规律：在一个严重缺货的市场里，获利最大的往往不是龙头，而是那个追赶中的龙二。（Herman老师分析intel观点我觉得说的很好，也同样非常适用于 $MRVL) 理由很简单：当产能严重不足，买家再也无法只依赖龙头一家供应商。他们开始把订单给原本觉得"不够好"的替代者。而这个替代者，突然发现自己的产品以前没有人要，现在成了香饽饽——价格可以谈，条款可以谈，一切都变了。晶圆缺货时，原本没有人愿意把订单给Intel的客户，开始认真研究18A了。那么，在AI定制芯片这个正在快速缺货的赛道里，获利最大的龙二会是谁？我的答案是 $MRVL 。 1. 先理解结构 AI芯片市场分两层：第一层：通用GPU Nvidia统治，没有任何人能挑战。H100、B200、Blackwell——超大规模云厂商需要它们，别无选择。这层市场已经被充分定价了。Nvidia市值5.7万亿，没有人会漏掉这个机会。第二层：定制ASIC（专用AI加速芯片）这是一个完全不同的故事。每一家超大规模云厂商都在开发自己的专用芯片： Google有TPU（张量处理器），Amazon有Trainium（AI训练）和Inferentia（推理），Meta有MTIA（AI推理加速），Microsoft有Maia（Azure AI加速）。为什么要自己开发芯片？因为通用GPU虽然强大，但它服务所有人，没有为特定工作负载优化。自研芯片可以针对自己的模型架构和推理需求精确设计，功耗更低，成本更低，效率更高。这是一个不可逆的趋势——超大规模云厂商越大，自研芯片的动力越强。但有一个关键问题：这些云厂商需要设计合作伙伴。芯片设计是极其复杂的工程，需要有人懂SerDes，懂先进封装，懂chiplet集成，懂供应链——不是随便一家公司能做到的。全球有能力承接超大规模云厂商定制ASIC设计的公司，只有两家： $Broadcom，和 $Marvell。 2. AVGO vs MRVL：龙头和龙二的真实差距先看数字： Broadcom在ASIC市场占约55-60%的份额，与Google的TPU合作锁定到2031年，客户包括Meta、OpenAI等顶级厂商。Marvell约占15%的份额，排名第二Broadcom领先是事实，毫无争议。但有几个数字值得认真对比： AVGO MRVL 市值 $2万亿 $1,470亿 ASIC市占 55-60% 15% FY26AI营收 $200亿+ $96亿 Forward PE 31倍 36倍 Broadcom在定制ASIC市场记录了约$200亿的AI总营收，而Marvell的AI相关营收约$96亿。从市值角度：AVGO的市值是MRVL的13.6倍，但ASIC市场份额只是MRVL的4倍，AI营收只是MRVL的2倍。这个不对称，是MRVL存在的核心机会。 3. MRVL独特的地方：两场战争同时押注这是我认为最关键的一点，也是MRVL和所有其他AI芯片公司最本质的区别。 MRVL同时押注了两个互相独立的万亿级叙事：叙事一：定制ASIC——去Nvidia化的最大受益者 Marvell的数据中心部门FY2026增长46%，超过$60亿，管理层指引FY2027同比再增约40%。定制芯片年化营收已达$15亿规模，两个AI加速器项目处于高产量阶段，第三个超大规模客户合作正在进行。 Nasdaq 最重要的一个进展： 2026年4月，Google被报道正在与Marvell进行深度谈判，共同开发内存处理单元和下一代TPU，这正是Google此前几乎完全交由Broadcom负责的工作。如果谈判成功，Marvell将成为AI行业最具战略意义的芯片项目之一的核心设计伙伴。这是什么意思？ Broadcom和Google的TPU合作锁定到2031年——这是Broadcom的护城河，但不是MRVL的天花板。Google开始和MRVL谈，不是要取代Broadcom，而是要建立第二供应商。这正是"缺货时代，落后者获利"的经典逻辑。当TPU的设计需求超过了Broadcom单独能服务的上限，Google开始把部分项目分给MRVL。这一单谈成，MRVL同时拥有Amazon和Google双超大规模客户锚定——三个超大规模客户（Amazon、Microsoft、Google）大幅降低了单一客户集中的风险，给市场提供了更清晰的多年营收增长路线图。叙事二：光互连DSP——AI集群神经系统的命门 MRVL是目前唯一同时覆盖定制ASIC设计、1.6T光学DSP、硅光子技术（通过Celestial AI收购）和CXL交换的全栈公司——这是任何单一竞争对手都无法复制的护城河。光互连DSP是什么？当GPU和GPU之间需要通信，数据需要在光纤里传输。但光纤里走的是模拟光信号，计算机需要的是数字信号。DSP（数字信号处理器）就是这两个世界之间的翻译器——它把数字数据编码成光信号发出去，再把收到的光信号解码成数字数据。 MRVL的PAM4 DSP是全球800G和1.6T光模块的核心芯片之一。光互连业务的需求与AI集群的互连基础设施同步扩张——每一个上线的AI集群都需要完整的互连协议栈，不需要等待GPU的供应情况。这是最关键的逻辑： GPU供应有时候是稀缺的，但光互连不等GPU——只要数据中心在建，只要AI集群在运行，光互连就需要。 MRVL的DSP是一个和GPU并行运行的独立需求，不是GPU需求的影子。 4. 我自己的判断：为什么MRVL的故事比AVGO更有弹性 AVGO是龙头，MRVL是追赶者。但在这个特定的历史时刻，追赶者的弹性更大，原因有三：原因一：基数效应 AVGO已经是$2万亿市值，要翻倍需要成为$4万亿的公司。MRVL只有$1,470亿，翻倍只需要$2,940亿——和AVGO现在市值的15%相当。同样的资金流入，对MRVL股价的推动效果是AVGO的13倍以上。原因二：Google的变量 AVGO和Google的合作是锁定的，这是护城河，但也意味着它的上行惊喜已经被充分定价。MRVL和Google的谈判还没有正式宣布——这是一个尚未被市场定价的潜在催化剂。如果Google正式宣布，MRVL立刻拥有Amazon+Google双超大规模客户，ASIC市场份额从15%向25%+跳升的路径被打开。原因三：两个叙事不相关 AVGO的核心护城河是ASIC和VMware软件。 MRVL的两个叙事——ASIC和光互连DSP——是完全独立的业务。 ASIC受益于去Nvidia化，光互连受益于AI集群扩张。两个独立的增长引擎，互相不依赖，互相不替代。 MRVL在多个AI基础设施顺风中同时暴露：定制芯片、光互连、数据中心网络和更广泛的超大规模资本支出周期。这种在AI主题内的多元化暴露，使它成为纯粹的GPU标的（如Nvidia）的有吸引力的补充。 5. 估值合理吗？ $MRVL：Forward PE 36.4倍，市值$1,470亿。 $AVGO：Forward PE 31倍，市值$2万亿。 $MRVL的Forward PE比 $AVGO略高，但增速也更快： $MRVL FY27营收预期：约$110亿，同比增速约40% $AVGO FY27增速约25-30%。PEG（PE/增速）： $MRVL：36.4 ÷ 40 = 0.91, $AVGO：31 ÷ 27 = 1.15 PEG低于1都算便宜。用PEG来衡量，MRVL比AVGO便宜约20%。而且MRVL有Google催化剂这个尚未被定价的变量，AVGO没有。如果Marvell股价涨到$400，需要数据中心营收FY27超过$90亿，Google ASIC合同正式宣布，自定义硅年化营收达到$30亿。在这些条件下，ASIC业务40倍Forward EV/EBITDA，光互连业务20倍EV/Sales。我觉得2027年是很有可能达到的，这还是在理性的估值下，如果是ai融涨疯牛选择忽略估值的话，如果NVDA到360分析师预测最高，也就是8.8T, 我预测8-10T，那么AVGO会到3-4T, MRVL到500B-1T都问题不大。 6. 三个需要追踪的关键变量变量一：Google ASIC合同的正式宣布这是目前MRVL最大的潜在催化剂。谈判已经在进行，但没有正式宣布。每过一个季度没有宣布，市场会稍微失去耐心。但一旦宣布，估值逻辑发生质变。变量二：1.6T DSP的市场份额 Marvell已经开始出货1.6T PAM DSP，基于5纳米工艺，并推出了下一代3纳米版本，将光模块功耗降低超过20%。 800G向1.6T的迭代是MRVL DSP业务的下一个量子跳跃。如果MRVL能在1.6T时代维持甚至提升市场份额，光互连业务的营收会非线性增长。变量三：Celestial AI的硅光子整合 MRVL收购了Celestial AI，进入硅光子领域。这是CPO时代最关键的技术平台——把光学引擎直接集成进芯片封装。如果MRVL能在CPO时代把DSP和硅光子整合成一个完整的解决方案，它的价值会远超现在的定价。 7. 最终判断：MRVL是这轮AI牛市里最干净的不对称机会 AI芯片市场分三类公司：第一类：Nvidia——已经被充分定价的龙头。故事最好，估值最贵，上行惊喜空间有限。第二类：纯ASIC公司（AVGO）——护城河深厚，但增速放缓在定价中。Google TPU锁定到2031年是确定性，也是上行惊喜的天花板。第三类：MRVL——两个叙事都在爆发，Google催化剂未定价，市值基数小。这是不对称机会的经典形态，下行有Amazon锚定，有光互连稳定收入，不会归零，上行有Google合同宣布+CPO爆发+ASIC市场份额提升，估值可能从$1,470亿走向$5,000亿+。 $MRVL也是我重仓持有的标的之一，短期technical角度今天收长上影线，日线级别调整要来，加仓机会在第一目标165，第二目标140。如果给机会到140补那个缺口，我仓位加满（图1）。总结：回到那个反直觉的规律：缺货时代，落后者获利最大。 ASIC市场正在缺货——Broadcom一家根本无法满足所有超大规模客户的定制需求。光互连正在缺货——AI集群每季度都在扩张，DSP的需求只增不减。MRVL是这两个缺货赛道里，那个正在被需要的追赶者。历史一次次证明：当产能不足、供应商只有一两家的时候，第二名是最好的弹性高的投资标的（Nvidia和Amd，TSMC和Intel。）因为所有人都开始认真研究它了。 #MRVL# #Marvell# #AVGO# #Broadcom# #ASIC# #定制芯片# #光互连# #DSP# #Google# #Amazon# #Nvidia# #AI芯片# #半导体# #美股# #龙二补涨# #CPO# #硅光子# #AI基建# #USStocks# #AIStocks# #数据中心# #去Nvidia化#

显示更多

0

24

324

58

转发到社区

rick awsb ($people, $people)@rickawsb

2026.04.26 20:52

最近提交ipo的ai芯片的新宠Cerebras火遍硅谷。其芯片在小模型场景下，其推理速度最高可达 H100 的 20 倍；而超大规模模型（如 400B 参数量级），Cerebras CS-3 系统的单用户响应速度约为 B200 的 2.4 倍那么cerebras究竟是如何做到的呢？它是否会成为英伟达杀手呢？我们需从算力演进的本质开始。 AI算力的演进，正在从“算力本身”转向“通信与系统结构”。在这条演进路径上，Cerebras Systems提供了一种完全不同的答案：不是优化分布式，而是尽可能消灭分布式。一、两条路线：消灭通信 vs 优化通信当前AI算力本质上分为两种架构哲学：一条是以NVIDIA为代表的路线：多芯片（GPU），高速互连（NVLink / CPO），scale-out（横向扩展）另一条是Cerebras路径：单芯片做到极限（wafer-scale）片内网络替代跨节点通信，scale-up（纵向放大）核心区别是：一条在解决“如何连接更多芯片”，另一条在解决“如何不需要连接”。二、为什么这条路现在才成立 wafer-scale并不是新概念，80年代就有人尝试，90年代商业化失败。原因是：良率无法承受没有容错机制软件无法支撑行业因此形成共识：小die + 高良率 + 分布式。 Cerebras的突破在于三件事同时成立： 1）容错机制工程化 2）片上网络成熟 3）AI workload匹配（高并行，强同步，通信主导）本质变化是：从“完美硬件”转向“可容错系统”。三、性能对比：单点极限 vs 系统扩展在通信层面，两条路线的优劣非常清晰： 1）片内通信 Cerebras：纯片内 → 延迟最低、能耗最低 CPO：仍有光电转换 → 单点效率：Cerebras更优 2）系统扩展 Cerebras：一旦跨芯片 → 回到通信问题 CPO：带宽可持续扩展 → 系统能力：CPO更优 3）功耗结构 Cerebras：单机功耗极高，但通信极省 GPU+CPO：单点功耗可控，系统效率更平衡结论很明确： Cerebras赢“单机极限”， CPO赢“系统规模”。四、适用场景：谁该用cerebras 判断标准可以简化为三个问题： 1）通信是否是瓶颈 2）任务是否可集中 3）结构是否规则因此，高度适用于大模型训练（dense模型），超长上下文，及部分HPC（PDE、流体等）这些任务的共性是强耦合 + 高同步 + 高带宽部分适用于大模型推理（低并发），图计算（结构复杂时优势下降）而不适用于CPU（通用计算），高并发推理，移动/边缘芯片，实时系统这些系统的共性：不规则 / 高并发 / 低延迟五、是否会变成主流尽管Cerebras在特定场景极强，但主流不会走这条路，原因是： 1）物理约束：功耗密度；信号延迟→ 容错解决不了这些问题 2）经济性：小die良率更高；chiplet更灵活 3）产业路径：TSMC等体系优化方向是模块化，多客户复用而不是超大单体 4）需求侧变化：推理占比远高于训练，多任务、高并发成为主流六、cerebras的意义与其说wafer-scale尺寸是重要的趋势，不如说容错设计是会被广泛吸收的哲学未来可能会出现chiplet级容错，封装级绕路核心变化是单个硬件不再需要完美，系统负责兜底。回到最初的问题：Cerebras会不会成为NVIDIA的“杀手”？答案其实已经很清楚。它确实在一个关键点上击中了GPU体系的软肋——通信。但行业的选择，并不是非此即彼，而是多个技术突破同时采用：更强的互连、更低的通信能耗、更高的系统级效率。因此，更准确的判断是Cerebras不是英伟达的杀手，而是英伟达及所有芯片公司可借鉴的最佳实践。免责声明：本人持有文中提及的标的，观点必然偏颇，非投资建议，投资风险巨大，入场需极度谨慎（图：一个cerebas芯片）

显示更多

0

14

84

18

转发到社区

0x老法师@GamefiMaster

2026.05.14 13:18

昨天我说：大人物在谈 AI 芯片大资金在囤 ETH 散户在讨论哪个 meme 能涨今天剧本演到第二幕美国批准阿里、字节、腾讯、京东采购英伟达 H200 AI 芯片利好落地前 Hyperliquid 上有人提前做多阿里巴巴合约现在浮盈 25% 利好落地后阿里港股拉升字节估值预期上调英伟达股价新高链上同时发生：某主力多头止损 7900 万美元麻吉 ETH 多单距清算线 47 美元 BTC 跌破 79k 又拉回来了

显示更多

0

7

8

0

转发到社区

AB Kuai.Dong@_FORAB

2026.05.04 05:01

AI 热潮，没想到卖味精的火了。今年上半年，日本味精公司味之素，因为涉及 AI 芯片供应链里的一个关键材料，被市场盯上。这个材料叫 ABF 增层膜，它不是味精的副产品，而是味之素公司利用自身，在氨基酸、树脂和材料化学上的积累，做出来的一种半导体封装材料。它被用于高性能 CPU、GPU 和 AI 加速器的封装基板里，作用是做复杂电路基板，之间的绝缘层。而随着，市面上的芯片，封装基板越复杂，对 ABF 需求就越大。根据 Palliser 的估算，味之素在这种，用于半导体封装基板的市场，占有超过 95% 全球份额。这导致该公司，一下从味精赛道，被定义为了 AI 半导体关键材料供应商。

显示更多

0

88

223

24

转发到社区

fin@fi56622380

2026.04.16 07:21

今天芯片圈最大的新闻，莫过于Gerard在创立Nuvia CPU被高通收购五年之后，重新出发，新创立了ARM CPU公司，名字也跟之前非常像，叫Nuvacore 现在这个时间点做数据中心CPU，确实是赶上了CPU十年来最好的时代: AI agent带来CPU短缺潮已经经隐隐浮现，AWS多个客户都提出要包揽所有Graviton ARM CPU产能 ------------ 这个消息对硅谷的芯片打工人吸引力是巨大的，Nuvacore这次的阵容都是功成名就的明星阵容，以前Nuvia创始团队重新集合，拿了红衫的投资，做面向 AI 基础设施/agentic computing 的通用ARM CPU。当年还是一个尚未完全被验证的大方向都能大获成功，而现在ARM CPU服务器正在风口浪尖上，前景和想象力和2019年Nuvia比起来大了太多了上一次Gerard把Google，苹果platform architecture组的架构大佬挖了好多过去，这次的号召力只会强得多，240m的融资，已经验证过的路径和创始团队，肉眼可见的下一个增长风口，一定会让Nuvacore成为湾区最热门最受追捧的芯片startup，没有之一。毕竟这是一个肉眼可见能财富自由而且风险收益比极好的机会 ---------- 遥想当年Nuvia第一代CPU的发布赶上苹果M2时代，还是挺震撼的，Nuvia让高通在一年的时间CPU跑分进步了整整三代，单核跑分从2300变成3200，竟然超过了苹果M2 max一大截可惜Nuvia Phoenix core从发布到最后上市拖了太久太久，中间苹果把牙膏挤爆了连着上市了M3/M4，于是Nuvia CPU上市之后从跟M2比较变成了跟M4比较，从期待中的C位变成背景板了当年Nuvia的眼光非常超前，在2019年ARM CPU服务器市场占有率几乎为零的情况下，就是想从零开始打通这个市场，2021年被高通14亿美元收购之后，高通也给了无限的资源支持，扩招力度很大，给的薪水都是市面上最高一档的。可惜大环境在2022年恶化的很快，加上高通的管理层战略眼光实在太差太短视，在业界ARM服务器生态都开始有起色的时候，为了股价节约开支，竟然再一次把自家的Nuvia CPU 服务器团队解散了（算上2015年已经解散过一次ARM服务器团队）直到2025年，Nvidia的Grace ARM CPU都已经发布四年了，Vera ARM CPU都已经自研好久了，Amazon的ARM CPU Graviton都快占据CPU服务器新出货的50%了，高通才后知后觉谨慎的重启ARM服务器项目所以这次Gerard从高通的高管位置把之前的创始团队拉出来自己干，可能是因为高通高层战略眼光实在太差屡屡错过机会，上次Nuvia想做ARM服务器，高通的承诺也因为大环境恶化没做数，结果被收购之后被高通取消了项目直接改做了laptop芯片和手机芯片加上高通今年在手机销量上因为内存和存储历史级的巨额涨价，可以预见要受到重创(市场萎缩30%)，能拿出的扩张预算有限，在高通能拿到的资源是受到掣肘的而在创业公司里比在 Qualcomm 这种大平台里更容易拿到足够快的决策速度、团队纯度、产品定义权和资本叙事，于是选择在窗口已经被验证时重新集结老班底但更可能因为，AI时代的CPU前景想象力真的太广阔了，完全值得重新投入一次，不是Gerard变了，而是外部市场变了 ------------------------ 进入2025年之后，AI agent的出现，隐隐让CPU重新变成了瓶颈 CPU服务器重新步入增长轨道，而且潜力巨大，有好几个因素： 1. 随着推理时代的到来，GPU演化到针对推理的系统级新架构，CPU 是永远在忙的总指挥orchestrator, 因为要追求token throughput，所以异构计算阶段变多 + 批处理数量batch越来越大，scheduling/routing/data flow复杂度变高，对orchestration要求也变高所以在系统级异构推理架构里，AI加速器和GPU在CPU：GPU的配比上，也变得更为激进，从以前的1：4到Grace Blackwell的1：2，以后是很有希望达到1：1的比例的。Google TPU配Axion，Amazon Tranium配Graviton，Nvidia Rubin配自家Vera CPU 这条在我的去年11月半导体年终回顾写过，基本上在2026年成为了共识，虽然这部分主要是各家AI 芯片自研，并不是纯粹的CPU服务器，其实不算是外部CPU服务器的机会 2. 也是同一篇年终回顾里写到的：从CPU视角去看agentic workload，routing和工具处理都在CPU上，如果把常用的agentic框架做profiling，比如SWE-Agent, LangChain, Toolformer，CPU最长可以占到90%的E2E端到端延迟，throughput瓶颈也更多的卡在CPU，CPU甚至能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情，Agent管理很多个CPU，再加上agent经常要开sandbox，很可能会成就CPU需求的新一波回暖现在回看去年写的这个逻辑，潜力是非常大的。但其实年初可能并没有很大规模发生，年初的CPU增长和各家渲染的CPU短缺潮和这个逻辑暂时关系不大，更多可能是前几年的capex投入GPU的比例太大，造成传统CPU服务器投入不够，所以需求上升是一个回补之前传统服务器投入不够的部分。但到了下半年甚至2027，agent会开始更广泛的铺开，比如智能导购和客服，已经占到了Amazon去年年底100万CPU采购的相当部分比例，这部分的增长是很快的前两个逻辑，基本上是今年主流叙事在讲CPU潜力的共识，但是我的感悟是，还有另外两个逻辑被低估了： 3. 造成CPU服务器潜力更大，更长线的主逻辑，可能和agent本身没有直接关系，而是code agent带来的副产物： coding门槛和速度的大幅优化，让“构建软件 + 连接软件 + 调用软件 + 自动化软件”这整件事便宜了一个数量级，Jevons 悖论在software供给端的展开，最终把世界推向更高的软件密度和 API 密度，这直接带来了CPU传统workload的线性上升从2025年年底开始，coding agent迎来了质变，Claude code迎来了爆发式增长，三个月的token营收增长了三倍，那么导致的下一步必然是Code量的十倍增长,以及App数量的巨量增长即便是在大厂，每天1m token消耗只能算是个平均水平，人均coding量必然是翻倍的（小厂就是翻十倍了），code供给量暴增，不会只停留在 repo 里，而会逐步变成更多长期运行的软件资产，长期存活的feature变多，product变多，microservice变多，API变多长线来看，App/API所有的生产成本和生产周期会变成原来的10%，API实现极大富足。那么API的Usage就会大量的上升,这就会造成传统CPU Workload或者说CPU Seconds大量的上升，这甚至和agentic没有直接关系时间维度上，这个逻辑并不是短期性质，Claude code的爆炸是这几个月刚发生的事情，那么产品上线，microservice，api上线，可能都要向后延迟。当软件变便宜，社会不会少用软件，只会把更多事情软件化所以也许到下半年甚至更久才会看到，传统cpu云的需求又莫名其妙增加了，表面上看，甚至和AI agent没有直接关系 4. CPU是一个技术上很难通缩的东西，不像内存/存储有很多压缩算法会降低单任务对存储的用量，CPU workload增长转化成硬件需求增长是实打实的比如说kvcache其实每年都有各种压缩技术出现，老的压缩技术比如kvcache的multi-head它会share一个head（GQV），这个大概会相当于4倍的压缩，再比如说去年turboquant这个技术也会新带来几倍的压缩。然后加上数据精度从FP16到现在的下一步要到FP4，精度的下降都会带来kvcache的压缩，从而带来存储方面的技术通缩。但CPU是一个技术层面上通缩量很小的事情，目前任何的agentic的cpu workload（CPU seconds）增长都是硬件需求增长，它通缩的方面只有每年每一代跑分提高的10%到15%。如果说另外通缩因素，比如云的五倍六倍的超卖会不会影响？不会，因为它一直是超卖的，所以说超卖/利用率低这个CPU技术通缩的因素不会继续扩大了，每个增长的CPU seconds都是不怎么带打折的硬件线性增长 ARM的指引是CPU的供需缺口可能会到30%以上，这几个原因的叠加，加上AI服务器对CPU服务器产能和订单的挤压，可能会让缺口更大，各个hyperscaler的反应可能是会滞后的 ------------------ CPU整体需求潜力增长的同时，ARM服务器CPU也赶上了历史上最好的时代： Hyperscaler为了节省成本，接近50%的新增传统server CPU都是ARM，Google的Axion，Amazon的Graviton，Microsoft的Cobolt，Graviton甚至2026年的产能已经全部卖完，瓶颈成了产能 Google TPU配Axion，Amazon Tranium配Graviton，Nvidia Rubin配自家Vera CPU，这部分CPU为什么会集体转向ARM，除了成本因素之外，也因为推理系统为了追求token throughput，batch越来越高越做越复杂，自研ARM CPU以及系统性软件硬件的co-design会更方便，比如Nvidia是Dynamo去控制Vera和Rubin之间的协同 Nuvacore的规划上来看，不仅仅满足于做IP，也要做成品，因为在招聘网站上出现了validation engineer的职位但是这次Nuvacore面临的挑战也不小：起步太晚了，无论是市场上，还是技术上，竞争都激烈了很多。CPU服务器和七年前比，已经复杂了很多，已经不再是单片CPU的竞争，而是rack系统级别的复杂度现在开始做2028~2029年上市的CPU，要做到rack级别有竞争力，规模要大很多，基本上要几十个chiplet，500+个core拼起来，还要考虑如何适配AI agentic workload，工作量比以前明显要大的多，对一个startup的挑战比七年前也大得多 ---------------- 上次Nuvia在成立两年之后成功的以14亿美元出售，这次市场热度比五年前高了一个数量级，Nuvacore之后的路会怎么走呢？如果是被收购路线，其实买家可能比五年前比并没有更多，这五年里，Google有了Axion，微软有了Cobalt，Amazon有了Graviton，Nvidia自研的Vera CPU已经成型，连ARM也打破了35年来只做IP的常规，开始做自己的AGI CPU芯片最有可能的是Softbank系，softbank已经在ARM CPU服务器生态上布局深耕了多年，65亿美元收购了Ampere，再收购Nuvacore是很正常的事情，这个市场想象力足够大其他的选择也可能是Meta，因为几家互联网公司里，只有Meta的silicon house没有稳定可靠的CPU服务器，有限的资源在MTIA都做AI加速器去了但是Meta的问题在于稳定性极低，决策每个月都在变化，注意力非常短期化，项目随时取消，对Nuvacore来说完全无法兑现潜力，是一个非常糟糕的买家但总体来说，Nuvacore的选择肯定比五年前宽了太多了，对ARM CPU服务器的潜力大家的共识都很明确，融资的难度要小很多，自己运营扩张起来，阻力比以前小很多，合作伙伴的配合程度上也因为未来预期，会容易很多完全可以自己做大到比Nuvia当年更大的规模再考虑出路，根本不着急卖

显示更多

0

27

484

96

转发到社区

勃勃OC@bboczeng

2026.05.08 06:00

大型科技公司提议出资支持 SK 海力士芯片扩产，以应对 AI 芯片短缺 SK 海力士是 AI 数据中心高带宽内存（HBM）的主要供应商。由于 AI 需求导致供应紧张，该公司正收到大型科技公司提出的不同寻常的投资方案，包括为其韩国龙仁晶圆厂的专用生产线，以及价值数百万美元的 EUV 光刻设备提供资金支持。在创纪录的 AI 利润推动下，SK 海力士的产能已经被完全预订。公司正在谨慎评估这些交易，因为它们既可能锁定长期供应合同，也可能让公司过度绑定特定买家。三星和美光等竞争对手也面临类似洽谈。由于晶圆厂建设周期长达数年，供应短缺仍在持续，推动 SK 海力士股价今年上涨 154%，创下历史新高。

显示更多

0

8

17

1

转发到社区

AB Kuai.Dong@_FORAB

2026.05.01 02:33

华为新芯片销量激增，英伟达竟在中国市场陷入停滞。金融时报消息，受中美出口管制下，英伟达在中国的市场份额明显受阻，这让华为 AI 芯片销量激增。目前包括字节跳动、腾讯、阿里在内的互联网大厂，正竞相向华为追加订单，主要为华为新 AI 芯片 950 PR。这也让华为，今年 AI 芯片预计收入达到 120 亿美元。同时他们打算，在年底推出 950DT 的升级版本，加速追赶英伟达。

显示更多

0

173

203

23

转发到社区