注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 CHIP3L
CHIP3L 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 CHIP3L 的推特
Gate 上币周报速递:2026年5月11日 - 5月17日 🔹 现货:$HOOLI 🔹 合约:$CBRS (Cerebras) 、$SOXL(3 倍做多半导体 ETF)、$BRKB(伯克希尔・哈撒韦)、$DIS(迪士尼)、$RKLB(火箭实验室)等 🔹 ETF (3L/3S):#VVV3L#/3S、#SKYAI3L#/3S、#CHIP3L#/3S、#RAVE3L#/3S 🔹 参与热门活动,更多奖励等待瓜分: Polymarket 预测打卡:每日预测,单人最高领 1,000 $USDT: TradFi CFD 签启好运:0 门槛抽三级黄金豪礼、20 克金条与 200 $TSLAON : 股票合约交易嘉年华:每日打卡瓜分 120,000 $USDT : TradFi CFD 福利季:开户领空投,瓜分 200 $SLVON 豪华奖池:
显示更多
半导体封装的“隐形中枢”:inline检测与OSAT的再定价 半导体产业正在经历一次重心转移:性能提升不再只依赖晶体管缩小,而是越来越依赖封装。2.5D、3D、HBM、chiplet,本质上都在把“系统能力”搬到封装环节。这也直接抬高了OSAT(外包封装与测试)的战略地位。 封装重要性的提升,带来了inline检测的快速增长。 OSAT(Outsourced Semiconductor Assembly and Test)负责两件事: 把裸die封装成可用芯片(封装) 验证芯片是否可用(测试) 过去这是一个低技术、低毛利的环节。但在AI时代,情况变了: 多die集成(chiplet) HBM堆叠 nm级对准要求(hybrid bonding) 封装正在变成: 性能瓶颈 + 良率瓶颈 + 成本瓶颈 inline是一种生产方式:所有工序连续完成,并在生产过程中实时检测与反馈(闭环) 对应另外一个环节是offline:做完再测(开环) 先进封装中的inline检测主要分三类: 1)光学检测(主力) bump高度 overlay(对准) 表面缺陷 特点:速度快,可全量inline。 2)X-ray检测 焊点空洞 TSV缺陷 内部结构问题 特点:能看内部,但速度慢,多用于抽检。 3)电性测试 功能验证 性能分档 更接近最终测试,不属于核心inline控制体系。 inline检测的目标不是“最精确”,而是在不降低产线效率的前提下,实现足够精确的实时反馈 核心矛盾:精度 ↑ → 速度 ↓;速度 ↑ → 精度 ↓ 先进设备的价值,就是在这个矛盾中找到最优解。 inline检测的壁垒来自多维叠加: 1)物理极限 nm级对准 μm级结构 工业环境下接近科研精度 2)速度 vs 精度的工程平衡 高throughput + 高精度同时实现 3)算法与数据 缺陷识别、pattern分析 强依赖历史数据与持续训练 4)工艺耦合 测量 → 调整工艺 → 再测 形成闭环系统 5)客户验证 TSMC / Samsung Electronics / Intel 验证周期长(1–3年) 一旦导入,很难替换 所以门槛极高。inline设备不是工具,而是嵌入客户制造系统的一部分。因此这个市场高度集中: 系统级控制 KLA Corporation Applied Materials → 控制数据与闭环 关键测量节点(alpha来源) Camtek Ltd. Onto Innovation Nova Ltd. → 控制关键测量维度 三家核心玩家对比(Onto / Nova / Camtek) 这三家公司虽然同在inline赛道,但本质上卡的是不同位置。 一句话结论 Onto = 广度(平台) Nova = 深度(前道工艺) Camtek = 弹性(先进封装/HBM) 1️⃣ Onto Innovation 定位: 前道 + 封装双覆盖 optical metrology + inspection + litho 优势: 产品线最广 客户最分散 抗周期能力强 劣势: 单点技术不如Nova深 封装不如Camtek极致 2️⃣ Nova Ltd. 定位:前道metrology核心玩家 优势: 技术深度最强 工艺绑定最深 数据壁垒最强 劣势: 封装参与较少 弹性不如Camtek 3️⃣ Camtek Ltd. 定位: 先进封装(HBM / 3D) 优势: 聚焦3D检测 HBM需求直接驱动 使用频率极高 劣势: 产品线较窄 对周期敏感 竞争关系本质 KLA = 控制系统 Onto = 广覆盖 Nova = 深度测量 Camtek = 封装核心检测 这不是单一赢家市场,而是: 每个关键测量维度一个龙头 封装是制造能力,检测是控制能力。区别在于: 封装 → 可扩产、可竞争 检测 → 嵌入流程、难替代 inline检测具备三个核心特征: 高频使用(每一步都测) 强绑定(工艺耦合) 决定良率(直接影响利润) 在这个体系中:谁打通从设备到数据的全节点,掌握“反馈权”,谁就掌握利润分配权。 免责声明:本人持有文中提及的标的,观点必然偏颇,非投资建议dyor
显示更多
Onto Innovation最近入股 Rigaku Holdings 27% 股权,这是一次非常明确的战略转向:从“表面检测”走向“3D结构检测”,本质是在卡位先进封装时代的工艺控制入口。 Onto的业务核心是半导体制造中的process control,也就是检测(inspection)、计量(metrology)、封装光刻和软件系统。它决定良率,和klac一样,是典型的“复杂性收费者”。随着工艺从2D走向3D,这类公司的重要性正在系统性提升。 过去,检测主要依赖光学和电子束,解决的是“看得见”的问题。但在HBM、CoWoS、chiplet和混合键合等结构下,缺陷越来越隐藏在内部,传统方法开始失效。X-ray成为必需工具,这正是Onto入股Rigaku的核心逻辑——补齐内部检测能力,从而覆盖“表面+内部”的完整检测链条。 从市场结构看,Onto未来真正的机会不在大盘,而在结构性细分。 先进封装检测的增速高于行业平均,而涉及3D结构(如X-ray、混合键合检测)的细分领域可能更高。公司当前业务重心已经明显向先进封装倾斜,这使其增长弹性显著高于行业平均。 竞争格局上,行业由 KLA Corporation 主导,市占率超过一半,是标准制定者;Applied Materials 和 ASML 等大型设备商具备跨界能力,可以通过整线方案压制单点供应商;而Camtek、Nova等公司则在细分领域与Onto直接竞争。Onto本身处于中间位置:产品线不够全面,但在先进封装环节具备一定深度。 其优势在于提前卡位先进封装,产品结构向高增长区域集中,同时具备一定技术门槛和盈利能力;但劣势也很清晰,包括客户绑定较弱、系统能力不完整,以及在部分高端检测能力上仍落后于龙头。整体来看,护城河处于中等水平,尚未形成不可替代性。 决定公司未来地位的关键变量是混合键合。 随着互连从bump走向直接键合,对overlay精度和界面缺陷控制的要求大幅提升,检测和计量的重要性显著上升。Onto在overlay和先进封装检测上已有基础,并通过X-ray补齐能力,因此可以覆盖混合键合检测链的大部分环节。该技术有望在未来3–5年持续推动其相关业务高于行业增速。 Onto的投资逻辑并不完全跟随半导体周期,而在于是否能够从先进封装中的“参与者”,升级为3D结构检测中的“关键节点”。混合键合决定其能否获得稳定超额增长。如果能够在X-ray和3D检测上建立能力闭环,其护城河有望明显加宽;反之,则仍将处于被KLA压制、被大厂边缘化的中间位置。 本质上,这家公司正在从一个设备供应商,向“复杂性控制入口”转型。能否完成这一转型,决定了它未来5年的上限。 免责声明:本人持有文章提及股票,观点十分主观,非投资建议dyor
显示更多
$AVGO 是AI芯片的龙头。但历史告诉你,真正暴富的人买的是龙二 $MRVL 先说一个关于半导体行业的反直觉规律: 在一个严重缺货的市场里,获利最大的往往不是龙头,而是那个追赶中的龙二。(Herman老师分析intel观点我觉得说的很好,也同样非常适用于 $MRVL) 理由很简单: 当产能严重不足,买家再也无法只依赖龙头一家供应商。他们开始把订单给原本觉得"不够好"的替代者。而这个替代者,突然发现自己的产品以前没有人要,现在成了香饽饽——价格可以谈,条款可以谈,一切都变了。晶圆缺货时,原本没有人愿意把订单给Intel的客户,开始认真研究18A了。 那么,在AI定制芯片这个正在快速缺货的赛道里,获利最大的龙二会是谁? 我的答案是 $MRVL 。 1. 先理解结构 AI芯片市场分两层: 第一层:通用GPU Nvidia统治,没有任何人能挑战。H100、B200、Blackwell——超大规模云厂商需要它们,别无选择。 这层市场已经被充分定价了。Nvidia市值5.7万亿,没有人会漏掉这个机会。 第二层:定制ASIC(专用AI加速芯片) 这是一个完全不同的故事。 每一家超大规模云厂商都在开发自己的专用芯片: Google有TPU(张量处理器),Amazon有Trainium(AI训练)和Inferentia(推理),Meta有MTIA(AI推理加速),Microsoft有Maia(Azure AI加速)。 为什么要自己开发芯片? 因为通用GPU虽然强大,但它服务所有人,没有为特定工作负载优化。自研芯片可以针对自己的模型架构和推理需求精确设计,功耗更低,成本更低,效率更高。 这是一个不可逆的趋势——超大规模云厂商越大,自研芯片的动力越强。但有一个关键问题:这些云厂商需要设计合作伙伴。芯片设计是极其复杂的工程,需要有人懂SerDes,懂先进封装,懂chiplet集成,懂供应链——不是随便一家公司能做到的。 全球有能力承接超大规模云厂商定制ASIC设计的公司,只有两家: $Broadcom,和 $Marvell。 2. AVGO vs MRVL:龙头和龙二的真实差距 先看数字: Broadcom在ASIC市场占约55-60%的份额,与Google的TPU合作锁定到2031年,客户包括Meta、OpenAI等顶级厂商。Marvell约占15%的份额,排名第二Broadcom领先是事实,毫无争议。 但有几个数字值得认真对比: AVGO MRVL 市值 $2万亿 $1,470亿 ASIC市占 55-60% 15% FY26AI营收 $200亿+ $96亿 Forward PE 31倍 36倍 Broadcom在定制ASIC市场记录了约$200亿的AI总营收,而Marvell的AI相关营收约$96亿。 从市值角度:AVGO的市值是MRVL的13.6倍,但ASIC市场份额只是MRVL的4倍,AI营收只是MRVL的2倍。这个不对称,是MRVL存在的核心机会。 3. MRVL独特的地方:两场战争同时押注 这是我认为最关键的一点,也是MRVL和所有其他AI芯片公司最本质的区别。 MRVL同时押注了两个互相独立的万亿级叙事: 叙事一:定制ASIC——去Nvidia化的最大受益者 Marvell的数据中心部门FY2026增长46%,超过$60亿,管理层指引FY2027同比再增约40%。定制芯片年化营收已达$15亿规模,两个AI加速器项目处于高产量阶段,第三个超大规模客户合作正在进行。 Nasdaq 最重要的一个进展: 2026年4月,Google被报道正在与Marvell进行深度谈判,共同开发内存处理单元和下一代TPU,这正是Google此前几乎完全交由Broadcom负责的工作。如果谈判成功,Marvell将成为AI行业最具战略意义的芯片项目之一的核心设计伙伴。 这是什么意思? Broadcom和Google的TPU合作锁定到2031年——这是Broadcom的护城河,但不是MRVL的天花板。Google开始和MRVL谈,不是要取代Broadcom,而是要建立第二供应商。这正是"缺货时代,落后者获利"的经典逻辑。 当TPU的设计需求超过了Broadcom单独能服务的上限,Google开始把部分项目分给MRVL。 这一单谈成,MRVL同时拥有Amazon和Google双超大规模客户锚定——三个超大规模客户(Amazon、Microsoft、Google)大幅降低了单一客户集中的风险,给市场提供了更清晰的多年营收增长路线图。 叙事二:光互连DSP——AI集群神经系统的命门 MRVL是目前唯一同时覆盖定制ASIC设计、1.6T光学DSP、硅光子技术(通过Celestial AI收购)和CXL交换的全栈公司——这是任何单一竞争对手都无法复制的护城河。 光互连DSP是什么? 当GPU和GPU之间需要通信,数据需要在光纤里传输。但光纤里走的是模拟光信号,计算机需要的是数字信号。DSP(数字信号处理器)就是这两个世界之间的翻译器——它把数字数据编码成光信号发出去,再把收到的光信号解码成数字数据。 MRVL的PAM4 DSP是全球800G和1.6T光模块的核心芯片之一。光互连业务的需求与AI集群的互连基础设施同步扩张——每一个上线的AI集群都需要完整的互连协议栈,不需要等待GPU的供应情况。 这是最关键的逻辑: GPU供应有时候是稀缺的,但光互连不等GPU——只要数据中心在建,只要AI集群在运行,光互连就需要。 MRVL的DSP是一个和GPU并行运行的独立需求,不是GPU需求的影子。 4. 我自己的判断:为什么MRVL的故事比AVGO更有弹性 AVGO是龙头,MRVL是追赶者。 但在这个特定的历史时刻,追赶者的弹性更大,原因有三: 原因一:基数效应 AVGO已经是$2万亿市值,要翻倍需要成为$4万亿的公司。MRVL只有$1,470亿,翻倍只需要$2,940亿——和AVGO现在市值的15%相当。同样的资金流入,对MRVL股价的推动效果是AVGO的13倍以上。 原因二:Google的变量 AVGO和Google的合作是锁定的,这是护城河,但也意味着它的上行惊喜已经被充分定价。MRVL和Google的谈判还没有正式宣布——这是一个尚未被市场定价的潜在催化剂。如果Google正式宣布,MRVL立刻拥有Amazon+Google双超大规模客户,ASIC市场份额从15%向25%+跳升的路径被打开。 原因三:两个叙事不相关 AVGO的核心护城河是ASIC和VMware软件。 MRVL的两个叙事——ASIC和光互连DSP——是完全独立的业务。 ASIC受益于去Nvidia化,光互连受益于AI集群扩张。两个独立的增长引擎,互相不依赖,互相不替代。 MRVL在多个AI基础设施顺风中同时暴露:定制芯片、光互连、数据中心网络和更广泛的超大规模资本支出周期。这种在AI主题内的多元化暴露,使它成为纯粹的GPU标的(如Nvidia)的有吸引力的补充。 5. 估值合理吗? $MRVL:Forward PE 36.4倍,市值$1,470亿。 $AVGO:Forward PE 31倍,市值$2万亿。 $MRVL的Forward PE比 $AVGO略高,但增速也更快: $MRVL FY27营收预期:约$110亿,同比增速约40% $AVGO FY27增速约25-30%。PEG(PE/增速): $MRVL:36.4 ÷ 40 = 0.91, $AVGO:31 ÷ 27 = 1.15 PEG低于1都算便宜。 用PEG来衡量,MRVL比AVGO便宜约20%。 而且MRVL有Google催化剂这个尚未被定价的变量,AVGO没有。如果Marvell股价涨到$400,需要数据中心营收FY27超过$90亿,Google ASIC合同正式宣布,自定义硅年化营收达到$30亿。在这些条件下,ASIC业务40倍Forward EV/EBITDA,光互连业务20倍EV/Sales。 我觉得2027年是很有可能达到的,这还是在理性的估值下,如果是ai融涨疯牛选择忽略估值的话,如果NVDA到360分析师预测最高,也就是8.8T, 我预测8-10T,那么AVGO会到3-4T, MRVL到500B-1T都问题不大。 6. 三个需要追踪的关键变量 变量一:Google ASIC合同的正式宣布 这是目前MRVL最大的潜在催化剂。谈判已经在进行,但没有正式宣布。每过一个季度没有宣布,市场会稍微失去耐心。但一旦宣布,估值逻辑发生质变。 变量二:1.6T DSP的市场份额 Marvell已经开始出货1.6T PAM DSP,基于5纳米工艺,并推出了下一代3纳米版本,将光模块功耗降低超过20%。 800G向1.6T的迭代是MRVL DSP业务的下一个量子跳跃。如果MRVL能在1.6T时代维持甚至提升市场份额,光互连业务的营收会非线性增长。 变量三:Celestial AI的硅光子整合 MRVL收购了Celestial AI,进入硅光子领域。这是CPO时代最关键的技术平台——把光学引擎直接集成进芯片封装。如果MRVL能在CPO时代把DSP和硅光子整合成一个完整的解决方案,它的价值会远超现在的定价。 7. 最终判断:MRVL是这轮AI牛市里最干净的不对称机会 AI芯片市场分三类公司: 第一类:Nvidia——已经被充分定价的龙头。故事最好,估值最贵,上行惊喜空间有限。 第二类:纯ASIC公司(AVGO)——护城河深厚,但增速放缓在定价中。Google TPU锁定到2031年是确定性,也是上行惊喜的天花板。 第三类:MRVL——两个叙事都在爆发,Google催化剂未定价,市值基数小。 这是不对称机会的经典形态, 下行有Amazon锚定,有光互连稳定收入,不会归零,上行有Google合同宣布+CPO爆发+ASIC市场份额提升,估值可能从$1,470亿走向$5,000亿+。 $MRVL也是我重仓持有的标的之一,短期technical角度今天收长上影线,日线级别调整要来,加仓机会在第一目标165,第二目标140。如果给机会到140补那个缺口,我仓位加满(图1)。 总结:回到那个反直觉的规律:缺货时代,落后者获利最大。 ASIC市场正在缺货——Broadcom一家根本无法满足所有超大规模客户的定制需求。光互连正在缺货——AI集群每季度都在扩张,DSP的需求只增不减。MRVL是这两个缺货赛道里,那个正在被需要的追赶者。 历史一次次证明:当产能不足、供应商只有一两家的时候,第二名是最好的弹性高的投资标的(Nvidia和Amd,TSMC和Intel。) 因为所有人都开始认真研究它了。 #MRVL# #Marvell# #AVGO# #Broadcom# #ASIC# #定制芯片# #光互连# #DSP# #Google# #Amazon# #Nvidia# #AI芯片# #半导体# #美股# #龙二补涨# #CPO# #硅光子# #AI基建# #USStocks# #AIStocks# #数据中心# #去Nvidia化#
显示更多
0
24
324
58
转发到社区
Veeco:在GAA、HBM与CPO交汇点上的重要玩家 如果把半导体产业链的终点是材料。Veeco就是一家材料公司。 公司业务看起来分散:LSA、MOCVD、Ion Beam、Wet、Litho。但如果用一条主线去理解,其实很清晰——它做的是在原子尺度上控制材料。 Veeco当前收入约70%以上来自半导体相关业务,产品结构可以分为三层: 第一层是LSA(Laser Annealing)和先进封装(Wet + Litho),贡献大部分收入; 第二层是Ion Beam等高精度材料处理; 第三层是MOCVD等化合物半导体设备,当前占比不高,但决定未来空间。 LSA本质是一个“热控制工具”。但在先进制程里,“热”已经不是普通变量,而是最核心约束之一。 离子注入之后必须退火,这是所有晶体管都绕不开的步骤。传统路径是RTA或炉管,但问题在于,它们是“全局加热”,时间长、扩散大。节点进入7nm以下,这种扩散开始不可接受。 GAA把问题推到极限。沟道结构更精细、尺寸更小,任何多余的扩散都会直接影响器件性能。这时候,工艺需求发生了本质变化——不再是“加热”,而是“精确加热”。 LSA的价值就在这里:纳秒级、局部加热,几乎只作用在表层。 LSA的护城河不是设备本身,而是“工艺嵌入”。一旦进入产线,很难被替换。 再看先进封装(Wet + Litho)。 HBM和Chiplet的爆发,把封装从辅助环节变成核心环节。工艺数量增加、步骤复杂度上升,对清洗、刻蚀、光刻的需求同步放大。 Veeco不是技术绝对领先,而是“高吞吐 + 低成本”的参与者。 它已经进入TSMC、Samsung、Micron等客户体系,但这块的护城河明显弱于LSA。对手是Lam、TEL、Applied这些平台型公司。 再看Ion Beam / ALD / PVD。 ALD和PVD是典型的大厂战场,Applied Materials、Lam、TEL拥有绝对优势。Veeco在这里几乎没有存在感。 Ion Beam是一个典型的niche技术:慢、贵,但精度极高。在某些场景下,比如MRAM、光子器件、MEMS,它几乎不可替代。 这类业务的特点是:市场小,但稳定,毛利高,客户粘性强。 最后看MOCVD。 这是当前占比不高,但最值得关注的一块。 MOCVD用于生长GaAs、InP、GaN等材料,是光通信和功率器件的基础。随着CPO(共封装光学)推进,InP激光器的重要性在快速上升。 问题不在于设备数量,而在于“良率 + 工艺 + 材料体系”。这一层很可能成为真正瓶颈。 Veeco和Aixtron是唯二的核心玩家。 总的来说,Veeco很可能是一个“结构性机会”。 它的当前收入由半导体驱动,但未来估值空间取决于两件事: 第一,LSA是否进入更深的先进节点工艺; 第二,MOCVD是否成为CPO时代的关键瓶颈。 如果这两件事成立,这家公司会从一个“小众设备商”,变成“材料层定价权参与者”。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议dyor
显示更多
0
6
33
10
转发到社区
$SIVE 的想象力空间挺大,跟lite和cohr同赛道,只有10亿市值又计划上市美股。 它在ib上能买的代码是 #2DG# 问gemini问题“Sive分析一下产品在amd,英伟达,等ai巨头的业务产线中的站位和其产品的全球市场规模”,下面上AI回答。 这家在 2026 年 AI 基础设施赛道中因“外部光源(ELS)”和“共封装光学(CPO)”技术备受瞩目的企业,以下是其在英伟达(NVIDIA)、AMD 等巨头业务线中的站位及全球市场规模分析。 一、 产品核心站位:AI 集群的“光引擎”驱动者 在英伟达与 AMD 的 AI 芯片演进中,**互连带宽(I/O)**已取代算力本身成为最大的系统瓶颈。Sive 的产品(主要是 CW-WDM 连续波激光器点阵和 RF 束成形芯片)处于以下关键环节: 1. 英伟达(NVIDIA)生态:Scale-up 网络的关键变量 • 站位: 英伟达从 Blackwell 架构向下一代(如 Rubin 或更高版本)演进时,传统的插拔式光模块(Pluggable Optics)因功耗和延迟瓶颈正向 CPO(共封装光学) 转型。 • 功能: Sive 的多波长激光器阵列作为 ELS(外部光源),被放置在计算模块之外,通过光纤为交换机或 GPU 旁的硅光引擎提供光源。 • 逻辑: 在 NVLink 的 Scale-up 网络中,Sivers 与 Jabil(捷普) 合作开发的 1.6T 及 3.2T 光收发模块,是实现万卡集群乃至十万卡集群低延迟通信的基础。 2. AMD 生态:Chiplet 互联与 Infinity Fabric 的光化 • 站位: AMD 在 Instinct 系列(如 MI350/MI400)中重度依赖 Chiplet(芯粒) 技术。 • 功能: 随着互联距离跨越板卡,光互连(Optical Interconnect)成为替代铜线传输 Infinity Fabric 信号的唯一手段。 • 逻辑: Sive 提供的激光阵列具备极高的波长稳定性,支持 WDM(波分复用)技术,这与 AMD 追求的低功耗、高密度的芯粒间光连接需求高度匹配。 二、 全球市场规模与需求空间 Sive 所处的细分赛道正经历从“边缘科研”到“主流基建”的跨越。 1. 硅光子(Silicon Photonics)核心市场 • 2026年预估值: 全球市场规模约 40.3 亿美元。 • 增长速度: 复合年增长率(CAGR)维持在 24%-25% 左右。 • Sive 份额: 在 ELS(外部光源)这一高壁垒细分环节,Sive 是全球少数能提供符合 CW-WDM MSA 标准的商业化供应商之一,与 Lumentum 和 Coherent 形成竞合关系。 2. AI 光互连总体有效市场 (TAM) • 根据高盛及相关行业报告预测,到 2026-2028 年,受 AI 集群扩容推动,全球 AI 光通信网络 TAM 将从 150 亿美元爆发式增长至 1500 亿美元 以上。 • Scale-up 占比: 其中用于芯片间、服务器间“纵向扩展(Scale-up)”的连接部分占据约 70% 的产值,这是 Sivers 激光器阵列最核心的应用场域。
显示更多
Still think $SIVE is vastly undiscovered. Feels like markets are only slowly starting to realize the likely laser supplier for $AMD? The only two public laser companies were $SIVE and $LITE on the $GFS presentation by the way…. after AMD’s CPO program went the way with GFS. And $SIVE is the only one left alongside GFS on Ayar’s website after they silently removed $LITE and $MTSI from their partner section. AlChip and GUC also happen to be pretty big for hyperscaler suppliers too.. Feels like Sivers lasers are going to end up everywhere next year.
显示更多
0
29
145
24
转发到社区
最近提交ipo的ai芯片的新宠Cerebras火遍硅谷。 其芯片在小模型场景下,其推理速度最高可达 H100 的 20 倍;而超大规模模型(如 400B 参数量级),Cerebras CS-3 系统的单用户响应速度约为 B200 的 2.4 倍 那么cerebras究竟是如何做到的呢? 它是否会成为英伟达杀手呢? 我们需从算力演进的本质开始。 AI算力的演进,正在从“算力本身”转向“通信与系统结构”。在这条演进路径上,Cerebras Systems提供了一种完全不同的答案:不是优化分布式,而是尽可能消灭分布式。 一、两条路线:消灭通信 vs 优化通信 当前AI算力本质上分为两种架构哲学:一条是以NVIDIA为代表的路线: 多芯片(GPU),高速互连(NVLink / CPO),scale-out(横向扩展) 另一条是Cerebras路径:单芯片做到极限(wafer-scale) 片内网络替代跨节点通信,scale-up(纵向放大) 核心区别是:一条在解决“如何连接更多芯片”,另一条在解决“如何不需要连接”。 二、为什么这条路现在才成立 wafer-scale并不是新概念,80年代就有人尝试,90年代商业化失败。原因是: 良率无法承受 没有容错机制 软件无法支撑 行业因此形成共识:小die + 高良率 + 分布式。 Cerebras的突破在于三件事同时成立: 1)容错机制工程化 2)片上网络成熟 3)AI workload匹配(高并行,强同步,通信主导) 本质变化是:从“完美硬件”转向“可容错系统”。 三、性能对比:单点极限 vs 系统扩展 在通信层面,两条路线的优劣非常清晰: 1)片内通信 Cerebras:纯片内 → 延迟最低、能耗最低 CPO:仍有光电转换 → 单点效率:Cerebras更优 2)系统扩展 Cerebras:一旦跨芯片 → 回到通信问题 CPO:带宽可持续扩展 → 系统能力:CPO更优 3)功耗结构 Cerebras:单机功耗极高,但通信极省 GPU+CPO:单点功耗可控,系统效率更平衡 结论很明确: Cerebras赢“单机极限”, CPO赢“系统规模”。 四、适用场景:谁该用cerebras 判断标准可以简化为三个问题: 1)通信是否是瓶颈 2)任务是否可集中 3)结构是否规则 因此,高度适用于大模型训练(dense模型),超长上下文,及部分HPC(PDE、流体等) 这些任务的共性是强耦合 + 高同步 + 高带宽 部分适用于大模型推理(低并发),图计算(结构复杂时优势下降) 而不适用于CPU(通用计算),高并发推理,移动/边缘芯片,实时系统 这些系统的共性:不规则 / 高并发 / 低延迟 五、是否会变成主流 尽管Cerebras在特定场景极强,但主流不会走这条路,原因是: 1)物理约束:功耗密度;信号延迟→ 容错解决不了这些问题 2)经济性:小die良率更高;chiplet更灵活 3)产业路径:TSMC等体系优化方向是模块化,多客户复用而不是超大单体 4)需求侧变化:推理占比远高于训练,多任务、高并发成为主流 六、cerebras的意义 与其说wafer-scale尺寸是重要的趋势,不如说容错设计是会被广泛吸收的哲学 未来可能会出现chiplet级容错,封装级绕路 核心变化是单个硬件不再需要完美,系统负责兜底。 回到最初的问题:Cerebras会不会成为NVIDIA的“杀手”? 答案其实已经很清楚。 它确实在一个关键点上击中了GPU体系的软肋——通信。但行业的选择,并不是非此即彼,而是多个技术突破同时采用:更强的互连、更低的通信能耗、更高的系统级效率。 因此,更准确的判断是Cerebras不是英伟达的杀手,而是英伟达及所有芯片公司可借鉴的最佳实践。 免责声明:本人持有文中提及的标的,观点必然偏颇,非投资建议,投资风险巨大,入场需极度谨慎 (图:一个cerebas芯片)
显示更多
0
14
84
18
转发到社区
行业分析:AI光互连全景:谁是下一个“HBM级瓶颈”? AI算力的瓶颈正在从计算转向带宽。随着GPU规模扩大,节点间通信接近N²级增长,电互连在功耗与距离上逐步触顶,光互连从可选项变成刚需。这一变化不只是需求扩张,而是产业结构的重排:光开始从数据中心边缘进入系统核心,甚至进入封装内部。 从底层看,硅光(SiPho)是在硅基上做出一整套光通信器件:波导负责传光,调制器把电信号变成光,探测器再把光变回电。它解决的是带宽与能效问题。硅本身不能发光,激光器依赖InP、GaAs等III-V材料,因此整个体系天然是“硅 + III-V”的异构结构。 产业链可以拆成四层:上游材料(InP与激光材料)、中游核心器件(激光器、硅光芯片)、模块与封装(光模块、CPO)、以及系统与网络架构。价值分配并不均匀。最稀缺的是光源,也就是激光器及其背后的InP体系,这一层类似算力链中的HBM,是物理瓶颈;再往下是硅光与光芯片,决定光电融合是否可行;光模块更偏制造与组装,周期性更强;真正的高价值封装集中在系统级CPO。 在硅光制造这一层,Tower Semiconductor 和 GlobalFoundries 是典型代表。它们本质是foundry,把光子芯片从设计变成晶圆。器件公司是它们的客户,而不是供应商。两者路径不同:TSEM更像工艺专家,擅长定制和复杂结构,解决“别人做不出来”的问题;GF更像平台型foundry,提供标准化工艺和规模能力,让更多客户可以复制。 这也解释了近期股价的差异。TSEM的上涨几乎直接由AI光互连驱动,尤其是硅光需求进入订单兑现阶段;GF更多受益于AI整体需求扩散,硅光只是其中一部分。前者是主线变量,后者更像beta。 很多人会误以为竞争在晶圆尺寸,比如300mm。但在SiPho、模拟、RF这些领域,关键不在晶圆,而在工艺复杂度、良率和客户绑定。真正决定竞争力的是能否稳定量产复杂光电结构,而不是晶圆大小。 从全球格局看,中国在光模块层面占据优势,但在SiPho制造仍处于早期阶段。差距不在技术原理,而在量产能力和客户验证。短期内,由于订单和经验的正反馈,差距在拉大;中期随着下游需求反向驱动,上游有望追赶。这一结构和HBM不同,SiPho不属于天然寡头,更可能走向多极竞争。 真正改变产业结构的是CPO(co-packaged optics)。CPO不是一个器件,而是一种封装形态:把光芯片与算力芯片封在一起,使光从“外部模块”变成“系统内部的一部分”。实现路径是先在SiPho晶圆上完成器件制造,筛选良品(KGD),切割成die,再与GPU/ASIC、HBM等一起进行异构集成,通常采用平面并排而非堆叠。 这一变化的核心结果是:硅光从“独立产品”变成“系统中的一层”。功能重要性不变,但定价权下降。过去光模块可以独立定价;在CPO中,价值更多被系统整合者吸收。掌握先进封装能力的厂商更接近控制节点,这也是为什么TSMC和Intel在这一阶段具备更强话语权,而TSEM和GF更接近中游die供应商。 CPO对技术提出了三大硬约束:功耗、带宽密度和封装耦合。功耗决定系统是否可持续,带宽密度决定扩展能力,封装耦合决定良率和成本。这三点直接推动硅光工艺进入新阶段。 在这一过程中,低损耗波导成为关键基础。波导是芯片内部的“光通道”,损耗以dB/cm衡量。0.1 dB/cm与1 dB/cm的差异,会在封装内线性累积,直接决定系统功耗与成本。当前主流量产水平在0.3–1 dB/cm,先进工艺可到0.1 dB/cm,实验室中的氮化硅(SiN)接近0.01 dB/cm,但距离大规模量产仍有距离。材料路径也逐渐清晰:硅波导受限于粗糙度和折射率,长期趋势是向SiN迁移。 难点不在单点,而在多重极限叠加:侧壁粗糙度、PECVD氢吸收、SiN应力、弯曲损耗、光纤耦合等因素同时作用。这也是为什么真正的优势来自“全栈工艺控制”,而不是某个单一技术突破。 CPO不仅改变技术路径,也改变竞争结构。未来不会出现单一路线,而是分层共存: 核心AI集群:定制CPO,追求极致性能 大规模部署:标准化CPO或pluggable,追求成本与灵活性 即使在CPO内部,也会分化为“高性能CPO”和“标准化CPO”,类似HBM与DDR的关系:前者吃价值,后者吃规模。 对TSEM和GF来说,这种分化进一步强化各自路径。TSEM更靠近高性能CPO,承接定制需求,有机会成为局部瓶颈;GF更靠近标准化CPO,承担规模扩张,是产业的放大器。 整条链可以压缩成一句话:材料决定能不能做,芯片决定性能上限,封装决定系统价值,系统厂决定利润分配。对应到算力链,InP激光器类似HBM,CPO类似GPU封装,光模块类似服务器组装,而硅光晶圆厂更像中间层的chiplet供应商。 从投资角度看,最确定的机会在光源,这是物理瓶颈;最大弹性在硅光与CPO,一旦路径跑通会被放大;光模块是顺周期;封装稳定吃利润但不容易爆发;系统层存在潜在黑马,但取决于架构演进。硅光不会消失,但正在被“吞入系统”。未来真正的“HBM时刻”,更可能出现在光源层或系统级封装,而不是封装之前的中游晶圆环节。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议dyor
显示更多
0
15
326
106
转发到社区
今天芯片圈最大的新闻,莫过于Gerard在创立Nuvia CPU被高通收购五年之后,重新出发,新创立了ARM CPU公司,名字也跟之前非常像,叫Nuvacore 现在这个时间点做数据中心CPU,确实是赶上了CPU十年来最好的时代: AI agent带来CPU短缺潮已经经隐隐浮现,AWS多个客户都提出要包揽所有Graviton ARM CPU产能 ------------ 这个消息对硅谷的芯片打工人吸引力是巨大的,Nuvacore这次的阵容都是功成名就的明星阵容,以前Nuvia创始团队重新集合,拿了红衫的投资,做面向 AI 基础设施/agentic computing 的通用ARM CPU。当年还是一个尚未完全被验证的大方向都能大获成功,而现在ARM CPU服务器正在风口浪尖上,前景和想象力和2019年Nuvia比起来大了太多了 上一次Gerard把Google,苹果platform architecture组的架构大佬挖了好多过去,这次的号召力只会强得多,240m的融资,已经验证过的路径和创始团队,肉眼可见的下一个增长风口,一定会让Nuvacore成为湾区最热门最受追捧的芯片startup,没有之一。毕竟这是一个肉眼可见能财富自由而且风险收益比极好的机会 ---------- 遥想当年Nuvia第一代CPU的发布赶上苹果M2时代,还是挺震撼的,Nuvia让高通在一年的时间CPU跑分进步了整整三代,单核跑分从2300变成3200,竟然超过了苹果M2 max一大截 可惜Nuvia Phoenix core从发布到最后上市拖了太久太久,中间苹果把牙膏挤爆了连着上市了M3/M4,于是Nuvia CPU上市之后从跟M2比较变成了跟M4比较,从期待中的C位变成背景板了 当年Nuvia的眼光非常超前,在2019年ARM CPU服务器市场占有率几乎为零的情况下,就是想从零开始打通这个市场,2021年被高通14亿美元收购之后,高通也给了无限的资源支持,扩招力度很大,给的薪水都是市面上最高一档的。 可惜大环境在2022年恶化的很快,加上高通的管理层战略眼光实在太差太短视,在业界ARM服务器生态都开始有起色的时候,为了股价节约开支,竟然再一次把自家的Nuvia CPU 服务器团队解散了(算上2015年已经解散过一次ARM服务器团队) 直到2025年,Nvidia的Grace ARM CPU都已经发布四年了,Vera ARM CPU都已经自研好久了,Amazon的ARM CPU Graviton都快占据CPU服务器新出货的50%了,高通才后知后觉谨慎的重启ARM服务器项目 所以这次Gerard从高通的高管位置把之前的创始团队拉出来自己干,可能是因为高通高层战略眼光实在太差屡屡错过机会,上次Nuvia想做ARM服务器,高通的承诺也因为大环境恶化没做数,结果被收购之后被高通取消了项目直接改做了laptop芯片和手机芯片 加上高通今年在手机销量上因为内存和存储历史级的巨额涨价,可以预见要受到重创(市场萎缩30%),能拿出的扩张预算有限,在高通能拿到的资源是受到掣肘的 而在创业公司里比在 Qualcomm 这种大平台里更容易拿到足够快的决策速度、团队纯度、产品定义权和资本叙事,于是选择在窗口已经被验证时重新集结老班底 但更可能因为,AI时代的CPU前景想象力真的太广阔了,完全值得重新投入一次,不是Gerard变了,而是外部市场变了 ------------------------ 进入2025年之后,AI agent的出现,隐隐让CPU重新变成了瓶颈 CPU服务器重新步入增长轨道,而且潜力巨大,有好几个因素: 1. 随着推理时代的到来,GPU演化到针对推理的系统级新架构,CPU 是永远在忙的总指挥orchestrator, 因为要追求token throughput,所以异构计算阶段变多 + 批处理数量batch越来越大,scheduling/routing/data flow复杂度变高,对orchestration要求也变高 所以在系统级异构推理架构里,AI加速器和GPU在CPU:GPU的配比上,也变得更为激进,从以前的1:4到Grace Blackwell的1:2,以后是很有希望达到1:1的比例的。Google TPU配Axion,Amazon Tranium配Graviton,Nvidia Rubin配自家Vera CPU 这条在我的去年11月半导体年终回顾写过,基本上在2026年成为了共识,虽然这部分主要是各家AI 芯片自研,并不是纯粹的CPU服务器,其实不算是外部CPU服务器的机会 2. 也是同一篇年终回顾里写到的: 从CPU视角去看agentic workload,routing和工具处理都在CPU上,如果把常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU,CPU甚至能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情,Agent管理很多个CPU,再加上agent经常要开sandbox,很可能会成就CPU需求的新一波回暖 现在回看去年写的这个逻辑,潜力是非常大的。但其实年初可能并没有很大规模发生,年初的CPU增长和各家渲染的CPU短缺潮和这个逻辑暂时关系不大,更多可能是前几年的capex投入GPU的比例太大,造成传统CPU服务器投入不够,所以需求上升是一个回补之前传统服务器投入不够的部分。 但到了下半年甚至2027,agent会开始更广泛的铺开,比如智能导购和客服,已经占到了Amazon去年年底100万CPU采购的相当部分比例,这部分的增长是很快的 前两个逻辑,基本上是今年主流叙事在讲CPU潜力的共识,但是我的感悟是,还有另外两个逻辑被低估了: 3. 造成CPU服务器潜力更大,更长线的主逻辑,可能和agent本身没有直接关系,而是code agent带来的副产物: coding门槛和速度的大幅优化,让“构建软件 + 连接软件 + 调用软件 + 自动化软件”这整件事便宜了一个数量级,Jevons 悖论在software供给端的展开,最终把世界推向更高的软件密度和 API 密度,这直接带来了CPU传统workload的线性上升 从2025年年底开始,coding agent迎来了质变,Claude code迎来了爆发式增长,三个月的token营收增长了三倍,那么导致的下一步必然是Code量的十倍增长,以及App数量的巨量增长 即便是在大厂,每天1m token消耗只能算是个平均水平,人均coding量必然是翻倍的(小厂就是翻十倍了),code供给量暴增,不会只停留在 repo 里,而会逐步变成更多长期运行的软件资产,长期存活的feature变多,product变多,microservice变多,API变多 长线来看,App/API所有的生产成本和生产周期会变成原来的10%,API实现极大富足。那么API的Usage就会大量的上升,这就会造成传统CPU Workload或者说CPU Seconds大量的上升,这甚至和agentic没有直接关系 时间维度上,这个逻辑并不是短期性质,Claude code的爆炸是这几个月刚发生的事情,那么产品上线,microservice,api上线,可能都要向后延迟。当软件变便宜,社会不会少用软件,只会把更多事情软件化 所以也许到下半年甚至更久才会看到,传统cpu云的需求又莫名其妙增加了,表面上看,甚至和AI agent没有直接关系 4. CPU是一个技术上很难通缩的东西,不像内存/存储有很多压缩算法会降低单任务对存储的用量,CPU workload增长转化成硬件需求增长是实打实的 比如说kvcache其实每年都有各种压缩技术出现,老的压缩技术比如kvcache的multi-head它会share一个head(GQV),这个大概会相当于4倍的压缩,再比如说去年turboquant这个技术也会新带来几倍的压缩。然后加上数据精度从FP16到现在的下一步要到FP4,精度的下降都会带来kvcache的压缩,从而带来存储方面的技术通缩。 但CPU是一个技术层面上通缩量很小的事情,目前任何的agentic的cpu workload(CPU seconds)增长都是硬件需求增长,它通缩的方面只有每年每一代跑分提高的10%到15%。如果说另外通缩因素,比如云的五倍六倍的超卖会不会影响?不会,因为它一直是超卖的,所以说超卖/利用率低这个CPU技术通缩的因素不会继续扩大了,每个增长的CPU seconds都是不怎么带打折的硬件线性增长 ARM的指引是CPU的供需缺口可能会到30%以上,这几个原因的叠加,加上AI服务器对CPU服务器产能和订单的挤压,可能会让缺口更大,各个hyperscaler的反应可能是会滞后的 ------------------ CPU整体需求潜力增长的同时,ARM服务器CPU也赶上了历史上最好的时代: Hyperscaler为了节省成本,接近50%的新增传统server CPU都是ARM,Google的Axion,Amazon的Graviton,Microsoft的Cobolt,Graviton甚至2026年的产能已经全部卖完,瓶颈成了产能 Google TPU配Axion,Amazon Tranium配Graviton,Nvidia Rubin配自家Vera CPU,这部分CPU为什么会集体转向ARM,除了成本因素之外,也因为推理系统为了追求token throughput,batch越来越高越做越复杂,自研ARM CPU以及系统性软件硬件的co-design会更方便,比如Nvidia是Dynamo去控制Vera和Rubin之间的协同 Nuvacore的规划上来看,不仅仅满足于做IP,也要做成品,因为在招聘网站上出现了validation engineer的职位 但是这次Nuvacore面临的挑战也不小:起步太晚了,无论是市场上,还是技术上,竞争都激烈了很多。CPU服务器和七年前比,已经复杂了很多,已经不再是单片CPU的竞争,而是rack系统级别的复杂度 现在开始做2028~2029年上市的CPU,要做到rack级别有竞争力,规模要大很多,基本上要几十个chiplet,500+个core拼起来,还要考虑如何适配AI agentic workload,工作量比以前明显要大的多,对一个startup的挑战比七年前也大得多 ---------------- 上次Nuvia在成立两年之后成功的以14亿美元出售,这次市场热度比五年前高了一个数量级,Nuvacore之后的路会怎么走呢? 如果是被收购路线,其实买家可能比五年前比并没有更多,这五年里,Google有了Axion,微软有了Cobalt,Amazon有了Graviton,Nvidia自研的Vera CPU已经成型,连ARM也打破了35年来只做IP的常规,开始做自己的AGI CPU芯片 最有可能的是Softbank系,softbank已经在ARM CPU服务器生态上布局深耕了多年,65亿美元收购了Ampere,再收购Nuvacore是很正常的事情,这个市场想象力足够大 其他的选择也可能是Meta,因为几家互联网公司里,只有Meta的silicon house没有稳定可靠的CPU服务器,有限的资源在MTIA都做AI加速器去了 但是Meta的问题在于稳定性极低,决策每个月都在变化,注意力非常短期化,项目随时取消,对Nuvacore来说完全无法兑现潜力,是一个非常糟糕的买家 但总体来说,Nuvacore的选择肯定比五年前宽了太多了,对ARM CPU服务器的潜力大家的共识都很明确,融资的难度要小很多,自己运营扩张起来,阻力比以前小很多,合作伙伴的配合程度上也因为未来预期,会容易很多 完全可以自己做大到比Nuvia当年更大的规模再考虑出路,根本不着急卖
显示更多
0
27
484
96
转发到社区