註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 体験
体験 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 体験 的搜尋結果
初體驗五連發!博多彩葉出現了未曾有過的高潮表情! 你看了博多彩葉的出道作嗎?說真的,有在追蹤社群就知道片商S1有多麼看好她,宣傳真是舖天蓋地而來—然後第2支作品來了,是大家很熟悉「未体験」的企劃,五種不同玩法,讓博多彩葉噴了~ #博多彩葉# 請追蹤 @iroha_0108_
顯示更多
0
17
491
15
轉發到社區
半导体封装的“隐形中枢”:inline检测与OSAT的再定价 半导体产业正在经历一次重心转移:性能提升不再只依赖晶体管缩小,而是越来越依赖封装。2.5D、3D、HBM、chiplet,本质上都在把“系统能力”搬到封装环节。这也直接抬高了OSAT(外包封装与测试)的战略地位。 封装重要性的提升,带来了inline检测的快速增长。 OSAT(Outsourced Semiconductor Assembly and Test)负责两件事: 把裸die封装成可用芯片(封装) 验证芯片是否可用(测试) 过去这是一个低技术、低毛利的环节。但在AI时代,情况变了: 多die集成(chiplet) HBM堆叠 nm级对准要求(hybrid bonding) 封装正在变成: 性能瓶颈 + 良率瓶颈 + 成本瓶颈 inline是一种生产方式:所有工序连续完成,并在生产过程中实时检测与反馈(闭环) 对应另外一个环节是offline:做完再测(开环) 先进封装中的inline检测主要分三类: 1)光学检测(主力) bump高度 overlay(对准) 表面缺陷 特点:速度快,可全量inline。 2)X-ray检测 焊点空洞 TSV缺陷 内部结构问题 特点:能看内部,但速度慢,多用于抽检。 3)电性测试 功能验证 性能分档 更接近最终测试,不属于核心inline控制体系。 inline检测的目标不是“最精确”,而是在不降低产线效率的前提下,实现足够精确的实时反馈 核心矛盾:精度 ↑ → 速度 ↓;速度 ↑ → 精度 ↓ 先进设备的价值,就是在这个矛盾中找到最优解。 inline检测的壁垒来自多维叠加: 1)物理极限 nm级对准 μm级结构 工业环境下接近科研精度 2)速度 vs 精度的工程平衡 高throughput + 高精度同时实现 3)算法与数据 缺陷识别、pattern分析 强依赖历史数据与持续训练 4)工艺耦合 测量 → 调整工艺 → 再测 形成闭环系统 5)客户验证 TSMC / Samsung Electronics / Intel 验证周期长(1–3年) 一旦导入,很难替换 所以门槛极高。inline设备不是工具,而是嵌入客户制造系统的一部分。因此这个市场高度集中: 系统级控制 KLA Corporation Applied Materials → 控制数据与闭环 关键测量节点(alpha来源) Camtek Ltd. Onto Innovation Nova Ltd. → 控制关键测量维度 三家核心玩家对比(Onto / Nova / Camtek) 这三家公司虽然同在inline赛道,但本质上卡的是不同位置。 一句话结论 Onto = 广度(平台) Nova = 深度(前道工艺) Camtek = 弹性(先进封装/HBM) 1️⃣ Onto Innovation 定位: 前道 + 封装双覆盖 optical metrology + inspection + litho 优势: 产品线最广 客户最分散 抗周期能力强 劣势: 单点技术不如Nova深 封装不如Camtek极致 2️⃣ Nova Ltd. 定位:前道metrology核心玩家 优势: 技术深度最强 工艺绑定最深 数据壁垒最强 劣势: 封装参与较少 弹性不如Camtek 3️⃣ Camtek Ltd. 定位: 先进封装(HBM / 3D) 优势: 聚焦3D检测 HBM需求直接驱动 使用频率极高 劣势: 产品线较窄 对周期敏感 竞争关系本质 KLA = 控制系统 Onto = 广覆盖 Nova = 深度测量 Camtek = 封装核心检测 这不是单一赢家市场,而是: 每个关键测量维度一个龙头 封装是制造能力,检测是控制能力。区别在于: 封装 → 可扩产、可竞争 检测 → 嵌入流程、难替代 inline检测具备三个核心特征: 高频使用(每一步都测) 强绑定(工艺耦合) 决定良率(直接影响利润) 在这个体系中:谁打通从设备到数据的全节点,掌握“反馈权”,谁就掌握利润分配权。 免责声明:本人持有文中提及的标的,观点必然偏颇,非投资建议dyor
顯示更多
华尔街观察|半导体设备:国产替代+扩产周期共振,龙头成长正当时 报告日期:2026年5月27日 核心结论:国内半导体设备正处于扩产周期起点+国产化率加速提升的黄金阶段,明后年将进入扩产加速期,市场规模有望接近翻倍。我们看好具备核心技术、客户壁垒的龙头设备企业,以及覆盖全产业链的半导体设备ETF,建议积极配置。 一、行业逻辑:双重红利驱动,成长确定性极强 1. 扩产周期:从“起步”到“加速” • 本轮国内晶圆厂扩产始于2026年,明后年将进入产能释放高峰期,国内半导体设备市场规模预计提升至700亿美元(约5000亿元人民币),较当前接近翻倍。 • 存储芯片(DRAM/NAND)、先进逻辑芯片是扩产核心方向,国内厂商积极推进产能建设,为设备需求提供长期支撑。 2. 国产化率:从35%到60%的巨大空间 • 当前国内半导体设备国产化率约35%,未来目标提升至60%,对应国产设备厂商总订单规模有望达3000亿元,长期利润空间约600-700亿元,对应总市值潜力约2万亿元。 • 美国对华技术封锁持续,国内晶圆厂加速供应链自主可控,国产设备替代进程显著提速。 3. 行业验证:订单与股价共振 • 中微公司等头部厂商已上调全年订单预期,意向订单同比增长超50%,验证行业高景气。 • 二级市场反应积极,北方华创等龙头股价创历史新高,资金持续流入半导体设备板块。 二、重点标的:六大龙头,各领风骚 1. 北方华创( • 核心优势:国内唯一覆盖刻蚀、PVD、CVD、氧化扩散、清洗等多品类的平台型设备商,客户覆盖国内主流晶圆厂。 • 成长逻辑:受益于存储、先进逻辑扩产,国产化率提升驱动各产品线放量,2026年Q1营收同比增长超60%,订单饱满。 • 估值参考:当前PE(TTM)约55倍,处于历史中枢偏下,受益于行业高增长,估值仍有提升空间。 2. 中微公司( • 核心优势:刻蚀设备国内市占率第一,5nm及以下先进制程刻蚀设备已进入国际一线客户供应链。 • 成长逻辑:上调2026年意向订单预期至同比+50%以上,受益于先进逻辑、存储芯片扩产,刻蚀设备国产化率加速提升。 • 催化剂:海外客户订单突破,先进制程设备量产交付。 3. 拓荆科技( • 核心优势:国内唯一实现14nm及以下先进制程PECVD设备量产的厂商,打破海外垄断。 • 成长逻辑:存储芯片(3D NAND)、先进逻辑芯片对薄膜沉积设备需求旺盛,公司产品快速导入国内头部晶圆厂,2026年Q1营收同比增长超80%。 4. 富创精密( • 核心优势:国内半导体设备精密零部件龙头,产品覆盖刻蚀、沉积、清洗等设备,客户包括北方华创、中微公司及海外设备商。 • 成长逻辑:国产设备放量带动零部件需求,公司作为核心供应商充分受益于设备国产化率提升,2026年Q1营收同比增长超70%。 5. 晶华微( • 核心优势:国内半导体测试设备龙头,产品覆盖探针台、测试机等,客户覆盖晶圆厂、封测厂。 • 成长逻辑:存储芯片、先进逻辑芯片产能扩张带动测试需求,公司产品逐步导入国内主流产线,国产化率提升空间大。 6. 华海清科( • 核心优势:国内CMP设备市占率第一,产品覆盖12英寸晶圆,客户包括中芯国际、长江存储等。 • 成长逻辑:存储芯片、先进逻辑芯片对CMP工艺需求提升,公司设备国产化率持续提升,2026年订单增长明确。 三、ETF配置:分散风险,把握行业β 推荐标的:国泰CES半导体设备ETF(561000) • 核心优势: ◦ 紧密跟踪中证半导体设备材料指数,覆盖北方华创、中微公司、拓荆科技等核心龙头,充分享受行业成长红利。 ◦ 交易便捷,流动性好,适合普通投资者布局半导体设备板块,规避个股波动风险。 • 配置逻辑: ◦ 行业处于扩产周期起点+国产化率提升阶段,板块β收益明确。 ◦ ETF分散投资,降低个股踩雷风险,适合长期持有。 四、风险提示 1. 行业周期波动:全球半导体需求不及预期,国内扩产进度放缓。 2. 技术突破不及预期:国产设备在先进制程领域的验证进度慢于预期。 3. 海外竞争加剧:海外设备商降价抢占国内市场,压制国产设备份额。 4. 估值回调风险:板块短期涨幅较大,若业绩兑现不及预期,可能引发估值回调。 五、投资建议 • 个股层面:重点观察北方华创、中微公司等平台型/细分领域龙头,长期受益于行业扩产与国产化率提升。 • ETF层面:观察标的科创半导体设备ETF、国泰CES半导体设备ETF(561000),把握行业β收益,分散投资风险。 • 仓位建议:半导体设备板块可占权益类资产仓位的15%-20%,逢回调加仓,长期持有。
顯示更多
🤖 AI和智能体基础设施 💡本季 AI 项目不再只是对话框,而是具备身份、钱包和决策能力的 Agent 基础设施。 Bank of AI @BAI_AGI 官推 XHunt 排名:14384 【核心】: AI Agent 的链上账户与支付基础设施。 Bank of AI 正在搭建 AI Agent 的链上账户与支付基础设施。它不是单纯做AI中转站,而是围绕 AI Agent 在链上的支付、身份和 DeFi 交互搭建基础设施,覆盖 x402 Payments、链上 AI 身份、Autonomous DeFi 等模块,让 AI Agent 能够拥有可验证身份、发起链上支付,并参与 DeFi 操作。 Brief Tech 【核心】: 嵌入高值法律工作流的垂直领域的AI基础设施。 BriefTech 是一个 LegalTech AI 项目,主要服务律师、争议解决团队和法律专业人士,可用于自动化 bundling、AI-powered indexing、法律文件整理。项目亮点在于作为垂直 AI 应用,直接嵌入高客单价、高专业门槛的法律工作流,解决传统法律行业里高频、耗时、重复的文档处理问题。 Cournot @CournotProtocol 【核心】:通过“真值发现”将 AI 概率性输出转化为可验证推理。 Cournot 解决的是一个 AI 的根本缺陷:模型输出是概率性的,无法自证推理过程,更无法承载高利害决策里的信任和资本。Cournot 的方案是协调多个智能体进行“真值发现”,将 AI 的结论转化为可审计的结构化声明,从而实现可验证推理。预测市场、链上治理、科学发现,这些领域需要一个能够用可验证推理替代“委员会猜测”的裁决层。当 AI 开始参与预测市场、治理和链上决策之后,“AI 说了算”本身也需要被验证。 Functor @FunctorNetwork 官推 XHunt 排名:195698 【核心】:为 Agent 链上行动建立可编程的安全边界授权层。 Agent 拿到授权后怎么办?真正的问题在于,当 Agent 开始能够操作钱包之后,谁来限制它能花多少钱、能调用哪些合约、出错之后如何止损?Functor 做的就是 Agent 的自托管授权层:每一笔签名都必须经过预先定义好的链上授权规则检查。它不是钱包,而是横在 Agent 行动和资金安全之间的可编程安全边界,从资产管理、预测市场到 DeFi 自动化的 Agent 工作流都已接入。 Taco AI @TacoTradeX 官推 XHunt 排名:165910 【核心】: 具备大脑、记忆与保险库解耦架构的 AI 交易执行入口。 Taco AI 的定位是 AI 驱动的加密交易执行层,口号是 “Run Crypto with AI, the Easy Way”。它让用户绕过复杂的自托管和云基础设施,直接使用 AI Agent 进行交易、预测和自动化操作。Taco 的架构把大脑、沙盒、保险库和记忆解耦,既解决了 Agent 执行过程中的安全问题,也避免了每次交互都“失忆”。如果说 Bank of AI 是账户层、Functor 是授权层,那么 Taco AI 更像是用户侧的 Agent 执行入口。
顯示更多
最近半导体涨疯了,英特尔、美光科技、闪迪翻倍了。 整个美股半导体指数从年初涨了接近50%,我又开始反思自己的交易系统了。 真是应了那句话:人真的很难赚到认知以外的钱。 我过去只做左侧交易,左侧交易能给到足够多的安全边际。价格便宜,估值有保护,哪怕短期继续跌,在我的心里也能站得住。 我觉得左侧交易这种风格作为偏好是没问题的,问题是我把它用成了唯一的交易系统,导致我不买半导体,不买CPU,不买内存,也不买黄金,不买Tesla。 1️⃣ 左侧交易会让人产生一种洁癖 我不买特斯拉,因为 PE 太高,严重偏离基本面价值,动辄 300 到 400 倍的PE,怎么看都离谱。 我不买黄金,因为黄金本身只是价值存储,而不带来任何价值增量。并且黄金 ETF 在战争等极端情况下不一定能兑现,实体黄金卖出也有折价和渠道问题。 我不买CPU、内存,是在没经过仔细的了解和验证前就凭借着专业知识下意识觉得CPU和内存的稀缺是一个伪命题。 这些判断单独看,都有道理。 放在一起,就会形成一个超级大Bug,让我错失很多机会。不仅仅是赚钱的机会,也同时是在投资领域开阔视野和精进的机会。我会把所有看不懂的东西,都解释成不值得买。 2️⃣ 高 PE 的标的不应该直接被否决 高 PE 只能说明一件事:市场对未来有很高期待。 这个期待可能是泡沫,也可能是真的值这个价。 高估值不是免死金牌,低估值也不是护身符。 很多便宜资产会一直便宜,因为它本来就是坏生意。 很多贵资产会继续贵,因为它的增长、叙事和资金流还在继续扩散。 投资最难的地方就在这里。 不是找到便宜的标的,而是是搞清楚便宜为什么便宜,贵为什么贵。 我以前不喜欢右侧交易,因为它看起来没有留够安全边际。 但我现在觉得,这个理解真的太粗糙了。 左侧交易的安全边际来自价格,但右侧交易的安全边际来自市场确认。 看到涨了就买,那叫追高;但趋势确认之后,重新评估赔率,设置小仓位和退出条件,这才是右侧交易。 3️⃣ 打算给自己一个新规则 人一切逻辑和推论的起点都是自身的局限和偏见。 我真正要调整的是一种心理惯性:我会把自己不擅长的资产,提前打成低质量资产。 黄金不增值,所以我排斥。 特斯拉 PE 太高,所以我排斥。 半导体涨太多,所以我排斥。 这些都是我的偏见,本质上是一种认知防御措施。 为了防止自己把偏见包装成原则,以后所有我天然讨厌,但市场价格持续走高的资产,都放进一个反偏见观察池,开一个很小的观察仓。 持续观察,然后问自己以下两个问题: -它为什么还在涨? -我的反对理由有没有被证伪? 左侧交易依然是我的主系统,但右侧交易可以成为一个旁路分支。
顯示更多
Leopold 13F曝光:卖半导体,梭哈算力基础设施——他看到了什么 Leopold Aschenbrenner,OpenAI前核心研究员,Situational Awareness Fund掌门人,Q1持仓终于曝光。 一句话总结:弃算力芯片,押AI基础设施全产业链——电力(BE)、存储(SNDK)、算力租赁(CRWV、IREN、CORZ)。 他的最大仓位不是intel,不是amd,而是: •Bloom Energy $878.7M——电力 •SanDisk $724.4M——存储 •CoreWeave $556.1M——AI算力租赁 •IREN $401M——GPU云基础设施 •Core Scientific $389.1M——数据中心 半导体呢?AMD只有$20.2M,SMH $10.3M,台积电$7.6M,美光$5.9M,ASML$6.1M——加起来还不够他一个Coreweave仓位的零头。 对比上个季度报告,我能看到几个明显变化: 新增/大幅加仓(Q1新出现): 1. SNDK $724M——大幅加仓,Q4也有但规模小很多 2. IREN $401M——Q4有,Q1大幅加仓(上个季度只有8.7M shares,这个季度有11.7M shares) 3. CORZ $389M——继续持有(上个季度28.6M shares,这个季度26M,略微减仓) 4. CRWV $556M —— 大幅加仓(上个季度6.09M shares,这个季度7.2M shares) 5. APLD $320M —— 大幅加仓(上个季度11.3M shares,这个季度13.5M shares) 还加仓了RIOT和CLSK Q4有但Q1明显变化: LUMENTUM(LITE)、CIPHER MINING(CIFR)、COHERENT(COHR)、INFOSYS(INFY)——Q4在,Q1消失了,清仓了 这个持仓结构在说一件事:AI算力的红利不在造芯片的人,而在用芯片的人。电力、数据中心、算力租赁——这才是他认为的下一个十年最确定的赛道。卖铲子的赚了第一桶金,现在轮到挖矿的了。 下半年neocloud板块要到验证的时候了,大佬持仓非常看好neocloud,H200 租赁价格都到每小时7刀,B200到每小时5.73,如果芯片都按时部署,那么原定计划的ARR是不是要翻倍? $IREN 我会越跌越补,48-50大概率再来一次,这个位置要加重仓。 #Leopold# #SituationalAwareness# #IREN# #CoreWeave# #CRWV# #AI基础设施# #13F# #美股#
顯示更多
0
20
193
60
轉發到社區
🚀 Cerebras 热度拉满, MSX Pre-IPO 一期也迎来验证时刻。 📌 美东时间 5 月 14 日, $CBRS 正式上线,IPO 发行价定在 185 美元。 🧠 作为英伟达挑战者, Cerebras 押注 AI 推理与晶圆级芯片路线, 也是当下 AI 半导体赛道最受关注的新变量之一。 🎁 已参与 MSX Pre-IPO 一期 Cerebras 项目的用户, 可直接获得空投的 $ CBRS.M 股票代币。 💡 从 Pre-IPO 到 IPO, MSX 想做的很简单: 让优质资产自由流通, 链上美股用麦通。 #MSX# #麦通# #链上美股用麦通# #CBRS# #Cerebras# #AI#
顯示更多
0
42
85
30
轉發到社區
连续 6 周暴涨之后,AI 半导体还能涨多久? 上周美股科技板块的走势看得人有点恍惚,尤其是存储板块,今天开盘又是一阵头晕目眩上涨式崩盘。 QQQ 已经连续 6 周上涨,涨幅接近 30.0%。SOX 指数从 4 月初开始直线拉升,涨幅 65.0%,跑在 200 日均线上方 55.0%。CPU 和存储更是领涨中的领涨, $INTC $AMD $SNDK $MU 不知不觉已经晋升为美股的新四大天王。 身边几乎每个投资者都在问同一个问题:这是泡沫吗?还能涨多久? 先说我的判断:从盈利角度看,这轮上涨有基本面支撑,和 2000 年互联网泡沫的核心不同就在这里。 不是泡沫,是盈利在兑现 美国一季度财报季,是 20 年来最好的一季。 标普 500 指数成份股一季度盈利同比增幅 27.0%,分析师此前预测大约 12.0%,实际数据超出预测一倍多。这个增速,是 2004 年以来剔除重大经济冲击复苏期后的最快。 七巨头科技公司一季度利润预计跃升 57.0%,但七巨头涨幅有限,无限资本开支也是其中原因之一。 从 AI 投资 ROI 的角度看,盈利在兑现,资本开支有回报。2000 年互联网泡沫的时候,公司连盈利模型都没有,烧钱讲故事。现在是真金白银在出来,两回事。 但该考虑减仓的时候也在逼近 盈利支撑是一回事,什么时候该减仓位是另一回事。 目前 Hedge Fund 在 AI 半导体高动量股的仓位是比较拥挤的。对冲基金扎堆的地方,波动起来也最狠,热门股票的隐含波动率高达 100%,这挺离谱的一般只有在高波动的新上市股票中能看到。 不过另一边,全球比较大的多头基金,在初期对存储周期性的怀疑打消后,从上周开始逐步加仓存储领域。现在这些大基金仓位大概在 70.0% 的水平,还有空间。到 5 月底左右,可能逐渐打到比较满的程度。 这意味着什么? 短期看,多头基金的买盘还有支撑,市场不会立刻崩。但 5 月底之后,这个边际买力会减弱。在打满仓位的那天,就是短期买盘耗尽的信号。 接下来几周,事件密集 连续四周抛物线式的爆发上涨后,坦白说短期内波动加大的概率不低。 看看接下来排着队的事件: 5/12 CPI —— 重点关注油价传导 5/14 访华 —— 地缘博弈信号 5/15 Kioxia 财报 —— 存储/NAND 方向的重要验证 5/20 英伟达财报 —— 这轮 AI 行情的终极锚点 这之后会进入一段事件真空期。 现在情绪顶满的状态下,任何瑕疵都可能被放大,成为市场借机回撤的理由。不是说要崩,是说波动率要上来了。 没赶上别灰心 最后说一句心里话。 如果你觉得错过了某个细分赛道的暴涨,不用太难受。在这种行情下,没有人能把握住每个上涨的票。能看清大方向,在关键节点做出合理决策,就已经赢了大多数人了。 盈利在兑现,短期不至于崩。但拥挤度在上升,事件密集期波动难免。5 月底前后,需要多一份清醒。 在 @StableStock 上买的美光彻底卖飞了,不过也拿到了 接近翻倍的收益 360-700。@StableStockLive 监控信号里面有一个大户出手非常猛,从 4 月就猛猛的在干 $DRAM ,每次出手都是几十万美金,但在今天开盘以后已经开始在不断卖出 DRAM 也就是存储板块,我觉得可以作为参考信号,这个大户一直挺猛的,可以监控起来。
顯示更多
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
顯示更多
0
61
1K
303
轉發到社區
长鑫IPO业绩炸裂:净利预增2244%,半导体设备要起飞了 我看完直接坐直了。 Q1营收508亿,同比+719%。 净利润330亿,同比+1268%。 归母净利润247亿,同比+1688%。 公司给的H1业绩指引,归母净利润500-570亿, 同比增长2244%到2544%。 兄弟们,这不是增长,这tm简直是核爆。 01)为什么业绩这么猛?两个原因。 第一,DRAM价格涨疯了。 全球算力需求爆发,AI服务器对HBM和DDR5的需求直接把产能吃光。 三星、海力士、美光都在控产保价,DRAM价格从2025年下半年开始一路飙升。 长鑫作为国内唯一能量产DRAM的龙头,吃满了这波涨价红利。 第二,国产替代在加速。 国内手机厂商、服务器厂商、甚至车企,都在拼命导入国产存储芯片。 长鑫的产能爬坡+产品结构优化,正好卡在这个时间点上,产销两旺。 说白了,长鑫踩中了"涨价+放量"的双重风口,业绩不炸才怪。 02)来,算笔账。 H1净利指引500-570亿,全年按最保守的拍法,1500亿净利。给白酒估值20倍,就是3万亿市值。 但兄弟们,以我大A的暴躁性格,长鑫这种核心龙头、国产替代独苗、业绩增速2000%+的标的,新股上来先给你干到50倍、80倍都有可能。 参考中芯国际当年上市的气势,长鑫的估值天花板,不是市盈率能框住的。 恐怖如斯。 03)真正拉爆的是半导体设备和材料 但我要说的重点不是长鑫本身。 长鑫IPO真正拉爆的,是半导体设备和材料。 逻辑链很清楚: DRAM国产化加速 → 长鑫扩产 → 国产设备导入 → 国产材料验证 → 订单释放 长鑫的募资投向已经明牌了:存储器晶圆制造量产线技术升级改造、DRAM技术升级、前瞻技术研发。全是扩产+升级,全是设备和材料的需求。 个股方面,最核心的是这几个:北方华创、中微公司、拓荆科技、华海清科。但市值都比较大,弹性未必最猛。 拿不准个股的兄弟们,直接上ETF: • 561980 招商半导体设备ETF • 159516 国泰半导体设备ETF • 562590 华夏半导体设备ETF • 159558 易方达半导体设备ETF • 588170 科创半导体ETF 长鑫这份招股书,给我的感觉就两个字:时代。 这不是一家公司的业绩爆发,是整个国产半导体产业链的拐点信号。 DRAM从0到1的突破已经完成了,接下来是从1到10的放量,而放量的背后,是设备和材料的国产化替代。 兄弟们,方向已经明牌了。 长鑫是旗手,设备和材料是主力军。 别纠结估值贵不贵,先想清楚你要不要参与这个时代。 等所有人都看懂了,价格早就飞天了。 最后提醒一句:半导体波动大,心脏不好的别满仓。
顯示更多
0
30
68
14
轉發到社區