注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 新條由芽
新條由芽 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 新條由芽 的推特
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
61
1K
303
转发到社区
這兩條新聞一起看,就知道高市早苗做對了! 1.大阪市內的「特區民宿」有2091家,其中65.7%由中國資本運營 2.「經營管理」新政策施行之後,申請件數照之前減少96% 🙂🙂🙂
显示更多
0
47
851
119
转发到社区
暗藏玄机, @buidlpad 时隔11天更新了推特,这个打新平台的新项目备受期待,因为上了 BP 的项目,不仅能速通币安,参与的用户还能保本 跟着这条新推顺藤摸瓜进入实习生的主页 @buidlooooor ,可以发现bio出现了一只黑猫!为什么不是黄猫🐱是黑猫? 我觉得算是明示了,@brevis_zk 的吉祥物是黑猫,这个项目背景上线币安也问题不大 如果只看叙事,其实很容易把 Brevis 当成又一个ZK 很厉害的项目。但把时间线和落地拆开看,会发现它推进得非常具体 先是 11 月 17 日,ProverNet 白皮书正式发布 从公布的数据来看,Brevis 现在已经累计处理了 2.5 亿级别的 ZK 证明任务,合作方超过 30 个,不少都已经是大家熟得不能再熟的协议 比如 PancakeSwap 的 Infinity 模块,目前已经通过 Brevis 跑了 1730 万次证明。用户看到的只是手续费钩子变化,背后的判断逻辑全部由证明驱动,不需要信任任何中间方。 Uniswap v4 已经把 Brevis 用在 VIP 分层、LP 忠诚奖励和 gas 返还上;QuickSwap 用来做动态手续费;Euler 的 Incentra 奖励已经发放了 10 万美元等值的 rEUL,分配全程依赖证明结果 在 Linea 这条链上,Brevis 累计跑了 1210 万次证明,覆盖 6.19 万个地址,甚至已经和 MetaMask 的激励机制、Aave 的 2.4% APR 场景连在了一起 这些都不是概念验证,而是正在发生的业务流 整体算下来,Brevis 已经在生产环境里跑过 1.2 亿级别的证明任务,服务超过 9.4 万真实用户。这个规模,在 ZK 项目里已经算是非常靠前的 在激励层面,BREV 现在只做几件事: 用来支付证明费用、用来给提供算力的人做质押、用来分成收益、用来调节参数。没有多余用途,所有消耗都直接和证明任务挂钩 如果把这些进展合在一起看,其实很清楚: Brevis 这条线已经从“能不能用”跨过去了,现在关心的只是跑的人越来越多,接入的协议越来越重 到这个阶段,它更像是在替一部分链上计算打工,而不是做一个单点功能的 ZK 项目 后面的变量,不在方向,而在规模
显示更多
0
99
87
1
转发到社区
我们都对互联网很熟了,完全能够还原农夫山泉在抖音那边受委屈的过程,比如走官方流程去投诉平台上的一些攻击内容,平台会按部就班的让提供证明材料之类,于是就在整理材料的过程中,又有一千条新的侮辱性视频被发出来了⋯⋯再加上有很多观点型内容很难按照农夫山泉的意愿去「处理」掉,这种程序就进入了失效模式。 所以钟睒睒选择自己出来发声,他的人生经验会说,当常规做法行不通的时候,就必须寄望于超常的力量,由他来打破企业家不应该发起撕逼的社会默契,把原本只关系到他个人荣辱的事情扩大到公共领域,兴许就能推动超常力量的介入。 我们都知道这样的超常力量在涉政场景里是经常出现的,但农夫山泉显然无权调用,他在和抖音沟通的过程里,能打的只有维护营商环境这张牌,但抖音显然没有理由替农夫山泉去做大扫除,在抖音之前,这个纵容攻讦的生态位其实是知乎占据的,知乎的态度也很消极,一方面是因为有流量,另一方面是这一代信奉「技术没有价值观」互联网创业者可能还是觉得没人有权免于被评价。 老编辑认为在这个理解上他和我没有分歧,既然没法删贴,那我索性放弃了就事论事的汪洋大海,我也不再费力的去证明自己是不是日本人的后代了,而是直接把张一鸣连带着整个平台的合法性提出来,把矛盾提高到一个让你也很闹心的高度。 潘乱指出来,钟睒睒和被他点名的黄峥、张一鸣分别都当过中国首富,他们之间的矛盾到底有多大程度和普通人有关,是很可疑的,神仙打架,凡人未必遭殃,但站队是天性,这点没法避免。(3/n)
显示更多
1️⃣币圈流动性现状 最近圈里每个人都焦虑睡不着觉。美股创新高、降息预期落地、关税争议解决,但——为什么我买的比特币不涨?山寨还在跌? 是币圈没钱了吗?不是。每个打新(低风险)项目都挤破头去抢,说明钱是够的,但信心不够。 之前,TradFi 和 DeFi 是两套系统: TradFi:资金大而稳,但收益低; DeFi:收益高,但风险和波动也大。 现在,传统资金开始“搬上链”,他们追求的不是山寨暴涨,而是稳定且可持续的收益。这是一场看不见的资本迁徙。他们来抢我们的份额了,导致我们稳定理财的项目都打不进。 2️⃣ 资本套利:新一代稳定资产的崛起。 像 Ethena 的 USDe / sUSDe, 是“链上的美元债券”:有真实收益,透明可查,被传统金融接纳。 传统机构融资成本约 SOFR + 1% ≈ 6%,而像 sUSDe 的链上收益可达 10%+。 ➡️ 稳定利差 3~4%。 别小看这3%,当管理的是十亿美金级的资金池,这就是亿级利润空间。 而由 Ethena Labs 孵化的 @Terminal_fi 正是为这些机构设计的“链上交易所”。 3️⃣ Terminal 在做什么? 核心资产: USDe(链上美元) 收益资产对: sUSDe / USDe(自带利息) 机构级体验: 结算、托管、流动性、跨链调度 10/10 那波插针之后,市场一度担心 USDe 会变成下一个 Luna,但它挺了过来,价差迅速被抹平。Terminal 在上线前金库就锁进了 3亿美金 ,说明资本对这条新赛道的热度仍在。 4️⃣ 搏空投参与方式: 1️⃣ 存入 USDe → 获得 tUSDe 凭证 2️⃣ tUSDe 自动赚取 Terminal Roots 积分 + Ethena Sats 3️⃣ 存入pendle,无锁仓,随时提现(提现为 sUSDe) 收益参考: Pendle 上 tUSDe LP 年化约 12.5% +60x Terminal Roots 积分 +50x Ethena Sats sUSDe 原生利息(约5%) 整体年化在17.5%+代币空投,基于之前ena的1:1空投给的很大方我觉得到年化25%-50%应该问题不大,我存进去了。
显示更多
0
46
74
3
转发到社区
这条推文转发量快超过 10 万了✌️ 图中自称是占卜师的老哥 在 2022 年发推: 2023 年新冠疫情会结束 2026 年汉坦病毒会来临 1976年由韩国学者李镐汪从黑线姬鼠体内分离,以韩国汉坦河命名。 视频中的哥们就是被困在发现疫情的游轮中,无法靠岸,直接被整船隔离了😂
显示更多
我说他妈的为什么 “汉坦” 病毒怎么突然一下在中文区热起来了。 亚洲核心区 新加坡有人中招了。
中国新规落地。 持续了48年的免费午餐,以后就没了。 从今年7月1号开始,外国飞机想飞过 中国的领空,不再免费了。新规写得 很清楚:每一架飞机都要单独申请批 准,全程都要接受管理,没有任何例外。 ​​这件事之所以震动这么大,尤其是日本 那边反应最剧烈,不是因为我们做了什 么出格的事,而是因为我们终于把“弹性 便利”变成了“刚性规则”。1944年的 《芝加哥公约》第一条写得清清楚楚: 每个国家对其领土之上的空域享有完全、 排他的主权。这是国际法的基石,也是 所有国家维护领空权益的底线。 ​过去48年,我们基于对外开放的考量, 在空域管控上保持了极大的包容——外 航无需逐架申请,可按固定航线自由飞 越。但这种善意被一些国家当成了理所 当然,一边享受便利,一边在核心领域 搞技术封锁、搞政治挑衅。 ​​新规的核心是建立规范化、法治化的空 域通行管理体系。所有外国民用航空器 进入、过境中国领空,必须提前提交通 行申请,严格遵照标准缴纳空域使用费 用。飞行全程需实时响应指挥,擅自改 线将面临最高50万元罚款。 ​更关键的是,新法第二百六十一条明确 了对等反制条款:若任何国家对中国采 取歧视性的航空限制措施,中国可依法 对等反制。这不是针对谁,而是在用法 律把权责明确下来:你尊重我的主权, 咱们就有生意做;你搞双标,就别想再 占便宜。 ​​日本之所以反应这么剧烈,是因为自己 的路子被堵死了。2022年日本跟风制 裁俄罗斯,导致西伯利亚空域永久关闭, 亲手掐断了往返欧洲的最优北线路径。 现在日本飞往欧洲的航班中,超过85% 依赖中国内陆空域。 ​这不是“选择”,是“必需”。以东京成田 至伦敦希斯罗航线为例:走中国领空单 程约9200公里,耗时11小时;绕道印度 洋则需1.2万公里,耗时14小时,单趟燃 油消耗增加28吨。日航、全日空每年在 欧亚干线执飞超1100班次,单靠“免费 飞越”就能省下近7亿元。现在“免费午 餐”没了,成本直接原地爆炸。有日本 乘客吐槽:“飞伦敦的机票比去年贵了 一半,原来我们一直在为航司的‘白嫖 依赖’买单。” ​​更让日本航空业心慌的,是新法第二百 六十一条的“对等反制”条款。高市早苗 上台以来,日本政府多次试探中国底线, 在涉台、半导体、海域等问题上屡屡挑衅。 过去我们忍了,现在法律白纸黑字写在 那里:任何触碰底线的行为,中方都可以 直接切断航空通道。这不是威胁,这是制 度的刚性。 ​​说到底,这次修法不是为了多收几个钱。 按现行每公里7.6元的标准,就算10万架 次外航年收费也就几十亿元,连维护全国 空管系统的零头都不够。真正的意义在于, 我们终于将领空主权牢牢掌握在自己手中。 几十年来,国际航空规则基本由西方制定, 中国更多时候只是遵守者。现在,我们不 仅有能力,更有权利制定符合自身利益的 航空规则。 ​这一次,我们只是补齐了国际通行规则 的最后一块拼图。谁慌了,谁心里有鬼。
显示更多
0
88
215
27
转发到社区
《12个港股打新账号,半年赚了4.8万:普通人搞现金流,真有戏》 今天把港股打新 12 个账号的数据拉了出来,这 12 个账号从去年 10 月份开始,每个账号存入 5000 港币,到目前 5 月份算了一下,总盈利有 48284 港币,利润达到 80%,这个数据还是非常漂亮的,当然也是因为今年 4 月份港股打新的行情挺不错的,接下来会怎么样说不准。 也验证了港股打新是属于普通人都能做的项目,虽然赚不了什么大钱,但是赚点现金流还是挺 OK 的,而且投入成本也不高,单账号一般投入 5000 就可以,甚至 3000都没问题,这样性价比会比较高。 这是 12 个账号的数据,但并不代表这 12 个账号每一个都有盈利,因为有些账号一次都没有中过,目前算利润只能算总体,如果有 50 个账号以上,那这条路就很舒服了。 当然,多账号就会涉及到合作分佣、账号归属权等等一连串的管理问题,在参与港股打新的一年多时间里,我也踩了很多坑,我觉得比较重要的有以下几点: 一、账号所有归属权很重要。如果是你的朋友在你的邀新下一起开了账号,那么要说清楚归属权是归自己,前期车旅费、住宿费、伙食费等费用由自己承担,亏损了也由自己兜底,但账号归属权必须把握在自己手上,才不至于后面陷入被动。 二、不管在接账号合作还是接资金合作,最好建议加上一个期限。比如这笔资金要用多久,别到时候中途没搞几个月,又把资金抽走,这样就比较折腾了。如果外面一些朋友的已经开好的账号想找你来管理,或者人家出账号、你来出资金,也应该说清楚这个账号能用多久,别到时候只用了两三个月就要收回去,就会比较尴尬。 三、在注册港卡或者券商的时候,一定要用自己的邮箱。甚至如果可以的话,自己多搞几个手机号,用自己的手机号,操作起来接验证码或者其他流程都会比较方便,不至于到时候找人都找不到。 四、对于涉及到合作分佣也要提前说好。比如市面上一般账号持有者占 15% 左右,但是不承担任何风险,亏损等都是由管理的人来去兜底等等。 当然,在合作的路上还有各种各样的问题需要协调好。我个人觉得,不管是在哪方面的合作,对人对事一定要真诚,合作的路才能走得更久,有什么想法一定要及时提出来当面解决。
显示更多
香港证监会开始对稳定币打新港股这条路出红牌了 5 月 8 日,香港证监会点名 StableStock 与其上游券商 HabitTrade,明确称两者均未获发牌,不得在香港从事任何受规管活动,也不得向香港公众推广相关服务 香港证监会特别提到,已注意到有网络视频诱导公众使用 StableStock,并声称可用虚拟货币认购港股 IPO,目前两家平台已被列入警示名单 这件事刚好踩中了当下最热的几个关键词:稳定币、港股打新、跨境参与。特别是为没有香港券商账户但也希望参与港股打新来分一杯羹的投资者提供了门道 StableStock 原本讲的是一套很诱人的故事:用稳定币直接交易全球证券,背后再由托管、清算和执行去完成传统券商那部分脏活累活,问题在于,叙事可以很新但却被监管盯上了 项目方随后发出的声明,并表示已对香港居民实施注册与交易限制、下架可能触达香港受众的第三方推广内容,同时强调用户账户、资产和交易不受影响 这意味着至少在当前阶段,StableStock 也在试图把问题从是否合规展业收缩成是否误触香港市场,希望继续炒用 USDT 打新港股的想象力 但在牌照、推广边界和属地监管这几个问题真正讲清楚之前,这条路大概率还没到能大规模放量的时候
显示更多
过去 2 小时跟踪了全网 210 条新闻消息,筛出 5 条关注的核心信号。黄仁勋登上空军一号显示出芯片出口管制的博弈已进入顶层决断,而铜价突破 1.4 万美元则反映了地缘冲突对工业底层的压力。 1/ 黄仁勋确认随特朗普同乘空军一号访华。此前关于其未受邀的报道被特朗普本人在社交平台斥为 "FAKE NEWS"。作为全球 AI 算力龙头的掌门人,黄仁勋的随行显示出芯片企业正在寻求出口管制的实质性松绑,顶层外交博弈将直接决定未来四年算力硬件的贸易边界。 $NVDA $TSM 2/ LME 铜价触及 14,196 美元,逼近历史最高纪录。中东硫磺供应枯竭导致非洲矿山的硫酸提取能力受限,这已是物理上的供给中断。铜矿产能缺口在短期内无法通过资本开支弥补,资源端的价格压力正通过产业链向制造端传导。 $FCX $CPER 3/ 工业富联 CPO 交换机订单量从 1 万台大幅上修至 5 万台以上。英伟达已锁定 2026 至 2027 年的机柜产能,全光 CPO 交换机预计在三季度进入量产。算力竞争目前聚焦于数据中心内部的互联带宽,CPO 方案已进入商业爆发期。 $601138.SH $NVDA 4/ SK 海力士股价大涨 7%,其关联方 SKC 计划融资 1.17 万亿韩元量产玻璃基板。该技术样品正接受 AMD 和亚马逊云服务的性能测试。玻璃基板作为提升芯片集成度、越过先进制程障碍的关键材料,正成为存储巨头在 HBM 之外竞争的新壁垒。 $07709.HK $TSM 5/ 日本三大银行最快于本月底采用 Anthropic 的 Mythos 系统。美国财长贝森特亲自向日方通报了这一进展,这揭示了 AI 技术在金融基础设施安全领域的国家级渗透。AI 需求已由实验室的模型训练变成全球金融核心业务的防御性部署。 $NVDA $TSM 以上是本时段核心信号。觉得有用,转发让更多人看到。
显示更多