註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 gravity
gravity 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 gravity 的搜尋結果
继 Anti-Gravity 之后,Codex 也开始降额度了,白嫖党不行啊
ZeroStack 1.07 亿美元锁定 21% zero-gravity:native 供应,7 月 5 日股份交换完成——这是全解锁后首个机构级筹码沉淀事件。Texas Blocker SPV 结构下,142,232,948 枚代币 1:1 换 ZeroStack 约 910 万股(11.79 美元/股),同时清零 0G 可转债,传统机构通过纳斯达克股票间接持有 dAI 敞口。当前 0G 流通 2.13 亿枚,5 月 15 日全解锁达峰值后,7 月立即锁定 1.42 亿枚(流通占比超 50%),形成"解锁-锁定"双轮驱动。 资本层机构锁仓 + 应用层真实消耗,7 月前后基本面变盘概率很高。当前价 0.55 美元
顯示更多
今天聊聊可能是 Uniswap V4 时代最性感的原生 Hook 创新协议:$eror (erc20 ordi)。 如果你受够了现在市面上那些各种 Pump 盘、跑得快游戏、以及容易被夹子机器人(Sandwich bots)和高频量化收割的 Bonding Curve,建议花 3 分钟读完 $eror 的白皮书。 这项目非常有意思,它是 Sato 协议的终极升级修复版,核心机制完全由 Uniswap V4 Hook(BeforeSwapDelta 机制) 驱动: 📌 绝对恒定(The Linear Standard):它彻底抛弃了价格曲线。合约就是唯一的发行方和清算所。存入 ETH -> 按固定汇率生成 $eror;销毁 $eror -> 换回 ETH。 📌 单调递增的资产底色:协议对每次 Mint/Burn 征收 5% 费用。注意,这笔钱没有落入任何个人的口袋(无管理员多签,无 owner),而是 100% 永久锁在合约的储备池里。也就是说,池子里的 ETH/Token 比例只会越来越高,为代币提供源源不断地超额质押。 📌 天然的重力井(Gravity Well): • 市场价 > 合约价 ➡️ 套利者从合约 Mint 并抛售平抑溢价,池子变大。 • 市场价 < 合约价 ➡️ 持有者直接找合约 Burn 销毁,无条件拿走 ETH,提供牢不可破的数学底价。 总量 2100 万,目前状态:【小组件已冻结】。 晚上9点上线,代码即真理,真正的去中心化原教旨主义。 👉 合约及详情: #eror# #DeFi# #UniswapV4# #Ethereum#
顯示更多
#独家# Snowflake计划在未来五年内支付60亿美元,以使用亚马逊云科技数据中心内的亚马逊Graviton芯片。该交易将使Snowflake成为AWS最大的CPU计算业务客户之一。
顯示更多
云数据平台公司Snowflake $SNOW 公布强劲季度业绩,并宣布未来五年将在亚马逊云服务(AWS)上投入60亿美元,采购亚马逊自研的基于Arm架构的Graviton通用芯片,以及用于人工智能的GPU。 #行情# Snowflake盘后大涨37%。 Snowflake在2020年上市时曾披露一项与某云服务商签订的五年12亿美元合同(公司后来证为亚马逊),这一规模相较于过往合作大幅提升。
顯示更多
0
10
13
0
轉發到社區
13 个付费应用 vs 免费替代 很多人知道晚了才后悔。 1. AI 聊天 付费: 免费: 2. 流媒体 付费: 免费: 3. 邮箱 付费: 免费: 4. 图片编辑 付费: 免费: 5. 电影和电视剧 付费: 免费: 6. UI 设计 付费: 免费: Designer) 7. 平面设计 付费: 免费: 8. 音乐流媒体 付费: 免费: 9. 办公软件套件 付费: 免费: 10. 直播电视 付费: 免费: 11. 语法检查 付费: 免费: 12. 音乐 付费: 免费: 13. 游戏 付费: 免费:
顯示更多
0
100
348
83
轉發到社區
谷歌和亚马逊自研芯片业务单独看其实体量已经很大了,特别是亚马逊芯片业务按体量算已经是英伟达年营收的五分之一。1、谷歌TPU在25年出货了250万颗,当然主要谷歌云自用。但如果单独剥离看、也是一个年产值一两百亿美金的业务体量。一季度谷歌云4600亿美金的未履约订单,估计一半以都是预订TPU的算力。所以TPU产业链值得关注,fiona关于TPU产业链的分析很全面。 2、而亚马逊自研芯片业务体量更大 亚马逊的自研芯片业务(包括 Graviton CPU、Trainium / Inferentia AI 芯片、Nitro 等)目前年化营收 run rate 已超过 200 亿,且季度环比增长近 40%,同比三位数增长。 如果再把包含内部使用的部分算在内,年收入规模达 500 亿: 
亚马逊 CEO Jassy 明确指出,如果把这块业务视为独立公司、按芯片公司惯例把今年生产的芯片卖给 AWS 自身和其他第三方客户,年化 run rate 将接近 500 亿美金。500亿美金什么体量,已经是英伟达过去四个季度年营收的五分之一。是不是没想到 亚马逊芯片目前内部使用(AWS 自身消耗)占比较大,所以对外销售体现的收入“被掩盖”了。 1)Trainium 的承诺订单金额达 2250 亿:
Trainium(主要是 Trainium2/3/4)已有超过 2250 亿 的营收承诺(revenue commitments),来自 OpenAI、Anthropic(多吉瓦级大规模多年合约)、Uber 等主要 AI 实验室和企业客户。 2)Trainium2 已基本售罄,Trainium3 也接近满订,Trainium4 也有大量预订。 今年一季度财报是亚马逊首次较为系统地披露自研芯片业务的规模,凸显其已成为全球数据中心芯片领域前三的玩家之一(与 Nvidia 等并列)。AWS 整体年化 run rate 已达 1500 亿左右,芯片业务是重要增长点,尤其在 AI 训练/推理领域帮助降低对外部 GPU 的依赖。 从这个角度谷歌和亚马逊自研芯片产业链重要环节都值得关注
顯示更多
不知不觉,过去2周写了很多关于Google #TPU# 的文章,既有技术干货也有商业思考,整理TPU系列文章如下: 1️⃣谷歌重要产品发布介绍分别是 专用于训练的TPU 8t芯片以及Virgo 网络。 2️⃣300万片TPU背后的产业链: 3️⃣为了适应模型发展,第八代TPU设计中,谷歌的软硬件和网络解决方案: 4️⃣Anthropic 订购TPU,他和谷歌的股权投资历史 5️⃣Google TPU 8t和英伟达GB300机架级性能对比 6️⃣TPU封装 7️⃣TPU对英伟达的冲击 8️⃣TPU对谷歌财报未来贡献
顯示更多
0
9
174
37
轉發到社區
今天芯片圈最大的新闻,莫过于Gerard在创立Nuvia CPU被高通收购五年之后,重新出发,新创立了ARM CPU公司,名字也跟之前非常像,叫Nuvacore 现在这个时间点做数据中心CPU,确实是赶上了CPU十年来最好的时代: AI agent带来CPU短缺潮已经经隐隐浮现,AWS多个客户都提出要包揽所有Graviton ARM CPU产能 ------------ 这个消息对硅谷的芯片打工人吸引力是巨大的,Nuvacore这次的阵容都是功成名就的明星阵容,以前Nuvia创始团队重新集合,拿了红衫的投资,做面向 AI 基础设施/agentic computing 的通用ARM CPU。当年还是一个尚未完全被验证的大方向都能大获成功,而现在ARM CPU服务器正在风口浪尖上,前景和想象力和2019年Nuvia比起来大了太多了 上一次Gerard把Google,苹果platform architecture组的架构大佬挖了好多过去,这次的号召力只会强得多,240m的融资,已经验证过的路径和创始团队,肉眼可见的下一个增长风口,一定会让Nuvacore成为湾区最热门最受追捧的芯片startup,没有之一。毕竟这是一个肉眼可见能财富自由而且风险收益比极好的机会 ---------- 遥想当年Nuvia第一代CPU的发布赶上苹果M2时代,还是挺震撼的,Nuvia让高通在一年的时间CPU跑分进步了整整三代,单核跑分从2300变成3200,竟然超过了苹果M2 max一大截 可惜Nuvia Phoenix core从发布到最后上市拖了太久太久,中间苹果把牙膏挤爆了连着上市了M3/M4,于是Nuvia CPU上市之后从跟M2比较变成了跟M4比较,从期待中的C位变成背景板了 当年Nuvia的眼光非常超前,在2019年ARM CPU服务器市场占有率几乎为零的情况下,就是想从零开始打通这个市场,2021年被高通14亿美元收购之后,高通也给了无限的资源支持,扩招力度很大,给的薪水都是市面上最高一档的。 可惜大环境在2022年恶化的很快,加上高通的管理层战略眼光实在太差太短视,在业界ARM服务器生态都开始有起色的时候,为了股价节约开支,竟然再一次把自家的Nuvia CPU 服务器团队解散了(算上2015年已经解散过一次ARM服务器团队) 直到2025年,Nvidia的Grace ARM CPU都已经发布四年了,Vera ARM CPU都已经自研好久了,Amazon的ARM CPU Graviton都快占据CPU服务器新出货的50%了,高通才后知后觉谨慎的重启ARM服务器项目 所以这次Gerard从高通的高管位置把之前的创始团队拉出来自己干,可能是因为高通高层战略眼光实在太差屡屡错过机会,上次Nuvia想做ARM服务器,高通的承诺也因为大环境恶化没做数,结果被收购之后被高通取消了项目直接改做了laptop芯片和手机芯片 加上高通今年在手机销量上因为内存和存储历史级的巨额涨价,可以预见要受到重创(市场萎缩30%),能拿出的扩张预算有限,在高通能拿到的资源是受到掣肘的 而在创业公司里比在 Qualcomm 这种大平台里更容易拿到足够快的决策速度、团队纯度、产品定义权和资本叙事,于是选择在窗口已经被验证时重新集结老班底 但更可能因为,AI时代的CPU前景想象力真的太广阔了,完全值得重新投入一次,不是Gerard变了,而是外部市场变了 ------------------------ 进入2025年之后,AI agent的出现,隐隐让CPU重新变成了瓶颈 CPU服务器重新步入增长轨道,而且潜力巨大,有好几个因素: 1. 随着推理时代的到来,GPU演化到针对推理的系统级新架构,CPU 是永远在忙的总指挥orchestrator, 因为要追求token throughput,所以异构计算阶段变多 + 批处理数量batch越来越大,scheduling/routing/data flow复杂度变高,对orchestration要求也变高 所以在系统级异构推理架构里,AI加速器和GPU在CPU:GPU的配比上,也变得更为激进,从以前的1:4到Grace Blackwell的1:2,以后是很有希望达到1:1的比例的。Google TPU配Axion,Amazon Tranium配Graviton,Nvidia Rubin配自家Vera CPU 这条在我的去年11月半导体年终回顾写过,基本上在2026年成为了共识,虽然这部分主要是各家AI 芯片自研,并不是纯粹的CPU服务器,其实不算是外部CPU服务器的机会 2. 也是同一篇年终回顾里写到的: 从CPU视角去看agentic workload,routing和工具处理都在CPU上,如果把常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU,CPU甚至能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情,Agent管理很多个CPU,再加上agent经常要开sandbox,很可能会成就CPU需求的新一波回暖 现在回看去年写的这个逻辑,潜力是非常大的。但其实年初可能并没有很大规模发生,年初的CPU增长和各家渲染的CPU短缺潮和这个逻辑暂时关系不大,更多可能是前几年的capex投入GPU的比例太大,造成传统CPU服务器投入不够,所以需求上升是一个回补之前传统服务器投入不够的部分。 但到了下半年甚至2027,agent会开始更广泛的铺开,比如智能导购和客服,已经占到了Amazon去年年底100万CPU采购的相当部分比例,这部分的增长是很快的 前两个逻辑,基本上是今年主流叙事在讲CPU潜力的共识,但是我的感悟是,还有另外两个逻辑被低估了: 3. 造成CPU服务器潜力更大,更长线的主逻辑,可能和agent本身没有直接关系,而是code agent带来的副产物: coding门槛和速度的大幅优化,让“构建软件 + 连接软件 + 调用软件 + 自动化软件”这整件事便宜了一个数量级,Jevons 悖论在software供给端的展开,最终把世界推向更高的软件密度和 API 密度,这直接带来了CPU传统workload的线性上升 从2025年年底开始,coding agent迎来了质变,Claude code迎来了爆发式增长,三个月的token营收增长了三倍,那么导致的下一步必然是Code量的十倍增长,以及App数量的巨量增长 即便是在大厂,每天1m token消耗只能算是个平均水平,人均coding量必然是翻倍的(小厂就是翻十倍了),code供给量暴增,不会只停留在 repo 里,而会逐步变成更多长期运行的软件资产,长期存活的feature变多,product变多,microservice变多,API变多 长线来看,App/API所有的生产成本和生产周期会变成原来的10%,API实现极大富足。那么API的Usage就会大量的上升,这就会造成传统CPU Workload或者说CPU Seconds大量的上升,这甚至和agentic没有直接关系 时间维度上,这个逻辑并不是短期性质,Claude code的爆炸是这几个月刚发生的事情,那么产品上线,microservice,api上线,可能都要向后延迟。当软件变便宜,社会不会少用软件,只会把更多事情软件化 所以也许到下半年甚至更久才会看到,传统cpu云的需求又莫名其妙增加了,表面上看,甚至和AI agent没有直接关系 4. CPU是一个技术上很难通缩的东西,不像内存/存储有很多压缩算法会降低单任务对存储的用量,CPU workload增长转化成硬件需求增长是实打实的 比如说kvcache其实每年都有各种压缩技术出现,老的压缩技术比如kvcache的multi-head它会share一个head(GQV),这个大概会相当于4倍的压缩,再比如说去年turboquant这个技术也会新带来几倍的压缩。然后加上数据精度从FP16到现在的下一步要到FP4,精度的下降都会带来kvcache的压缩,从而带来存储方面的技术通缩。 但CPU是一个技术层面上通缩量很小的事情,目前任何的agentic的cpu workload(CPU seconds)增长都是硬件需求增长,它通缩的方面只有每年每一代跑分提高的10%到15%。如果说另外通缩因素,比如云的五倍六倍的超卖会不会影响?不会,因为它一直是超卖的,所以说超卖/利用率低这个CPU技术通缩的因素不会继续扩大了,每个增长的CPU seconds都是不怎么带打折的硬件线性增长 ARM的指引是CPU的供需缺口可能会到30%以上,这几个原因的叠加,加上AI服务器对CPU服务器产能和订单的挤压,可能会让缺口更大,各个hyperscaler的反应可能是会滞后的 ------------------ CPU整体需求潜力增长的同时,ARM服务器CPU也赶上了历史上最好的时代: Hyperscaler为了节省成本,接近50%的新增传统server CPU都是ARM,Google的Axion,Amazon的Graviton,Microsoft的Cobolt,Graviton甚至2026年的产能已经全部卖完,瓶颈成了产能 Google TPU配Axion,Amazon Tranium配Graviton,Nvidia Rubin配自家Vera CPU,这部分CPU为什么会集体转向ARM,除了成本因素之外,也因为推理系统为了追求token throughput,batch越来越高越做越复杂,自研ARM CPU以及系统性软件硬件的co-design会更方便,比如Nvidia是Dynamo去控制Vera和Rubin之间的协同 Nuvacore的规划上来看,不仅仅满足于做IP,也要做成品,因为在招聘网站上出现了validation engineer的职位 但是这次Nuvacore面临的挑战也不小:起步太晚了,无论是市场上,还是技术上,竞争都激烈了很多。CPU服务器和七年前比,已经复杂了很多,已经不再是单片CPU的竞争,而是rack系统级别的复杂度 现在开始做2028~2029年上市的CPU,要做到rack级别有竞争力,规模要大很多,基本上要几十个chiplet,500+个core拼起来,还要考虑如何适配AI agentic workload,工作量比以前明显要大的多,对一个startup的挑战比七年前也大得多 ---------------- 上次Nuvia在成立两年之后成功的以14亿美元出售,这次市场热度比五年前高了一个数量级,Nuvacore之后的路会怎么走呢? 如果是被收购路线,其实买家可能比五年前比并没有更多,这五年里,Google有了Axion,微软有了Cobalt,Amazon有了Graviton,Nvidia自研的Vera CPU已经成型,连ARM也打破了35年来只做IP的常规,开始做自己的AGI CPU芯片 最有可能的是Softbank系,softbank已经在ARM CPU服务器生态上布局深耕了多年,65亿美元收购了Ampere,再收购Nuvacore是很正常的事情,这个市场想象力足够大 其他的选择也可能是Meta,因为几家互联网公司里,只有Meta的silicon house没有稳定可靠的CPU服务器,有限的资源在MTIA都做AI加速器去了 但是Meta的问题在于稳定性极低,决策每个月都在变化,注意力非常短期化,项目随时取消,对Nuvacore来说完全无法兑现潜力,是一个非常糟糕的买家 但总体来说,Nuvacore的选择肯定比五年前宽了太多了,对ARM CPU服务器的潜力大家的共识都很明确,融资的难度要小很多,自己运营扩张起来,阻力比以前小很多,合作伙伴的配合程度上也因为未来预期,会容易很多 完全可以自己做大到比Nuvia当年更大的规模再考虑出路,根本不着急卖
顯示更多
0
27
484
96
轉發到社區
AI货币化拐点,早上谷歌、微软、亚马逊、Meta四家公司财报整体云/广告业务的超预期收入加速,缓解“烧钱不赚钱”担忧。整体看四家均交出强劲兑现的财报,云/广告增速稳健或加速,RPO/Backlog大幅扩张,Capex虽高但营收/Capex比值基本守住,市场的高预期基本得到满足(部分甚至超预期)。 1. 业绩增速看点(最直接验证AI货币化) 增速差异主要来自订单结构(长约 vs 现货)、产能释放节奏(GPU/TPU/Trainium到货 vs 需求)和绝对增量(AI训练/推理占比)。 1)谷歌 Cloud (GCP):实际+63%($200.3亿,远超共识~50%),增速最猛。AI长约占比高(TPU放量+企业AI合约),产能释放节奏最优,绝对增量最大。 2)微软 Azure:实际增长约38%(符合指引37-38%,Q2曾39%)。AI业务ARR达370亿美元(+123% YoY),仍是核心驱动,但受产能交付限制,绝对增量仍强劲,企业GenAI支出转化明显。 3)亚马逊 AWS:实际+28%(25年Q4为+24%,15个季度最快),大幅超共识26%。Trainium/Graviton等自研芯片+Anthropic等大单加速释放,订单结构转向长约+AI推理,绝对增量领先。 4)Meta 广告:总收入563亿美元(+约33%,大幅beat指引中值),广告业务继续高位平台稳增。AI驱动的广告优化(Advantage+、Llama)直接提升ARPU和转化率,货币化效率最高,无云业务但AI直接服务广告。 小结:GCP增速最炸(订单结构+产能双重加速),AWS实现再加速,Azure稳中略降但AI ARR爆炸,Meta广告最“干净”兑现。增速差异验证AI需求真实且分层释放。 2. 资本支出(Capex) 看点(谁在花、花在哪、折旧何时拖累)四家2026年Capex总指引约6600-7000亿美元(GPU/ASIC 50%,建筑+电力25%,网络15%,存储10%)。重点看营收/Capex比值(当前约4.0,若跌破3.5则担忧产能跑输折旧;守住3.8+则折旧拐点推迟至2028+)。 1)谷歌:Q1 Capex 357亿美元,FY26指引1750-1850亿(多数投ML compute)。Cloud收入+63%+op income暴增,AI长约覆盖率高,比值最优,折旧压力最小。 2)微软:本季Capex 319亿美元(2/3投GPU/CPU等短命资产)。FY26预计1000-1200亿,营收/Capex比值仍健康(AI ARR已体现部分回报),折旧压力可控,但OpenAI相关占比高需持续验证。 3)亚马逊:FY26指引2000亿美元(主导AWS基础设施)。Q1 AWS已+28%且芯片业务ARR超200亿(三位数增长),Capex转化为产能最快,营收/Capex比值有望维持较高水平,折旧拖累最轻。 4)Meta:FY26 Capex上调至1250-1450亿美元(较此前指引上调,反映组件涨价+数据中心)。但广告收入直接受益AI,外部长租合约转嫁部分折旧,Capex转化为收入效率最高(类似“高位平台”稳增)。 总结就是,四家Capex均“花在AI算力”,但谷歌和AWS转化最快(营收加速覆盖),微软次之,Meta通过广告最直接兑现。营收/Capex比值整体守住,未现明显拖累,折旧拐点至少推迟。Meta Capex上调尤其被解读为成本压力增大,所以Meta盘后跌幅最多。 3. 剩余未履约订单(Backlog/RPO) 看点(AI订单含金量)四家合计RPO/Backlog已超1.7万亿美元(纯AI算力订单约8000-9000亿)。重点验证需求方现金流稳定性(大客户支付能力)、合同强制性(长约不可取消)和真实消耗验证(实际使用率)。本季重点:RPO环比增长(大概率+20-25%)和加权平均剩余期限(延长至5年以上=长合约时代确认)。 1)谷歌:Cloud Backlog 超4600亿美元(QoQ几乎翻倍,远超此前2400亿),环比增长爆炸。AI长合约占比超70%,剩余期限显著延长至5年以上,长合约时代已确认,真实消耗验证最强。 2)微软:RPO 6270亿美元(+99% YoY),加权平均剩余期限2.5年。剔除OpenAI后+26%(更接近季节性),现金流稳定性高,长约占比提升,但OpenAI集中度仍是风险点。 3)亚马逊:AWS Backlog此前已2440亿美元(+40% YoY、+22% QoQ),Q1 AWS+28%印证消耗加速。新大单(Anthropic等)进一步延长剩余期限,强制性强,需求方现金流稳健。 4)Meta:无传统RPO,但广告业务通过AI优化实现“即时消耗”,相当于高频短约+长效平台,现金流最稳定(广告主ROI直接可见 总结就是,谷歌Backlog环比最炸(确认长合约拐点),微软/亚马逊RPO稳健扩张+消耗加速,Meta间接验证。 三大指标(RPO环比、营收/Capex、云指引)中至少两项超预期,AI基础设施周期从“预期驱动”转向“兑现驱动”正反馈确立。 整体来看本次财报“够炸”——GCP+63%、AWS+28%再加速、Azure稳38%、Meta广告+33%+Capex上调仍beat,RPO/Backlog集体大增,Capex转化效率高于市场隐含担忧。 总体市场逻辑: 1)预期已极高(“上修-兑现-再上修”正反馈),任意两指标不崩就够,但谷歌三指标全超(增速最炸、Backlog翻倍、转化效率高),直接“够炸”带动盘后大涨。 2)微软/亚马逊:业绩beat但指引/细节/转化效率略逊谷歌,未完全超出隐含最高预期,所以盘后先跌再涨; 3)而meta进一步提高资本开支,市场担心“Capex压力仍存”带动盘后回调 简单来说,谷歌用最炸的Cloud+Backlog数据证明“AI钱烧得值”,其他家虽也强劲,但未完全满足市场已被AI热潮吊高的胃口,导致分化。后续看Q2指引和消耗节奏,AI基础设施周期正从预期转向兑现验证。 还是15号这里 agent热潮是真实可见的。
顯示更多
0
10
100
26
轉發到社區
生成式AI往代理式AI迁移中,新的卡脖子环节又出现了,这次是CPU。之前市场关于算力紧缺的讨论都在GPU、HBM、光模块、电力等环节,其实对于CPU的关注比较少。其实Cpu的紧缺传了一段时间了,看最近英特尔、AMD走势最核心驱动力就是来自cpu开始出现紧缺了,甚至连过往不怎么受待见的港股联想集团,最近两周走的也很强。 1、为什agentic ai时代CPU占比会扩大? 传统AI(主要是大模型训练/推理)高度依赖GPU,因为Transformer的核心是并行矩阵运算,GPU擅长高吞吐的并行计算。这时CPU主要只负责“辅助”:数据路由、内存压缩、GPU调度等,导致数据中心CPU:GPU比例很低(典型1:4~1:8,甚至1颗CPU管8颗GPU)。CPU利用率低,基本是配角。 Agentic AI完全不同,它不是单次“问答”,而是自主多步循环(Planning → Tool Use → Act → Observe → Reflect → Iterate),涉及: 1)编排:调度子任务、多智能体协作、分支逻辑、重试机制。 2)工具调用:网页搜索、API调用、代码执行、数据库查询、向量检索(RAG)、文件处理等。 3)其他CPU密集任务:上下文管理、KV Cache处理、强化学习(RL)仿真评估、数据预/后处理。 这些任务高度串行、I/O密集、逻辑分支多,GPU并不擅长(甚至会闲置)。研究显示:工具处理阶段在CPU上可占总延迟的50%~90.6%(GPU在等待CPU)。Agentic工作流中CPU动态能耗占比可达44%,比传统AI高3~4倍。 简单说,Agentic AI把“思考”交给GPU,但把“做事/协调”交给CPU。CPU从“管家”变成了“总指挥”,必须大幅增加才能让整个系统高效运转。这就是CPU占比扩大的核心驱动(Intel、AMD、Arm、TrendForce等一致观点)。 2、CPU成为新紧缺环节的现实证据 今年Q1 Intel/AMD服务器CPU交期已经拉到6-12周,部分型号基本售罄,价格也提了10%以上。厂商自己都说“demand far exceeded expectations”。不是产能不够,而是Agentic AI把CPU从“可有可无”直接干成了“必须配足”的总指挥。 数据中心项目现在除了电力,就是CPU卡脖子最严重。传统x86(Intel/AMD)高功耗+产能紧张,供应链直接打爆。 3、CPU缺口会有多大? 行业共识是CPU:GPU比例将显著拉近,CPU需求大幅提升:从传统1:4~1:8(CPU:GPU)转向1:1~1:2(部分场景甚至1.4:1,即CPU比GPU还多)。看之前Arm估算,每GW算力需要的CPU核心从3000万激增到1.2亿(4倍增长) CPU算力份额:在Agentic工作流中,CPU承担的算力比未来机架/集群可能从“GPU主导”转向更平衡,甚至出现专用CPU rack来支撑Agentic编排;AMD/NVIDIA新一代平台已开始按1:2~1:4设计 这就带来了CPU需求的真实拐点,是实打实的硬件重构。 4、特别要说下ARM服务器CPU会更受益一些? Agentic AI最需要的就是“高核心数+低功耗+稳定串行处理”。ARM天生多核可扩展、perf/watt领先:Arm AGI CPU(136核,TDP仅300W)对比x86同规格功耗低40%+,每机架性能直接翻倍。风冷机架就能塞8000+核,液冷更能到4万+核,完美解决数据中心的“功耗墙”。 更狠的是生态大转向:AWS Graviton、Google Axion、Microsoft Cobalt早就自研ARM,云巨头集体“去x86化”。Arm 3月直接下场自研AGI CPU(首款量产芯片),Meta、OpenAI、Cerebras都是首发伙伴,OEM有联想、Supermicro。 Counterpoint预测:AI ASIC服务器CPU里,ARM份额从2025年25%干到2029年90%。Arm自己说,这波能把数据中心CPU TAM从30亿版税干到1000亿+,未来几年服务器CPU营收很可能超手机,成为最大增长极。 看下周和5月初英特尔、amd的财报电话会上,cpu实际出货量的变化、以及cpu的真实价格变化。这能说明真的有多紧缺。 5、CPU紧缺哪些公司会受益? 梳理了下哪些公司会受益,后续关注起来: 美股最核心: Intel (INTC)ntel 依然是服务器 CPU 市场的霸主。短缺潮会提升其过往型号的利润率,且其 Gaudi 与 Xeon 的组合在代理推理端有强劲需求。 AMD (AMD):理由:在 Agentic AI 服务器市场,AMD 的 EPYC 处理器因多核心优势和高性价比,目前在云厂商中的市占率持续提升,是 GPU+CPU 均衡配置趋势下的首选。 Arm Holdings (ARM):越来越多的云厂商(亚马逊、微软、谷歌)开始自研基于 ARM 架构的 CPU。无论谁赢,只要 Agent 需求推高 CPU 核心数,Arm 的授权费就会大涨。 港股(制造与分销关键点) 中芯国际 (0981):虽然其在最先进制程受限,但大量非核心逻辑控制芯片(支持 CPU 运作的辅助芯片)和中端 CPU 的需求外溢,会显著提升其产能利用率。 联想集团 (0992):全球第一大服务器与 PC 厂商。在短缺潮初期,拥有强大供应链管理能力和库存的大厂能通过提价和保证供应,抢占更多政企市场份额。 A股(国产替代与配套产业链) 海光信息 (688041):国产 x86 服务器 CPU 的龙头。在 Agentic AI 时代,由于其架构与全球生态兼容性最好,国内算力中心在补齐 CPU 短缺时,海光是第一顺位替代品。 龙芯中科 (688047):自主架构 CPU 的代表。随着国产自主可控需求增强,在党政和关键基础设施的 Agent 应用中受益。 深南电路 (002916) / 沪电股份 (002463):理由:配套受益。CPU 核心数增加和 GPU+CPU 配比调整,要求更复杂的 PCB(印制电路板)和封装基板,这些公司是全球高端服务器 PCB 的主力供应商。 澜起科技 (688008):内存接口芯片龙头。只要 CPU 多,内存条就多。Agent 时代对内存带宽要求极高,其 MRDIMM 和内存接口芯片是 CPU 性能爆发的必需品。 投资逻辑核心其实两点: 1)量价齐升:CPU 厂商(AMD, Intel, arm、海光)最直接。 2)卖铲子的人:由于 Agent 需要高带宽,内存配套(澜起)和先进封装/基板(深南)的需求甚至比 CPU 本身更稳。
顯示更多
0
24
317
94
轉發到社區