註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 体考
体考 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 体考 的搜尋結果
华尔街日报:中美两国正考虑就AI领域问题展开正式磋商,预计会加入下周习特会的议程。 知情人士透露,双方都希望开展定期对话,以应对人工智能模型行为异常、AI自主军事武器系统或非国家行为体使用强大的开源工具进行攻击等带来的风险。贝森特正领导美方推进此项工作,等待中国方面指定对口官员。
顯示更多
0
22
84
7
轉發到社區
连续 6 周暴涨之后,AI 半导体还能涨多久? 上周美股科技板块的走势看得人有点恍惚,尤其是存储板块,今天开盘又是一阵头晕目眩上涨式崩盘。 QQQ 已经连续 6 周上涨,涨幅接近 30.0%。SOX 指数从 4 月初开始直线拉升,涨幅 65.0%,跑在 200 日均线上方 55.0%。CPU 和存储更是领涨中的领涨, $INTC $AMD $SNDK $MU 不知不觉已经晋升为美股的新四大天王。 身边几乎每个投资者都在问同一个问题:这是泡沫吗?还能涨多久? 先说我的判断:从盈利角度看,这轮上涨有基本面支撑,和 2000 年互联网泡沫的核心不同就在这里。 不是泡沫,是盈利在兑现 美国一季度财报季,是 20 年来最好的一季。 标普 500 指数成份股一季度盈利同比增幅 27.0%,分析师此前预测大约 12.0%,实际数据超出预测一倍多。这个增速,是 2004 年以来剔除重大经济冲击复苏期后的最快。 七巨头科技公司一季度利润预计跃升 57.0%,但七巨头涨幅有限,无限资本开支也是其中原因之一。 从 AI 投资 ROI 的角度看,盈利在兑现,资本开支有回报。2000 年互联网泡沫的时候,公司连盈利模型都没有,烧钱讲故事。现在是真金白银在出来,两回事。 但该考虑减仓的时候也在逼近 盈利支撑是一回事,什么时候该减仓位是另一回事。 目前 Hedge Fund 在 AI 半导体高动量股的仓位是比较拥挤的。对冲基金扎堆的地方,波动起来也最狠,热门股票的隐含波动率高达 100%,这挺离谱的一般只有在高波动的新上市股票中能看到。 不过另一边,全球比较大的多头基金,在初期对存储周期性的怀疑打消后,从上周开始逐步加仓存储领域。现在这些大基金仓位大概在 70.0% 的水平,还有空间。到 5 月底左右,可能逐渐打到比较满的程度。 这意味着什么? 短期看,多头基金的买盘还有支撑,市场不会立刻崩。但 5 月底之后,这个边际买力会减弱。在打满仓位的那天,就是短期买盘耗尽的信号。 接下来几周,事件密集 连续四周抛物线式的爆发上涨后,坦白说短期内波动加大的概率不低。 看看接下来排着队的事件: 5/12 CPI —— 重点关注油价传导 5/14 访华 —— 地缘博弈信号 5/15 Kioxia 财报 —— 存储/NAND 方向的重要验证 5/20 英伟达财报 —— 这轮 AI 行情的终极锚点 这之后会进入一段事件真空期。 现在情绪顶满的状态下,任何瑕疵都可能被放大,成为市场借机回撤的理由。不是说要崩,是说波动率要上来了。 没赶上别灰心 最后说一句心里话。 如果你觉得错过了某个细分赛道的暴涨,不用太难受。在这种行情下,没有人能把握住每个上涨的票。能看清大方向,在关键节点做出合理决策,就已经赢了大多数人了。 盈利在兑现,短期不至于崩。但拥挤度在上升,事件密集期波动难免。5 月底前后,需要多一份清醒。 在 @StableStock 上买的美光彻底卖飞了,不过也拿到了 接近翻倍的收益 360-700。@StableStockLive 监控信号里面有一个大户出手非常猛,从 4 月就猛猛的在干 $DRAM ,每次出手都是几十万美金,但在今天开盘以后已经开始在不断卖出 DRAM 也就是存储板块,我觉得可以作为参考信号,这个大户一直挺猛的,可以监控起来。
顯示更多
拉长五年周期看,AI相关的半导体相关的基础设施一定是通缩的。这是因为AI越强大,越接近一种基本人权。在当前这个剧烈分化的社会结构面前,一个通缩的基础设施成为民生工程的基础。东大已经在过去二十年从信息高速公路上通过降费增速多次把基础设施做成了民生保障系统。当然这有一定的zz考量因素。但是如果放到漂亮国,剧烈的k型分化导致AI成为一种民生基础要求,那么基础设施必须要进入affordability范围内。AI越强大,市场反推的需求越强大。
顯示更多
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
顯示更多
0
61
1K
303
轉發到社區
如果你的男朋友这两天没有打开 Claude Code / Codex, 没有满嘴「半导体超级周期」、DRAM、NAND、HBM、PCB 永远缺货,没有突然研究韩国国运,什么 SK 海力士是 AI 铲子股、三星明年盈利世界第一、斗山能源是韩国版 GEV,没有深夜感慨这是国运、是东亚制造业复兴。 说明他没有任何投资理财观念,看不懂产业趋势,错过了时代贝塔。 但也说明他不会被泡沫诱惑,没有 FOMO,不会顶部 All in ,不会把被套也不卖说成长期主义。这种男人,情绪稳定,账户也稳定。 可以考虑结婚了。
顯示更多
0
292
1.6K
115
轉發到社區
GitHub 正式上线 GH-600 认证:Agentic AI 开发者认证! 这套认证专门针对负责设计和管理 AI 智能体系统的开发者。 考核内容涵盖多智能体编排(multi-agent orchestration)、安全防护(guardrails)以及生产环境下的 AI 工作流。 GitHub 明确了新的岗位要求,开发者不仅要会使用 AI,更要具备监督和控制 AI 系统运行的能力。 在 Web3 与 AI 结合的自动化趋势下,这套技术栈将成为核心竞争力。
顯示更多
某位长者说过,一个人的命运当然要靠个人的奋斗,但也要考虑历史的进程 历史的进程就是选择市场、选择板块、选择个股;个人的奋斗就是拿不拿的住,买了什么,有没有乱操作 这两者都很重要。不说 A 股的问题,就说加密货币板块吧,前两天还和 @shirleyusy @fffffiyes_yu 两口子讨论券商股的时候他们聊到了 $IBKR 和 $HOOD 在特定时间段 $HOOD 也曾经是十倍的大牛股,结果现在被迫绑死加密市场,但加密这两年衰退,远远跑输了选择拥抱各国股票尤其是韩股、日股市场的 $IBKR 个人的奋斗(选择押注什么市场)很重要,选择与判断自己处在什么样的历史进程上(加密不再是热点题材,半导体、存储才是资金热捧)也很重要 好的投资回报率既离不开个人奋斗,也离不开历史进程啊 👓
顯示更多
0
32
54
6
轉發到社區
第三,重视睡眠的作用。 睡眠不只是为了恢复体力,它也是记忆巩固的关键环节。 白天学习时,大脑的海马体就像日记本一样,记录下短期记忆,但这些记忆非常短暂,只有在睡觉时,它们才会被转移到大脑皮层,转化为长期记忆。 这意味着,为了考试熬夜死记硬背,可能是最糟糕的策略,因为缺乏睡眠会让你很难长期保留这些知识。 所以,学习前后都要把睡眠放在重要位置,确保大脑有足够时间处理和储存信息。 第四,通过重复来强化记忆。 大脑通过神经可塑性来学习,这需要消耗大量能量和物质,比如脂肪酸和蛋白质,用来建立新的神经连接。 如果只学一次,大脑不会愿意耗费这么多能量去建立这些连接,只有不断重复,你才能向大脑细胞发送足够强的信号,告诉它这件事很重要,必须被强化。 所以,不仅要在单次学习中尽可能多地重复,也要采用间隔学习法,把学习内容分散到不同日子里进行,这样能明显提升长期记忆的构建效果。
顯示更多
又过期了 1 上个月刚吧龙虾给整明白,又来了一个叫做爱马仕的智能体解决方案,某种角度来看,应用层才是最核心的,不然老追着新技术造轮子睡一觉起来自己的商业模式没了是真的恶心人···· 2 当然其实这东西和龙虾的定位差距不大,学了龙虾的也可以很快上手,简单总结一下这东西就是苹果智能体,龙虾是自定义高的安卓智能体,前者有自我迭代学习的能力(ios升级),后者更多依靠自己去调教, 目前来看爱马仕更适合散户自己玩,但不那么折腾,龙虾适合b端和真正的开发者按需定义。 3 豆包强大的地方就在于,他塑造成了一个活生生的助理角色,本质上他不是一个大模型,是一个ai的智能本地解决方案,按照目前的速度发展下去,我看不到后半场腾讯在ai赛道有半点赢的可能性。 4 这几天在用汽车音乐,越来越感叹字节的强大,先不说vip狂送这个补贴版权的事情,光是电台的设计模式就甩了腾讯很多条街,qq音乐是怎么设计出来哪个滑动界面的黑胶视觉效果转动的垃圾交互啊,我看个歌词要精准滑地步哪个区域实在太反人类了··· ps:汽水设计了一个横屏模式字特别大,我还纳闷给谁用的,直到我今天上午去了跑步机才发现这功能对于离得远看歌词实在太友好了。。 5 目前整体市场看跌,考虑到石油那边的不确定性,我想不出这行情需要加仓任何资产的可能性。 6 天热了这颈椎是真的难受,站立办公都救不回来···打算找点靠谱的运动康复机构和专科去看看了。 中年人的生活就是器官救火赛道,颈椎,眼睛,腰椎,尾椎,肠胃,失眠,发胖,真的是有明确的主线的····
顯示更多