註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

marlin(蓝v互关)
@zhangyanlongco1
一个不想只写代码的Infra工程师。 大模型训练、推理优化、AI投资判断,讲我真懂的部分。 清华硕士,某自动驾驶公司做大模型Infra。
1.3K 正在關注    256 粉絲
很多人问我: $CBRS(Cerebras)合理市值到底是多少? 我自己的判断是: 短期看情绪, 中期看推理, 长期看生态。 短期(1年): 500-800 亿美元 市场现在交易的是: “下一个 AI 核心资产”。 只要 AI 牛市继续, CBRS 会持续被当成: NVDA 之外最有想象力的 AI infra 标的。 — 中期(2-3年): 1000-1500 亿美元 关键看: 它能不能在 inference(推理)市场真正站稳。 因为 AI 后半场最大的瓶颈, 可能不是 FLOPS。 而是: - KV Cache - 显存 - 带宽 - token latency - scale-out 通信 如果长 context / Agent / reasoning 爆发, Cerebras 的 wafer-scale 架构会越来越吃香。 — 长期(5年+): 2000 亿美元以上(极乐观) 前提是: 它不只是“一个芯片公司”, 而是形成自己的 AI 计算生态。 因为历史证明: 技术强不一定赢。 真正值钱的是: CUDA 这种生态垄断。 所以 CBRS 真正的终局, 不是对标 AMD。 而是: 有没有机会成为 AI 时代新的计算平台。 这才是市场真正赌的东西。 #AI# #CBRS# #NVDA# #Semiconductor# #Cerebras#
顯示更多
蓝V求互关第二波 👀 最近 AI 圈是真的越来越卷了。 时间线已经从: GPT → Agent → Coding → Crypto → 美股 → Token Economy 一天一个热点 😂 做 AI / Agent / Coding / Crypto / 美股 / 出海 的朋友, 评论区留个关键词, 我去串门互关~ 优先关注: 长期输出干货 有自己观点 不只搬运新闻 真正在做项目的人 🤝 一起把中文 AI 圈做大。 #AI# #Agent# #Coding# #Crypto# #美股# #蓝V互关#
顯示更多
运营商开始卖 Token 了。 2026 年 5 月中旬,中国电信、移动、联通几乎同步推出 Token 套餐: 中国电信:9.9 元/月起,1000 万 Tokens 中国移动:部分地区 1 元购 40 万 Tokens 中国联通:个人版 15 元/月起,企业版最高约 20 亿 Tokens 这事的意义不只是“套餐创新”。 而是运营商第一次把 AI 算力包装成基础服务。 以前卖的是: 流量、宽带、通话时长。 以后可能卖的是: Token、Agent 调用次数、云端推理额度。 Token 正在变成 AI 时代的新流量单位。 5G 是上半场,Token 套餐可能才是下半场。 #AI# #Token# #运营商# #中国电信# #中国移动# #中国联通# #Agent#
顯示更多
整理成一条 Thread,更适合直接发: 很多人现在把 DRAM、HBM、显存、KV Cache 混在一起讲。 但这几个概念其实不是一回事。 简单说: HBM 本质上也是 DRAM。 它不是一种完全不同的存储,而是 DRAM 的一种“高带宽形态”。 DRAM 可以粗略分成: DDR4 / DDR5:普通内存 LPDDR:手机、移动设备内存 HBM:AI GPU 上用的高带宽显存 所以 HBM 属于 DRAM 家族。 但问题在于: 大家都能做 DRAM, 不代表都能做好 HBM。 Samsung、SK hynix、Micron 三家都覆盖 DRAM / LPDDR / HBM。 其中 SK hynix 目前是全球 HBM 龙头,尤其 HBM3 / HBM3E 深度绑定 NVIDIA AI GPU。 所以这轮 AI 行情里,海力士本质上是: AI HBM 核心受益者。 Micron($MU)也在吃 AI Memory 红利,只是 HBM 节奏相比海力士略慢。 再看长鑫。 长鑫现在公开主线还是 DDR4 / DDR5 / LPDDR,也就是普通 DRAM。 所以不能简单写成: “长鑫 = HBM 核心玩家”。 这个说法不严谨。 更准确的表述应该是: 长鑫受益于 AI 带来的整体 DRAM 周期回暖,以及服务器内存需求提升。 至于 KV Cache 到底吃 HBM 还是 DRAM? 答案是: 训练阶段主要吃 HBM。 因为训练在 GPU 内部进行,需要超高带宽、低延迟和大规模并行,KV Cache 主要放在 GPU HBM 里。 但推理阶段开始变复杂。 长上下文、Agent、多轮对话、大规模 Serving,会让 KV Cache 变得越来越大。 当 GPU HBM 不够时,系统就会开始往 CPU DRAM、Host Memory、分层缓存去扩展。 所以 AI 推理时代,Server DRAM 的重要性正在提升。 这也是为什么很多人开始重新关注 DRAM。 更准确的投资线索不是: “长鑫 = HBM 龙头”。 而是: AI 训练拉动 HBM, AI 推理拉动 HBM + Server DRAM + 分层 Memory。 所以把“HBM 相关产业链”改成“AI 存储产业链”,会更准确。 长鑫的核心逻辑目前还是: DRAM 周期 + AI Server + 国产替代。 不是 HBM 龙头。 #DRAM# #HBM# #AI# #长鑫科技# #半导体# #存储芯片#
顯示更多
最近看到一个书名挺有意思: Brick by Brick。 中文就是:一砖一瓦。 据说作者是一个长期投资 $TSLA 的人,讲的是怎么靠长期认知和持续投入,吃到特斯拉从 0 到 1 的成长红利。 我觉得这个词也很适合今天的 AI。 AI 不是一夜爆发, 而是: Brick by Brick, Chip by Chip, Watt by Watt。 一砖一瓦, 一颗芯片一颗芯片, 一度电一度电。 模型只是最上层。 真正支撑 AI 的,是 GPU、HBM、数据中心、电力和能源供应链。 所以 AI 越往后走, 越不像互联网生意, 越像基础设施战争。 #TSLA# #AI# #NVDA# #Energy#
顯示更多
Scott 这句话有点扎心。 我们以为 AI 最缺的是 GPU, 后来发现 HBM、存储、数据中心也都不够, 再往下看,最缺的可能是电。 而电也不是凭空来的: Electricity is the bottleneck to AI. Nuclear is the bottleneck to electricity. Enrichment is the bottleneck to nuclear. AI 的瓶颈正在往下沉: 模型 → GPU/HBM/存储 → 数据中心 → 电力 → 核电 → 铀浓缩。 所以 AI 越往后走, 越不像互联网生意, 越像一场工业和能源能力的竞争。 #AI# #HBM# #Energy# #Nuclear# #DataCenter#
顯示更多
今天看到一个特别真实的新闻。 Amazon 内部考核加了一项"AI 使用率", 结果员工开始"刷 token"—— 本来五分钟能写完的邮件,故意丢给 Claude 走一遍, 就为了报表上数字好看。 同一天 Gartner 出报告说, 大部分公司投了一堆钱搞 AI,ROI 根本没起来。 笑死,所以我们现在不是在用 AI 提效, 是在表演用 AI。 🔗 Amazon tokenmaxxing: 🔗 Gartner 报告:
顯示更多