基于未来是视频时代不是文本时代,
先说结论:闪迪和海力士研究的HBF会成为未来AI领域主导的存储方案。
1.闪迪的 Optimus HBF Gen1分析;
单堆栈容量: 起步 512GB(未来可达数 TB),是当前 HBM 容量的 10 倍以上。
带宽水平: 目标带宽超过 1.6 TB/s,虽然延迟略高于 HBM,但读速度已极度接近。
物理结构: 采用 16 层以上的高速 NAND 堆叠,支持通过 TSV(穿硅通孔)技术直接与 GPU/NPU 互联。
成本优势:HBF 的单位成本仅为 HBM 的几分之一。
2. 视频 AI 场景下的优劣分析;
HBM 的优势:实时生成与扩散模型的“加速器”
优势: 视频 AI(如 Sora、Runway、SeenDance 2)在生成每一帧时,需要进行海量的矩阵运算和参数读取。HBM 的低延迟确保了显存与 GPU 核心之间的数据交换没有“毫秒级”卡顿。
劣势: 容量焦虑。目前顶级 HBM(如 H200)也就 141GB,这导致长视频生成或 4K 高质量视频训练时,显存经常爆掉(OOM),必须通过昂贵的集群来拆分任务。
HBF 的优势:打破“视频素材墙”的“大水管”
优势: 视频数据极其庞大。HBF 允许 AI 模型直接在存储层进行“近内存计算”。
超长视频生成: 当 HBM 装不下权重模型时,HBF 充当“二级显存”,其高带宽保证了模型参数加载到 GPU 的过程不需要像普通 SSD 那样等待。
视频特征检索(RAG): 在处理海量视频素材库时,HBF 能以超高速扫描 TB 级数据,寻找匹配的素材特征,这是传统存储无法想象的。
劣势: 虽然带宽上去了,但 寻址延迟 依然高于 HBM。对于需要极高实时性反馈的 AI 交互场景,HBF 会有微小的滞后。
3. 视频 AI 场景下的“成本帐”
假设你要搭建一个能够实时生成 10 分钟 4K 视频的 AI 工作站:
全 HBM 方案: 你需要部署多块 H200/B200 显卡,仅显存成本可能就超过 5 万美元,且依然可能因为显存容量限制(141GB 封顶)无法处理超长上下文。
HBM + HBF 混合方案: 你只需要少量 HBM 负责核心运算,配合 4TB 的 HBF 存储 作为“大显存池”。总成本可能降至 1.5 万美元 左右,且能处理比前者多出 30 倍 的视频素材量。
根据以上我们可以很直观的判断出,
未来AI存储发展方向至少会演化成少量的HBM负责核心计算,搭配海量的HBF存储芯片。
那么现阶段谁最先掌握了的HBF全栈技术,
谁就能在接下来的视频AI浪潮中获取海量的利润!
毫无疑问现在西部数据wdc的彻底退出,
相当于给闪迪的估值模型松绑,
是闪迪真正走向堪比英伟达一样巨头的起点。
显示更多
存储需求恐怕又要因为seedance2的出现指数级暴增.
gpt3.5带来了文本时代,真正的视频时代,是seedance2带来的.
同样是几个提示词,视频ai消耗的存储将达到几百m,随着ai视频制作时长的增加这个体积还会更大.
这次衍生的存储需求会是原来文本的很多倍.
毕竟现在刷视频成瘾的群体是真多,
全球范围内从婴幼儿到老头老太太谁都逃不过,他们可能不爱看书不爱看新闻但绝对爱刷短视频.
基于此,又会产生新的投资需求.
视频ai需要的存储类型跟文本ai肯定有差异.
gemini给出的现阶段抖音与yputobe采用的存储架构实录.
目前的视频存储并非单一介质,而是复杂的多级冷热分层架构 (Tiered Storage Architecture)。
A. 架构组成
1. 极热层 (Ultra-Hot Tier):用于应对瞬时爆发的流量(如顶流网红刚发布的视频)。
• 类型:NVMe SSD 集群 + 内存级缓存(Redis/Memcached)。
• 核心指标:**IOPS(每秒输入输出操作数)**和极低的延迟。
2. 热/温层 (Warm Tier):用于存放日常活跃观看的视频。
• 类型:高性能企业级机械硬盘 (HDD) 或大容量 QLC SSD。
• 核心指标:吞吐量 (Throughput) 与成本的平衡。
3. 冷层 (Cold/Archive Tier):用于存放数年前、几乎无人问津的长尾视频。
• 类型:高密度氦气硬盘 (HDD) 甚至物理隔离的磁带机。
• 核心指标:每 TB 持有成本 (TCO)。
B. 痛点:I/O 墙与存储孤岛
传统架构下,存储是“静态”的。但 AI 视频时代(SeenDance 2)要求存储从“仓库”变成“流水线”,这直接导致了存储逻辑的崩溃。
根据以上视频公司存储的现状与困境可以延伸出其三个未来发展方向.
视频 AI 存储的三个未来发展方向
1.方向一:从 HDD 到全闪存化 (All-Flash Data Center)
AI 视频训练需要并行读取海量高清素材。传统 HDD 的寻道时间太慢,会拖累昂贵的 GPU 算力。全闪存阵列 (AFA) 将从“奢侈品”变成视频公司的“基础设施”。
2.方向二:CXL 技术下的“内存-存储”融合
Compute Express Link (CXL) 协议将打破内存和 SSD 的界限。对于 SeenDance 2 这种需要处理实时动作对齐的模型,数据在 SSD 和 HBM 之间的搬运速度决定了生成的流畅度。
3.方向三:近存计算 (Computational Storage)
与其把巨大的视频数据搬到 CPU 处理,不如直接在存储主控芯片上进行初步的数据预处理(如视频抽帧、格式转换).
基于以上及图片参数对存储公司作核心竞争力与趋势分析排序评级.
SK海力士(S级): 凭借 Solidigm 的 QLC 容量优势和 HBM 的统治地位,卡死了“大容量读取”和“算力吞吐”两个核心环节。视频 AI 训练集的 EB 级存储首选。
三星Samsung (A+级): 读写最均衡。其 PCIe 5.0 写入速度冠绝群雄,是 SeenDance 2 生成 4K/8K 视频流时最佳的“高速缓冲区”。
闪迪SanDisk (A级): 独立后的黑马。其 HBF(高带宽闪存) 旨在打破内存墙,让 SSD 直接参与 AI 推理,极大利好 64G 内存(如你的 M4 Pro)在本地处理大模型视频生成。
美光Micron (A级): 写入寿命与能效比极高,适合 24/7 不间断生成视频的云工厂。
• WDC (B+级): 专注于 CXL 协议,解决数据中心内内存与存储的动态调配问题。
显示更多