算力紧缺已经临界点,我们将面临近几年来最大规模算力紧缺。看OpenAI官方披露 截止到3月底API每分钟处理量已突破150亿Token,而25年10月这个数据是每分钟处理60以Token,不到半年时间增长了2.5倍。
AI Agent的快速普及和爆发应该是算力短缺背后最主要的驱动逻辑,Agent热潮正在耗尽“算力”,导致计算能力严重短缺。看起来,淘金热让“镐和铲”(计算资源)先耗尽了。
我们已经看到了算力短缺的影响:
1)限量供应:多家 AI 公司对产品进行配给rationing),高频用户不满。
2)可靠性下降:频繁宕机(outages)。例如 Anthropic 的 Claude 工具出现多次中断,已收紧使用限制(部分“无限”套餐用户45分钟就用完)。
3)产品调整:OpenAI 部分取消了 Sora 视频生成工具,目的是腾出计算资源给编码、企业级产品和新模型(代号 Spud)。
4)价格上涨:GPU 租赁价格在两个月内涨了48%。
据纽约数据服务商Ornn发布的算力价格指数,租用英伟达最新一代Blackwell芯片的每小时费用目前为4.08美元,较两个月前的2.75美元上涨48%。
问题在于,为什么不直接部署更多设备?
因为交货周期太长,数据中心建设周期太长,而且2026年之前可用的电力容量已经全部提前预订完了。
我们可能是第一次直观的感受算力短缺的严重影响,这意味着AI繁荣正面临“物理极限”。
正好昨天AI算力产业链瓶颈传导的底层逻辑这篇长文里也聊到:这已经不是芯片不够,而是整体基础设施(GPU/TPU、芯片上的如HBM、光模块、数据中心、电力)都跟不上。
算力产业上关键卡脖子环节、算力基础设施、newcould都会进一步受益于紧缺潮。
顯示更多