qinbafrank(@qinbafrank ):算力紧缺已经临界点，我们将面临近几年来最大规模算力紧缺。看OpenAI官方披露https://t.co/djGbB70U9l 截止到3月底API每分钟处理量已突破150亿Token，而25年10月这个数据是每分钟处理60以Token，不到半年时间增长了2.5倍。 AI Agent的快速普及和爆发应该是算力短缺背后最主要的驱动逻辑，Agent热潮正在耗尽“算力”，导致计算能力严重短缺。看起来，淘金热让“镐和铲”（计算资源）先耗尽了。我们已经看到了算力短缺的影响： 1）限量供应：多家 AI 公司对产品进行配给rationing），高频用户不满。 2）可靠性下降：频繁宕机（outages）。例如 Anthropic 的 Claude 工具出现多次中断，已收紧使用限制（部分“无限”套餐用户45分钟就用完）。 3）产品调整：OpenAI 部分取消了 Sora 视频生成工具，目的是腾出计算资源给编码、企业级产品和新模型（代号 Spud）。 4）价格上涨：GPU 租赁价格在两个月内涨了48%。据纽约数据服务商Ornn发布的算力价格指数，租用英伟达最新一代Blackwell芯片的每小时费用目前为4.08美元，较两个月前的2.75美元上涨48%。问题在于，为什么不直接部署更多设备？因为交货周期太长，数据中心建设周期太长，而且2026年之前可用的电力容量已经全部提前预订完了。我们可能是第一次直观的感受算力短缺的严重影响，这意味着AI繁荣正面临“物理极限”。正好昨天AI算力产业链瓶颈传导的底层逻辑这篇长文里也聊到：这已经不是芯片不够，而是整体基础设施（GPU/TPU、芯片上的如HBM、光模块、数据中心、电力）都跟不上。算力产业上关键卡脖子环节、算力基础设施、newcould都会进一步受益于紧缺潮。

2026.04.14 04:35

算力紧缺已经临界点，我们将面临近几年来最大规模算力紧缺。看OpenAI官方披露截止到3月底API每分钟处理量已突破150亿Token，而25年10月这个数据是每分钟处理60以Token，不到半年时间增长了2.5倍。 AI Agent的快速普及和爆发应该是算力短缺背后最主要的驱动逻辑，Agent热潮正在耗尽“算力”，导致计算能力严重短缺。看起来，淘金热让“镐和铲”（计算资源）先耗尽了。我们已经看到了算力短缺的影响： 1）限量供应：多家 AI 公司对产品进行配给rationing），高频用户不满。 2）可靠性下降：频繁宕机（outages）。例如 Anthropic 的 Claude 工具出现多次中断，已收紧使用限制（部分“无限”套餐用户45分钟就用完）。 3）产品调整：OpenAI 部分取消了 Sora 视频生成工具，目的是腾出计算资源给编码、企业级产品和新模型（代号 Spud）。 4）价格上涨：GPU 租赁价格在两个月内涨了48%。据纽约数据服务商Ornn发布的算力价格指数，租用英伟达最新一代Blackwell芯片的每小时费用目前为4.08美元，较两个月前的2.75美元上涨48%。问题在于，为什么不直接部署更多设备？因为交货周期太长，数据中心建设周期太长，而且2026年之前可用的电力容量已经全部提前预订完了。我们可能是第一次直观的感受算力短缺的严重影响，这意味着AI繁荣正面临“物理极限”。正好昨天AI算力产业链瓶颈传导的底层逻辑这篇长文里也聊到：这已经不是芯片不够，而是整体基础设施（GPU/TPU、芯片上的如HBM、光模块、数据中心、电力）都跟不上。算力产业上关键卡脖子环节、算力基础设施、newcould都会进一步受益于紧缺潮。