华尔街观察 Xtrader(@cnfinancewatch):Token与算力进入残酷价格战，模型的盈利泡沫正在破裂（华尔街观察）当算力供给充分释放，开源黑马模型Karins（以DeepSeek为代表）依靠极致成本优势横扫市场，曾经被资本追捧的Token定价体系露出虚高本质。微软开启全面成本核算，全球科技巨头掀起比价浪潮，我们必须直面两个核心问题：传统头部闭源大模型还能守住多少利润，Token虚高定价的泡沫破灭后，整条AI产业链将要承受怎样的连锁风险。近期一系列产业事件，吹响了AI行业从技术军备竞赛转向成本博弈的号角。微软率先开启精细化算账模式，先是终止总额超30亿美元的甲骨文云服务器采购协议，核心原因是甲骨文公有云无法取得FedRAMP安全认证，不愿投入资金完成合规改造。微软一边抛弃高价算力合约，一边在亚马逊、谷歌之间四处租赁算力资源，就连怀俄明州1.8GW规模的数据中心项目也被客户叫停。这代表算力不再是供不应求的稀缺资源，算力采购正式进入充分比价竞争的阶段，算力溢价彻底消失。最具颠覆性的信号，来自微软企业级AI产品Copilot Cowork的战略调整。微软高管直接披露，Anthropic的Fable5模型的Token调用成本，达到DeepSeek‑V4 Pro开源模型的50倍，因此微软计划大规模引入DeepSeek等开源模型，替代OpenAI、Anthropic的闭源模型，全面切换为按量计费模式。市场数据印证了黑马模型的崛起，DeepSeek在美国企业市场份额，从4月的1%暴涨至5月的17%，两个月实现16倍扩张。开源模型性能已经对标闭源模型，成本却仅有前者的几十分之一，这就是Karins式黑马模型的突围逻辑，用工业化极致成本效率，冲击依靠高Token定价赚取暴利的传统巨头。微软与OpenAI7月正式生效的全新合作协议，更是直接刺破头部模型厂商的盈利底盘。旧协议里OpenAI的算力业务95%锁定Azure云平台，微软享受独家权益。新协议彻底取消独家授权，OpenAI可以向所有云厂商售卖模型服务，微软仅保留订单优先承接权。只有经过Azure渠道成交的API订单，微软能够抽取20%分成，OpenAI直接对外销售的收入，微软将无法获得任何收益。高盛测算，这项协议变更，会让微软AI业务每年直接蒸发40‑60亿美元利润。背后的现实十分残酷，甲骨文OCI、CoreWeave的GPU算力报价，已经低于Azure云平台，算力价格内卷，让绑定单一云厂商的闭源商业模式难以为继。至此可以明确判断，过往的Token价格存在严重虚高。过去三年全球AI资本开支疯狂扩张，AI硬件年度资本支出已经达到2.9万亿美金，市场默认Token可以维持高定价，以此覆盖巨额算力投入。闭源头部厂商依靠技术壁垒与算力垄断，人为抬高Token单价，企业客户只能被动接受高价。但开源模型打破了技术垄断，相同业务目标下，开源模型可以把推理成本压缩至原来的五十分之一。闭源模型高昂的定价，不再由技术价值支撑，而是算力稀缺性与行业信息差催生的价格泡沫。在企业客户全面比价之后，原有定价体系已经完全站不住脚。在黑马模型的冲击之下，头部闭源大模型的盈利空间会被持续压缩。首先企业级大客户会大规模迁移订单，优先采购开源模型服务，OpenAI、Anthropic的核心企业收入会快速流失。其次行业会开启持续价格战，头部厂商被迫主动下调Token单价，毛利率会出现断崖式下滑。原本依靠高毛利覆盖训练成本、硬件投入的盈利模式彻底失效。过去依靠持续烧钱堆算力、堆硬件的增长路径，会被市场抛弃。美股市场已经给出明确反馈，消息落地当日，费城半导体指数暴跌5.71%，英特尔、AMD、美光等算力硬件企业股价集体大跌，资金大规模从AI半导体赛道出逃，涌入工业蓝筹防御资产，资本市场已经预判算力资本开支降温的长期趋势。 Token定价泡沫破裂之后，一系列深层风险会接连显现。第一，全球AI算力资本开支迎来收缩周期。上一轮科技周期里，思科在资本开支退潮阶段股价最大跌幅达到90%。如今市场预期AI硬件投入增速大幅放缓，甲骨文就是典型案例，账面云业务增速高达93%，640亿的待确认收入十分亮眼，但是自由现金流为‑237亿美元，企业还要再融资400亿美元维持杠杆运营，算力企业的债务杠杆游戏即将走到尽头。算力硬件厂商、云厂商都会面临订单下滑、估值回调的压力。第二，企业端会出现成本收缩的多米诺效应。海外企业已经严格管控Token消耗，国内企业也开始跟进，腾讯已经大幅削减员工的Token报销额度。当企业开始严格约束AI调用量，模型厂商的整体Token消费量增长会显著放缓，原本依靠调用量高速增长的行业增长逻辑彻底逆转。这里存在一个尖锐的现实问题，全球程序员年收入天花板约1.5万亿美元，如果未来程序员收入回落至1万亿美元，企业必然会严格核算AI投入产出比，不会再无节制投入算力开支。第三，全球大模型行业格局彻底重塑。目前Claude在全球企业市场依旧占据五成份额，DeepSeek、智谱GLM、通义千问等中国开源模型合计赔率来到40%，市场普遍预判，到今年年末，国产开源模型将在全球市场进一步抢占闭源巨头的份额。闭源模型只能守住极小部分对极致性能有强需求的高端场景，绝大多数标准化企业业务，会被成本占绝对优势的开源模型替代。

2026.06.17 08:57

Token与算力进入残酷价格战，模型的盈利泡沫正在破裂（华尔街观察）当算力供给充分释放，开源黑马模型Karins（以DeepSeek为代表）依靠极致成本优势横扫市场，曾经被资本追捧的Token定价体系露出虚高本质。微软开启全面成本核算，全球科技巨头掀起比价浪潮，我们必须直面两个核心问题：传统头部闭源大模型还能守住多少利润，Token虚高定价的泡沫破灭后，整条AI产业链将要承受怎样的连锁风险。近期一系列产业事件，吹响了AI行业从技术军备竞赛转向成本博弈的号角。微软率先开启精细化算账模式，先是终止总额超30亿美元的甲骨文云服务器采购协议，核心原因是甲骨文公有云无法取得FedRAMP安全认证，不愿投入资金完成合规改造。微软一边抛弃高价算力合约，一边在亚马逊、谷歌之间四处租赁算力资源，就连怀俄明州1.8GW规模的数据中心项目也被客户叫停。这代表算力不再是供不应求的稀缺资源，算力采购正式进入充分比价竞争的阶段，算力溢价彻底消失。最具颠覆性的信号，来自微软企业级AI产品Copilot Cowork的战略调整。微软高管直接披露，Anthropic的Fable5模型的Token调用成本，达到DeepSeek‑V4 Pro开源模型的50倍，因此微软计划大规模引入DeepSeek等开源模型，替代OpenAI、Anthropic的闭源模型，全面切换为按量计费模式。市场数据印证了黑马模型的崛起，DeepSeek在美国企业市场份额，从4月的1%暴涨至5月的17%，两个月实现16倍扩张。开源模型性能已经对标闭源模型，成本却仅有前者的几十分之一，这就是Karins式黑马模型的突围逻辑，用工业化极致成本效率，冲击依靠高Token定价赚取暴利的传统巨头。微软与OpenAI7月正式生效的全新合作协议，更是直接刺破头部模型厂商的盈利底盘。旧协议里OpenAI的算力业务95%锁定Azure云平台，微软享受独家权益。新协议彻底取消独家授权，OpenAI可以向所有云厂商售卖模型服务，微软仅保留订单优先承接权。只有经过Azure渠道成交的API订单，微软能够抽取20%分成，OpenAI直接对外销售的收入，微软将无法获得任何收益。高盛测算，这项协议变更，会让微软AI业务每年直接蒸发40‑60亿美元利润。背后的现实十分残酷，甲骨文OCI、CoreWeave的GPU算力报价，已经低于Azure云平台，算力价格内卷，让绑定单一云厂商的闭源商业模式难以为继。至此可以明确判断，过往的Token价格存在严重虚高。过去三年全球AI资本开支疯狂扩张，AI硬件年度资本支出已经达到2.9万亿美金，市场默认Token可以维持高定价，以此覆盖巨额算力投入。闭源头部厂商依靠技术壁垒与算力垄断，人为抬高Token单价，企业客户只能被动接受高价。但开源模型打破了技术垄断，相同业务目标下，开源模型可以把推理成本压缩至原来的五十分之一。闭源模型高昂的定价，不再由技术价值支撑，而是算力稀缺性与行业信息差催生的价格泡沫。在企业客户全面比价之后，原有定价体系已经完全站不住脚。在黑马模型的冲击之下，头部闭源大模型的盈利空间会被持续压缩。首先企业级大客户会大规模迁移订单，优先采购开源模型服务，OpenAI、Anthropic的核心企业收入会快速流失。其次行业会开启持续价格战，头部厂商被迫主动下调Token单价，毛利率会出现断崖式下滑。原本依靠高毛利覆盖训练成本、硬件投入的盈利模式彻底失效。过去依靠持续烧钱堆算力、堆硬件的增长路径，会被市场抛弃。美股市场已经给出明确反馈，消息落地当日，费城半导体指数暴跌5.71%，英特尔、AMD、美光等算力硬件企业股价集体大跌，资金大规模从AI半导体赛道出逃，涌入工业蓝筹防御资产，资本市场已经预判算力资本开支降温的长期趋势。 Token定价泡沫破裂之后，一系列深层风险会接连显现。第一，全球AI算力资本开支迎来收缩周期。上一轮科技周期里，思科在资本开支退潮阶段股价最大跌幅达到90%。如今市场预期AI硬件投入增速大幅放缓，甲骨文就是典型案例，账面云业务增速高达93%，640亿的待确认收入十分亮眼，但是自由现金流为‑237亿美元，企业还要再融资400亿美元维持杠杆运营，算力企业的债务杠杆游戏即将走到尽头。算力硬件厂商、云厂商都会面临订单下滑、估值回调的压力。第二，企业端会出现成本收缩的多米诺效应。海外企业已经严格管控Token消耗，国内企业也开始跟进，腾讯已经大幅削减员工的Token报销额度。当企业开始严格约束AI调用量，模型厂商的整体Token消费量增长会显著放缓，原本依靠调用量高速增长的行业增长逻辑彻底逆转。这里存在一个尖锐的现实问题，全球程序员年收入天花板约1.5万亿美元，如果未来程序员收入回落至1万亿美元，企业必然会严格核算AI投入产出比，不会再无节制投入算力开支。第三，全球大模型行业格局彻底重塑。目前Claude在全球企业市场依旧占据五成份额，DeepSeek、智谱GLM、通义千问等中国开源模型合计赔率来到40%，市场普遍预判，到今年年末，国产开源模型将在全球市场进一步抢占闭源巨头的份额。闭源模型只能守住极小部分对极致性能有强需求的高端场景，绝大多数标准化企业业务，会被成本占绝对优势的开源模型替代。

Forward to community