Register and share your invite link to earn from video plays and referrals.

华尔街观察 Xtrader
@cnfinancewatch
PhD, Professor, CIO ¦ WSV金融模型首席技术官 ¦ 大类资产轮动量化交易者 ¦ 每日A股、美股盘前信息数据,每日券商投行研报、公司隐性利好数据 ¦ 华尔街观察周报 ¦ 公开信息与量化数据,无会员无荐股
Joined April 2010
5.3K Following    117K Followers
Token与算力进入残酷价格战,模型的盈利泡沫正在破裂(华尔街观察) 当算力供给充分释放,开源黑马模型Karins(以DeepSeek为代表)依靠极致成本优势横扫市场,曾经被资本追捧的Token定价体系露出虚高本质。微软开启全面成本核算,全球科技巨头掀起比价浪潮,我们必须直面两个核心问题:传统头部闭源大模型还能守住多少利润,Token虚高定价的泡沫破灭后,整条AI产业链将要承受怎样的连锁风险。 近期一系列产业事件,吹响了AI行业从技术军备竞赛转向成本博弈的号角。微软率先开启精细化算账模式,先是终止总额超30亿美元的甲骨文云服务器采购协议,核心原因是甲骨文公有云无法取得FedRAMP安全认证,不愿投入资金完成合规改造。微软一边抛弃高价算力合约,一边在亚马逊、谷歌之间四处租赁算力资源,就连怀俄明州1.8GW规模的数据中心项目也被客户叫停。这代表算力不再是供不应求的稀缺资源,算力采购正式进入充分比价竞争的阶段,算力溢价彻底消失。 最具颠覆性的信号,来自微软企业级AI产品Copilot Cowork的战略调整。微软高管直接披露,Anthropic的Fable5模型的Token调用成本,达到DeepSeek‑V4 Pro开源模型的50倍,因此微软计划大规模引入DeepSeek等开源模型,替代OpenAI、Anthropic的闭源模型,全面切换为按量计费模式。市场数据印证了黑马模型的崛起,DeepSeek在美国企业市场份额,从4月的1%暴涨至5月的17%,两个月实现16倍扩张。开源模型性能已经对标闭源模型,成本却仅有前者的几十分之一,这就是Karins式黑马模型的突围逻辑,用工业化极致成本效率,冲击依靠高Token定价赚取暴利的传统巨头。 微软与OpenAI7月正式生效的全新合作协议,更是直接刺破头部模型厂商的盈利底盘。旧协议里OpenAI的算力业务95%锁定Azure云平台,微软享受独家权益。新协议彻底取消独家授权,OpenAI可以向所有云厂商售卖模型服务,微软仅保留订单优先承接权。只有经过Azure渠道成交的API订单,微软能够抽取20%分成,OpenAI直接对外销售的收入,微软将无法获得任何收益。高盛测算,这项协议变更,会让微软AI业务每年直接蒸发40‑60亿美元利润。背后的现实十分残酷,甲骨文OCI、CoreWeave的GPU算力报价,已经低于Azure云平台,算力价格内卷,让绑定单一云厂商的闭源商业模式难以为继。 至此可以明确判断,过往的Token价格存在严重虚高。过去三年全球AI资本开支疯狂扩张,AI硬件年度资本支出已经达到2.9万亿美金,市场默认Token可以维持高定价,以此覆盖巨额算力投入。闭源头部厂商依靠技术壁垒与算力垄断,人为抬高Token单价,企业客户只能被动接受高价。但开源模型打破了技术垄断,相同业务目标下,开源模型可以把推理成本压缩至原来的五十分之一。闭源模型高昂的定价,不再由技术价值支撑,而是算力稀缺性与行业信息差催生的价格泡沫。在企业客户全面比价之后,原有定价体系已经完全站不住脚。 在黑马模型的冲击之下,头部闭源大模型的盈利空间会被持续压缩。首先企业级大客户会大规模迁移订单,优先采购开源模型服务,OpenAI、Anthropic的核心企业收入会快速流失。其次行业会开启持续价格战,头部厂商被迫主动下调Token单价,毛利率会出现断崖式下滑。原本依靠高毛利覆盖训练成本、硬件投入的盈利模式彻底失效。过去依靠持续烧钱堆算力、堆硬件的增长路径,会被市场抛弃。美股市场已经给出明确反馈,消息落地当日,费城半导体指数暴跌5.71%,英特尔、AMD、美光等算力硬件企业股价集体大跌,资金大规模从AI半导体赛道出逃,涌入工业蓝筹防御资产,资本市场已经预判算力资本开支降温的长期趋势。 Token定价泡沫破裂之后,一系列深层风险会接连显现。 第一,全球AI算力资本开支迎来收缩周期。上一轮科技周期里,思科在资本开支退潮阶段股价最大跌幅达到90%。如今市场预期AI硬件投入增速大幅放缓,甲骨文就是典型案例,账面云业务增速高达93%,640亿的待确认收入十分亮眼,但是自由现金流为‑237亿美元,企业还要再融资400亿美元维持杠杆运营,算力企业的债务杠杆游戏即将走到尽头。算力硬件厂商、云厂商都会面临订单下滑、估值回调的压力。 第二,企业端会出现成本收缩的多米诺效应。海外企业已经严格管控Token消耗,国内企业也开始跟进,腾讯已经大幅削减员工的Token报销额度。当企业开始严格约束AI调用量,模型厂商的整体Token消费量增长会显著放缓,原本依靠调用量高速增长的行业增长逻辑彻底逆转。这里存在一个尖锐的现实问题,全球程序员年收入天花板约1.5万亿美元,如果未来程序员收入回落至1万亿美元,企业必然会严格核算AI投入产出比,不会再无节制投入算力开支。 第三,全球大模型行业格局彻底重塑。目前Claude在全球企业市场依旧占据五成份额,DeepSeek、智谱GLM、通义千问等中国开源模型合计赔率来到40%,市场普遍预判,到今年年末,国产开源模型将在全球市场进一步抢占闭源巨头的份额。闭源模型只能守住极小部分对极致性能有强需求的高端场景,绝大多数标准化企业业务,会被成本占绝对优势的开源模型替代。
Show more