注册并分享邀请链接,可获得视频播放与邀请奖励。

摸鱼巨匠🔨
@SunNeverSetsX
🎯 AI + Web 3 + 宏观 📌 Vibe Coding & AI干货 & 自动化工作流 & AI变现 📡 深度学习 | 持续输出 📩 合作:
加入 December 2024
636 正在关注    11.6K 粉丝
今天看了个 Baseten CEO Tuhin Srivastava 谈 AI 推理危机的播客 一句话核心:推理正在变成 AI 行业最后一个也是最大的市场。 算力极度紧缺,谁能拿到 GPU 并做出足够好的软件层,谁就能赢。 Tuhin 透露了几个硬核数据: • Baseten 过去一年增长 30 倍,今年预期收入超 10 亿美元 • 他们的 GPU 集群利用率在中高位 90% • 目前覆盖 18 个云厂商、全球 90 个集群,新云厂商引入到整个推理栈上线只需半天 • 95% 以上的 token 在跑自定义模型,几乎没人用原版开源权重,客户都在用自己的数据微调 关于开源模型和地缘政治,Tuhin 的态度很务实: DeepSeek 和 Moonshot 这些中国模型真的非常好。如果把深寻当 Meta 的模型来用、来准备,比纠结它的来源更有意义。 他同时强调美国确实需要自己的开源模型:五家中国实验室在做开源模型,我们连一个都设得如此艰难,这本身就很说明问题。 关于算力市场的现实: 现在从好的云厂商拿 1000 张 B200,至少需要 3-5 年合同 + 20-30% TCV 预付款。 不仅是产能短缺,能真正运营好数据中心的靠谱供应商也极少——可能只有十几个像样的云,其中只有三四个是金牌级别的。 最有意思的是他对 agent 和推理反馈循环的判断:推理和 post-training 是一体两面。推理产生数据,数据用来评估,评估结果用来 post-training,形成整个循环。计算成本越低,意味着可以在更多地方嵌入更多智能。这就是 Jevons Paradox 在 AI 领域的体现。
显示更多