註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

Bonna | U酪乳
@bonnazhu
💖 Research & Advisory @Forgd_ 🧐 Investing @ResearchNothing 🔨 Less Fragmented, More Forgd
4.3K 正在關注    4.1K 粉絲
今天 CT 上这个新的 Perp 挺火 它的设计核心,在我看来就是: Tolerated Insolvency + Loss Mining ‼️长文警告‼️ 好多年前我也曾试图为 Pool-Based DeFi 项目设计过类似的亏损挖矿激励,但最后不了了之,因为我发现最终就是从一个坑跳到了另一个坑。 后来 @dYdX @HyperliquidX 这些订单簿 Perp 势头远远盖过 Pool 模式,大家用做市商激励直接绕过了 Pool 模式的扩张困境,也就没人纠结 Pool 模式怎么 GameFi 了。 所以看到 @papertrade_xyz,由衷有一种莫名亲切.. 想从产品设计的角度,聊聊我对这套逻辑的一些理解: ----------------------- 它不是DEX,而是一个边池(Side Bet) 个人认为,没有价格发现的,都不能算作 Exchange。而 PaperTrade 就是这样,其只是基于 Hyperliquid 产生的一个合成的 Perp 敞口,具体的赌注、收费、赔付规则全是自己的,与 Hyperliquid 完全不同。 几个细节: 1)没有订单簿概念,所有成交都和虚拟的 LP 对手方执行,具体会参照 Hyperliquid CLOB 上实时的 Best Bid Offer (BBO),0滑点,0交易费,0 资金费率,最高可以 1000x 杠杆; 2)没有流动性或者深度概念,只要在每个交易对的 Open Interest (OI) 上限之内,用户的多空照单全收,也不存在所谓的 LP 存款行为; 3)用户的盈亏会进入一个只是用于结算而非用于交易执行的 LP 池,用户发生亏损,对这个 LP 池子是正流入,用户产生盈利,对这个 LP 池子是负流出,如果 LP 池子没钱赔赢家,赢家的利润进入一个 FIFO 队列,等未来有人亏了,LP 池子里有钱了再按顺序赔付。 是的,它其实更像是一个边池(Side Bet),借主桌牌面定胜负,但赌注、赔付结构、经济关系全部独立于主桌。 ---------------------- 而要理解 PaperTrade 这么设计的原因, 就要先理解传统 Pool 模式的扩张困境。 传统的 Pool 模式是一种垫付制(Prefunded),需要大家先把钱存进来一起当 LP,既充当流动性和深度,也充当交易者赢的时候的利润兑付来源,好处是 LP 能够分到交易手续费、资金费以及交易者输的时候的客损。 理想情况是,多空完美对冲,从而两者之间的盈亏相互抵消,LP 不承担方向性风险,纯赚交易手续费、资金费。但现实是交易者之间的多空 Skew 在大部分情况下是比较明显的,因而传统 Pool 模式系统的设计重心,都被放在了如何去激励多空双边的平衡,从而降低 LP 的风险上。 毕竟保 LP,就是保交易量和 OI 而解决方案也无非大多是动态 Funding Rate 惩罚 Skew,例如多头太拥挤就收更高的 Funding,逼一部分人平仓或转空,又例如在报价上设置更多的滑点等。用处肯定有,但治标不治本,其次,这类机制也往往导致 Pool 给的报价不一定等于市场上的公允价格,而更多是一个LP 能扛得住的价格。 也正是因为无论用什么方式,最终的多空 Skew 和 LP 方向性敞口,始终会存在不确定性,从而很难精确对冲风险,传统的 Pool 模式都会多多少少被迫用代币激励去弥补 LP 的风险和亏损,但依旧容易面临,在 TVL 达到一定规模后很难更上一层楼的困境,因为这般风险偏好的资金容量就那么多。 这种 LP 不想承担方向性风险,但偏偏系统就需要 LP 来承担的矛盾,永远都存在。 ----------------------- 这其实也是很多新的 Perp Dex,后来并没有把牌全部押注在 Pool 模式上的一个原因,大家要么把它当做初始冷启动的抓手,之后转向订单簿,要么只是充当订单簿之外的一个补充和辅助。 因为, 订单簿没有上面所述矛盾,任何人都能通过价格来表达其风险偏好,和转移其认为的风险,没有谁强迫谁承担任何不想要和未知的敞口。 PaperTrade 的思路则正是在这种订单簿已经基本胜出的背景下,在依旧坚持 Pool 模式路线的基础上,试图去寻找新的突破口。 它也想绕过这个矛盾,怎么做? 赊账制(Deferred Settlement)! 即把理想状态下 Pool 模式里的多空完美对冲,强制硬编码。永远都是亏的用户去兑付赢的用户,哪怕有用户先赢了,但是用于结算的 LP 池子里没有钱,也是先赊账,等有人亏了再兑现。 也就是说,这套机制允许系统在某些时刻处于资不抵债(Tolerated Insolvency)状态,如果有赢家暂时拿不到利润,没关系,排队等着呗,未来有人亏了自然就赔你。允许错配,用时间来消化。 好处当然是不需要预先说服任何人来当 LP,也没有传统 Pool 模式的那些动态滑点、动态 Funding Rate 等等机制,干干净净。似乎唯一的代价就是赢家可能会面临排队领取利润的情况。 但真的如此么? ----------------------- 让我们回到交易者的第一性原理视角: 你亏了,钱是真金白银地没了,被划入 LP 池。你赢了,有一定几率,你的利润只是一个等待队列里的数字,什么时候能拿到取决于未来有没有足够多的人来亏损。亏损是确定的、即时的;盈利是不确定的、延迟的。 这天生就有一个负螺旋: 利润队列长 → 交易者走 → 亏损少 → 利润队列更长。 那怎么打破这个负螺旋呢? Paper Trade 团队的方案是:亏钱挖矿 Loss Mining。 当你亏钱的时候,协议会 Mint 出 $PAPER 给到你,让你不在意亏钱给协议,甚至想要主动亏钱给协议,其实就是用亏损来买 $PAPER 代币啦!而大家买 $PAPER 的原因也是因为可以用来 Staking 分协议的收入,和 LP 池充裕的时候的客损,因此相当于可以分享协议的繁荣。 LP 池子不同余额,也对应不同 Loss Mining 规则: 1)LP 余额 < 0,资不抵债 此时赢家利润需要排队,用户端亏损都优先用于兑付赢家的利润,然后才是积累到 LP 池余额中,并且此时,用户正常的亏损了结是不会 Mint $PAPER 的,只有爆仓的亏损才会 Mint $PAPER,为激励更快有亏损产生,此时爆仓 Mint $PAPER 的速率也是最快的,100 PAPER / $1。 2)0 < LP 余额 < $2M 此时赢家等待队列已清空,用户端产生的亏损因此可以直接积累到 LP 池余额中,正常的亏损了结和爆仓亏损也都可以 Mint $PAPER,速率依旧维持在最快的状态来刺激亏损,100 PAPER / $1。 3)$2M < LP 余额 < $5M 同上,随着 LP 池子余额逐步充裕,Mint 速率渐进衰减。 4)LP 余额 > $5M 此时,LP 池子余额处于充裕状态,Mint 速率降到最低,并且此时用户端产生的亏损(客损)都可以被 $PAPER Staker 分走,相当于 LP 池子有一个软顶 $5M ----------------------- 然而既然是挖矿,那就是可以被薅的, 比如你可以用两个地址对敲,一个盈利,一个亏损,并用亏损地址去领取 $PAPER。虽然协议通过盈利者需要交付一笔 Haircut 把纯套利漏洞堵住了,即盈利端只能拿到小于 100%,亏损端亏 100%,结果是净盈亏取决于 Haircut 与 Mint 出来的 $PAPER 的价值大小。并且协议也用资不抵债时只有爆仓才能 Mint 做了进一步防御, 但事实是你与矿工的关系是相爱相杀的。 从项目方角度,你早期必须拉拢矿工为 LP 池子余额做贡献从而吸引真交易者(毕竟谁都不希望来交易,赢了钱拿不到吧,因此隐含了赊账制虽然不需要 LP 真金白银预先投入,但间接仍需要为潜在赢家尽量提前备好兑付金)。而这个过程中, $PAPER 价格就是最大的影响因素: - 无利可图,矿工离开 - 有利可图,矿工小试牛刀 - 持续上涨,矿工大包大干 当然是希望越涨越好啦, 然而谁又能完全保证价格呢? 并且挖矿的人越多,对 $PAPER 的价格压制也越强: 当 $PAPER 涨过挖矿盈亏平衡点 → 有人来刷 → 供应膨胀 → 价格被压回来。想要继续持续上涨,就要有更多的买盘,以及对 Staking 分红的正向预期,不能走弱。 然而,LP 池余额低 → $PAPER Mint 速率最高 → 供应快速膨胀 → $PAPER 价格承压 → Staking 分红相对于 $PAPER 市值的 Yield 下降 → 没人愿意为了 $PAPER 来交易 → LP 池更难填充 → $PAPER Mint 更快。 这也使得代币流通量越来越多之后, 你系统的容错率是越来越低的, 并且你还无法摆脱币价的影响。 ----------------------- 这也是为什么我会感叹,从一个坑跳到了另一个坑 因为本质上来说, - 传统:垫付制(Prefunded) - 创新:赊账制(Deferred Settlement) 垫付制也好,赊账制也好,两者其实都寄希望于 Token 激励来解决问题,区别只是在于垫付制直接激励 LP 存款方,而赊账制,则是直接给予亏损者奖励,让他们为 LP 池贡献更多的资金,从而去备兑赢家利润。 但 Token Price 本身就是一个不可控的变量,我们也看到了,其价格变化会影响到用户的行为,从而引发达成预想目标的不可控性。 这就是 Token 驱动型机制的反身性陷阱的本质,以及为什么很多创新,总是一鼓作气,再而衰,三而竭。 当然我写这些也并不是为了 Diss PaperTrade, 恰恰相反,在熊市,在大家都跑去AI,高喊 Crypto 没戏了的当下,继续积极探索新范式,这本身就需要勇气。 赊账制作为一个巧妙的思路,确实提出了一种绕过传统 Pool 模式启动和扩张困境的可能性,只是或许需要进一步思考对 Loss Mining 的依赖,以及继续探索不完全被 Token Price 反身性绑架的方式。 @Forgd_ 这边非常愿意和团队交流。
顯示更多
0
33
106
7
轉發到社區
其实 @apyx_fi@saturn_credit 也是一类 Curator 那天在香港和 @fishkiller 老师见面聊起 STRC,讨论到 STRC 到底算不算一种 RWA ,表面上看似是公司的优先股股息,然而这个收益底层实际又是源自 Bitcoin,因而与其说是一种公司信用,不如说是 Bitcoin 的信用。 在这层关系里,MSTR 股东其实就是我们加密语境下所谓的 Bitcoin Looper 或者 Bitcoin CDP Owner (Credit Debt Position) ,它不断以 BTC 抵押来融资买更多 BTC,且每一次自己也出一部分资,以维持相对安全的债务比率。 而 Apyx 和 Saturn,则是 Risk Curator,汇集了链上的资金,配资借给 MSTR 这个 Bitcoin Looping 策略, 并监控 MSTR 这个全球最大的 Bitcoin CDP 的债务比率,积极管理 Curated Assets 对 STRC 的一个风险暴露。 - Apyx 思路是分散底层,配置多个 DAT 优先股 - Saturn 思路是根据 MSTR 杠杆率调整 STRC 持仓 这次主要聊聊它们存在的必要性 以及产品设计思路上的一些区别 -------------------------- 必要性:为何通过 Saturn 和 Apyx 在链上买 当然,对于有美股账户的大部分人来说,直接通过券商买是最直接的选择。只是会丧失一些有吸引力的东西: 1)收益更加平滑 在券商持有 STRC,走的是传统美股的分红流程,会有除息日、登记日、付息日:登记日相当于快照,只有在这一天仍然持有 STRC 的股东才有资格拿到当月股息,除息日通常在登记日前一个交易日,从除息日起买入的 STRC 就不再享有当月股息,然后等到最后付息日,现金才真正打到你账上。 这套流程带来几个摩擦。第一,你可能持有了大半个月,但在除息日之前卖掉了,这段时间的持有没有任何收益回报。第二,如果你在除息日之后买入,你要等将近一整个月才能拿到下一次股息,中间这段"空窗期"就是在纯持有不产息。收益是离散的,并不持续。 而链上的 sUSDat 或 apyUSD,收益是通过汇率持续累积的。协议把月度股息拆成线性释放,sUSDat 对 USDat 的汇率每天都在涨,持有一天就有一天的收益,不存在登记日、除息日这些概念。 2)可组合性带来的想象力 在美股账户里,STRC 就是一个纯被动仓位。但在链上,sUSDat 或 apyUSD 可以接入 DeFi 的可组合基础设施,获得非常多的可能性: 可以拿去 @Morpho 做抵押借贷再买入更多底层资产,循环放大收益。也可以拿去 @pendle_fi 拆成 PT 和 YT,锁定固定收益或者投机浮动收益,毕竟 STRC 本身属于一个浮动股息类资产,即便不考虑两个项目发币的 Points 收益投机,也天生适合做 PT 和 YT 拆分。还可以放进 @CurveFinance 做 LP 赚交易手续费。 ---------------------------- Apyx 和 Saturn 都不约而同选择了双币机制 两个项目都选择了双币结构:一个稳定币,一个收益币。 这算是 DeFi 里大家的一个心照不宣,Ethena 的USDE和sUSDE也是如此。本质是价格暴露 vs 收益暴露的一种解耦,从而更方便执行 ERC-4626 Vault 标准 不过两个项目的双币思路是有一些差异的: 1)Saturn USDat 是 100% 由美国国债抵押的稳定币,本身持有无收益,Saturn 会把国债收益分给 sUSDat的持有者做收益增强。只有当用户把 USDat 质押成 sUSDat 的时候,协议才把对应美债卖出换成 STRC。Unstake 的时候反向操作,卖掉 STRC,买回美债,还你 USDat。这也意味着 USDat: sUSDat 的汇率并不是完全取决于积累的股息收益一路增长,而是也会受到 STRC 的市场价格影响。 2)Apyx Apyx 的 apxUSD 则是直接由 STRC 优先股(加上 @Strive 的 SATA 优先股)做抵押铸造的稳定币。把 apxUSD 锁进 Vault 变成 apyUSD,就能拿到优先股的股息。这也意味着,你从持有 apxUSD 的那一刻起就已经暴露在 STRC 的风险之下了,只是 Apyx 通过超额抵押和多资产篮子(STRC + SATA + 美债)来尽量把 apxUSD 的价格稳定在 $1 附近。apxUSD: apyUSD 的汇率则相对简单,只受股息影响,而不和 STRC 的价格波动有关。 - USDat 不暴露风险,sUSDat 暴露价格 + 收益风险 - apxUSD 只暴露价格风险,apyUSD 只暴露收益风险 这个设计分叉,带来了后面很多的细节差异 👇 ------------------------------ 1、异步执行: Saturn 的机制决定了买卖 STRC 发生在用户的 Mint 和 Redeem 行为之后,理论上你 Mint sUSDat 的时候,协议不是立刻就能买到 STRC 的,中间会有一个时间差,同样 Redeeem sUSDat也是如此。不过实操中,Saturn 在这个买卖异步执行的风险问题上,更多体现在 Mint 上,因为 Redeem 环节用户更多是设置滑点容忍,最终价格要看 STRC 卖出执行价格: Mint 时候的价格参考的是预言机给出的 USDat: sUSDat 汇率,之后协议会在3个交易日内执行买入 STRC 操作,因而可能存在的一个风险是,实际成交时价格相较于 Mint 汇率已经变贵了。极端一些的情况,周末美股不开盘,你 Mint 后(Saturn 允许周末 Mint,按照周五预言机汇率),工作日开盘 STRC 直接跳涨,协议实际买入价格和实际卖 sUSDat 给用户的汇率有偏差,这部分带来的潜在损失,实际是由存量 sUSDat 持有者 Socialize了。 Apyx 不存在这个问题,用户在拿到 apxUSD (用户只能通过 DEX 获取,Mint 只能是白名单做市商机构)的时候已经就是成品了,购买 STRC 行为早就已经发生了,apyUSD Vault 里只有 apxUSD,不涉及 STRC 买卖。 -------------------------------- 2、股息收益率稀释: STRC 的股息是需要登记才能领的。Saturn 在月中新买的 STRC 在本月有很大概率是赶不上拿股息的,要等到下个月,但对应的 sUSDat 份额已经 Mint 出去了。中间这段"不产息"的成本,实际是由存量 sUSDat 持有者承担。TVL 如果短期有非常快速的增长,则APY 会有一个明显的稀释效应。 Apyx 的 apyUSD 的收益则是基于上个月 STRC 余额这个月会产生的收益来确定的,30 天线性释放。不管本月 TVL 怎么增长、新买了多少 STRC、有没有赶上登记日,当月的收益池子是固定的。新增资金不会稀释当月收益。 --------------------------------- 3、除息日价格波动: 之前提到 Saturn 的 sUSDat 净值不仅取决于股息收益,也会受到 STRC 的市场价格影响。具体来说,STRC 除息会带来 sUSDat 价格同步下跌,对应的股息要等到付息日才能到账,然后才买成 STRC 并投入到 sUSDat 净值里。并且为了防止投机者在 STRC 收益注入前买入 sUSDat,注入后立刻赎回的套利行为,收益是缓慢释放的。 这就导致了每次除息的跌幅都会传导至 sUSDat 的价格,然后慢慢平复。而在 Apyx 这一端,apyUSD 净值不受 STRC 价格影响,因而除息跌幅不会传导到 apxUSD: apyUSD 汇率上,而 apxUSD 虽然理论上其也是暴露在 STRC 美元价格风险里,但由于其目前是超额抵押的,STRC 除息后的短期折价恰好被超额抵押缓冲吸收了,因而我们没看到类似的波动。 ----------------------------------- 那么,究竟哪种更好呢? 看似前面三点 Saturn 都差一些,但这些更多只是一种特性,并不对协议本身的安全性和偿付能力构成风险。此外,Saturn 也有自己明显的优势,包括: 1)底层更干净 Saturn 的 sUSDat 底层只有 STRC 一种优先股,外加国债,而 Apyx 的 apxUSD 底层除了 STRC,还有 Strive 的 SATA 优先股,加上美债,未来还会有更多的 DAT 加入,底层会更杂一些。这当然也没有对错,不同的 Curator 本身就有不同的风控策略,Apyx 属于希望分散底层抵押品来做风控,Saturn 则是根据 MSTR 的负债率动态调整抵押品对 STRC 的风险暴露,只是对于很多人包括我自己来说,更喜欢后者,因为并不想碰微策略以外的 DAT 公司,也不想花额外时间去调研 SATA。 2)赎回更快 Saturn 的 sUSDat 赎回本质就是卖出,几天就可以到账了,没有其他牵扯,而 Apyx 的 apyUSD 赎回则需要 21 天,原因和它的收益分配机制直接相关。因为其当月收益来自上个月 STRC 余额,是一个固定金额,30 天线性释放。如果没有这个解锁期,大资金就可以在月初一下子涌进来吃 30 天收益然后月底退出,把上个月就已经在的用户应有的收益给抢走了。而 21 天解锁期的存在,使得即使你抢到了一个月的收益,因为解锁期间没有收益,你贡献的 STRC 余额所产生的收益,仍旧会被分给别人。 而如果我们研究他们的增长飞轮,也会发现略有所不同: - Saturn 属于需求驱动供给 比如用户想要 STRC 的收益敞口,来 Mint sUSDat,协议才去买 STRC。没有需求就没有买入,供给是被动的。规模增长取决于有多少链上资金愿意主动来承担 STRC 的风险。这个模式更"诚实",TVL 里每一分钱都代表了市场资金对于 STRC 这个东西本身的需求。 - Apyx 属于供给驱动需求 铸造方铸造 apxUSD,先把 STRC 配置好,然后把成品投放到 Curve、Pendle 等场景里,让用户看到一个收益率不错的稳定币,被吸引进来。增长取决于铸造方预测未来会有多少对 STRC 的需求,从而去配置多少 STRC。这个模式更"主动",也需要更多积极的管理。 但不管是哪种飞轮,STRC 本身快速成长的规模,就是 apyUSD 和 sUSDat 的增长动力。只要微策略的 mNAV 溢价还在,塞勒就能在 STRC 增长的同时,通过卖普通股来维持合理的负债率,同时截留一部分收益用于付息。从而能够带来 STRC 规模的不断增长,而且这种增长在牛市和熊市是都适用的: 1)在 Bitcoin 价格上行的牛市周期,MSTR 这种 Bitcoin CDP 可以在不依赖股票发行情况下,也发行出更多的 STRC,还不影响负债率。 2)在 Bitcoin 价格下行的熊市周期,我们看到了 MSTR 的溢价并没有消失,MSTR 依旧可以通过股票融资搭配 STRC 发行,去增持 BTC 资产,并平抑 BTC 原本会在牛熊周期切换里剧烈波动的价格。能够无限子弹不断补充权益金,或许这是和传统 DeFi里的 CDP 最大的区别了。 而在熊市中,DeFi 原生收益率大幅下降,本身也大大增加了对 STRC 这种底层只依赖 Bitcoin 信用,风险敞口清晰,有审计的收益的需求。 有句话说的好, 与其把钱给 DeFi 黑客, 不如把钱给到麦克塞勒去托底行业。
顯示更多
0
26
102
10
轉發到社區
重新审视 Token (词元)的属性 TLDR: 之前我也一度觉得是大宗商品/资产 甚至还设想过相关的交易和定价逻辑 也看到不少人提过Token期货,交易所之类 但现在我倾向它只是一种服务,没必要过度金融化 毕竟它没有办法脱离AI推理单独存在,无法被提前生产出来或预先被囤积。但换个角度看,是服务,就天然是分层的、多元的,不同的人有不同的需求,这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。 在这浪潮中,红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑: 1、Token (词元)经济从何而来? 首先它是AI训练转向AI推理的产物, 这是理解 Token 商业模式的基础。 过去模型训练时代,主要是卖算力时间。为什么?因为训练是持续性的大工程,需要大量算力协同工作。这种规模的投入,有资本的大厂基本都会选择自购,毕竟可控性最强,但对于没有能力一次性投入大量资金的团队来说,出于对稳定性的要求,也会倾向选择租赁模式,包下一整段时间的独占使用权,榨干这段时间内算力的所有价值,是一种占用的逻辑。 但随着主流大模型开始进入商用阶段,AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题,这些本质上都是在跑推理,每一次调用,都在为你做一次推理和计算。 而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业,仍然会采用租赁或自购的模式来跑推理,但对于广大中小开发者和应用方来说,他们对算力独占性的要求并不高,因而额外衍生出了按消耗计费的模式,这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的,衡量每次计算消耗了多少资源的那个单位,你付的钱,就是对这次计算的补偿,本质是消耗逻辑。 所以训练和推理是完全不同的生意形态: 训练时代,商业模式是卖 GPU 时间。 推理时代,商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性? 卖Token (词元),就是卖服务! Token (词元) 经济,本质是服务经济! 为什么? 一个比较直接的原因是 Token (词元)不能被预先生产出来,而是产出后就被消耗掉了,并作为衡量你这次推理服务所消耗资源的参考,来给你计费。 且Token (词元) 的一些特性,也和大宗商品的逻辑不像: - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化 你在Claude的100万Token额度,和你在Minimax的100万Token额度,两者本身是没有可比性的,模型不同,性能不同,定价完全可以不一样。 而大家愿意接受价格差异的原因,也是因为 Token (词元) 本质上计量了一种非标准化的服务,而不同用户对服务的诉求是不同的,有的人看重性能,所以愿意支付溢价,有的人看重成本控制,所以觉得国产开源模型也够用了。 而整个模型市场占有率,并没有出现几家独大,本身也是其服务属性的体现。如果 Token (词元) 是资产,那资产的流动性、网络效应,一定会引发所有资源最终向一个市场集中,形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务,而服务市场天然是分层的、多元的,不同的服务商满足不同的需求,所以才构成了 AI 经济百花齐放的基础。 我想通这点后,就不再纠结模型厂商只有哪家笑到最后了。 因为未来必将是多模型共存、多层级并行的格局,Token(词元)也将会被计入到企业的会计成本之中,并反映到企业的产品和服务之中。 比较值得关注的一点是,AI时代Token所代表的服务经济和传统的人力服务经济,成本曲线可能是完全反过来的。由人所提供的服务,长期要求的是报酬上升,这也是为什么服务业占比高的经济体,服务更贵。但 Token 服务恰恰相反,价格长期只会下降,当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作,这部分成本不但不会随时间上升,反而会持续走低。 这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖? - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1)闭源模型厂商:直营为主,分销为辅 最直接的模式。OpenAI 卖 GPT 的 Token,Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里,产品和渠道都是自己的,跟品牌直营店一个逻辑。当然作为最顶级的模型,难免会被接入像一些API中转站,或者Open Router这样的大模型聚合平台被动分销。 2)开源模型厂商:开源也挺赚钱的 开源模型谁都可以拿去用,很多人不想自己本地跑,因此催生出了一批开源模型托管商,他们可以帮你跑模型,并按 Token 收费。但这就引出一个问题:Token 的钱都让模型托管商这些中间商赚了,开源模型的开发者自己怎么赚钱?这一点,至少中国的开源模型厂商,走的很灵活。 像Minimax,Kimi,Zhipu,它们都有自有的 API 直售,更多面向开发者群体,并且也都有自己的 Coding Plan 订阅包,把按 token 计费玩出了订阅制,完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满,各自推出了品牌化的 Claw 产品,帮用户把 OpenClaw 部署好,底层跑自家模型,Token 消耗从自家 API 走。 3)开源模型托管商:帮别人跑模型,赚差价 对于那些没有能力或意愿自己卖 Token 的开源模型来说,托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费: - Together AI / Fireworks:自有 GPU 集群 + 极致推理优化,核心竞争力是翻台率,同样的卡单位时间能吐出更多 Token。 - Groq:自研 LPU 推理专用芯片,不用传统 GPU,核心竞争力是极致速度,跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI:全球 300+ 边缘节点,跑 Llama、Mistral、Qwen,最近还加了智谱 GLM 和 Kimi,核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台,跑 Llama、Mistral 等主流开源模型,核心竞争力是客户的数据和基础设施已经在这些云上了,迁移成本低 4)大模型聚合器:一个入口管所有模型 闭源和开源的大模型越来越多,而不同场景适合不同模型,不同模型的优劣势不同,对开发者来说,一个个去接不同厂商和托管商的 API,管理起来很痛苦。于是催生了 OpenRouter 这类聚合器,可以接几十个模型,开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利,各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增,前十名 Token 消耗量中,中国模型占了 61%,前五有四个是中国的。 而围绕这条 Token (词元) 产业链,也衍生出了一些其他的参与者和新需求: 第一是一些推理优化引擎,vLLM、SGLang 这些开源项目,在大家对效率极致追求的当下,通过对硬件算子层面(更高效地利用 GPU 计算单元,减少内存碎片和带宽瓶颈)以及 LLM 算法层面(让多个请求共享已经算过的内容,更聪明地管理显存)的优化,提升同一张卡在同一时间内的 Token 吞吐量。 它们自己不面向终端用户收费,但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者,会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。 第二是对Token消耗的优化需求,当 Token 消耗逐渐常态化,自然就会有人开始琢磨怎么省钱,也有不少人早就抱怨OpenClaw高昂的Token消耗,那么,帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品,就很有市场了。 ---------------------------- 4、AI经济时代,真正的机会在哪? 我觉得 Token 经济的红利,属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1)如果你有能力,就做一个模型,哪怕是微调的 你不需要从头训一个 GPT,在开源模型基础上针对某个垂直场景做微调,只要在某个细分领域效果够好,就有人愿意按 Token 付费调用你的模型。前面说了,Token 是服务,服务市场天然分层,通用大模型吃不掉所有场景,垂直微调的模型在自己的领地里反而更有定价权。 2)做一个新时代的产品,开放 API 你的产品底层消耗 Token,但你的产品本身也可以对外输出能力,你开放 API,让别的开发者和 Agent 来调用。你买入底层模型的 Token,加上你的产品逻辑和数据,产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3)写 Skill,做 Agent 每一个被广泛使用的 Skill 和 Agent,背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用,你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token,但你是这条产业链上的分销渠道。 而不管你选哪条路, 你的护城河在我看来最终都会归结为三样东西: 算力、算法、数据。 算力影响你的吞吐量 算法影响你的效率和成本 数据决定你是不是不可替代
顯示更多