가입 후 초대 링크를 공유하면 동영상 재생 및 초대 보상을 받을 수 있습니다.

LotusDecoder
@LotusDecoder
AI - mind - heart
가입 December 2023
2.3K 팔로잉 중    6.7K
我认为大多数人没有意识到 token 的紧缺性, 不知道未来一场 token 饥荒正在酝酿。 chatbot 时代, 一个人坐在那里看屏幕,大模型像打字机一样回复。相当于一人占一条推理进程。而人是要休息娱乐的,离线即释放资源。 agent 初期, chatgpt 的 Deep Research 和 o1-pro / o3-pro 放一条调研目标,一跑几十分钟,当然,可以一口气提一大堆需求,全塞进去,然后等结果,但是,人是会看累的,同样单日消费的tokens数有限。更何况,200 美元月费,openai 公布过曾经也才几万人订阅的量级。 agent 发展期, claude code 带领下 agentic coding tool 这波潮流,写代码、做调研、复杂文字项目,做得飞快,token也用得飞快,2025年夏天 claude code token 榜一大哥, 刘小排,一个 200美元claude max 订阅,用出来单月十几万美元的正价 api token 量。2025年年末, 智谱、minimax 首先退出 coding plan ,打出对标 sonnet 口号, 是 claude code 订阅 几倍 十倍用量, 大搞促销。其中智谱 max 支持 20 并发不限速,5小时3亿token,没有周限和月限。各家都在补贴,培育市场。 这个时期虽然程序员们用得多,但是类似健身房, 赚的是办了卡不常去的人的钱,轻度用户的低用量,也让重度用户爽用。 agent 出圈期,2026年小龙虾openclaw多次进入大众视野,腾讯大厦门口排队领取安装,大众意识到,原来 AI agent 可以干点事了,带着好奇与冲动,有抢购 mac mini 的,有去399找人远程安装的,799上门安装的。小龙虾一转起来,各厂家的机房显卡嗷嗷叫。kimi发现,每天整点都有一波token调用高峰,劝大家的openclaw定时脚本,不要放在整点,错峰出行。智谱第一个开始收紧套餐,限并发,要求高峰期排队,无周限月限老套餐开始停售,限供新套餐,minimax 也紧随其后。互联网大厂,阿里、字节、腾讯各自的 编程套餐,从2月春节的几块几十块特惠首月,再到3月底阿里200元一月几乎断货。再到4月底也退出 token plan,按量计费。 可以说,越是发现agent 具有生产力和长时任务执行力,需要的 token 越来,对应的是 显卡 、硬盘、cpu、 内存、网络模块越多。 --- 预测未来: 多agent协作期:当大众认识并接受,一个agent做得事有幻觉,可以一次任务,使用多个不同种类的agent 并行做,然后优选。 一个agent做完,让不同种类的agent给审计一遍。继续提高完成度。 等等方式。 于是 token 的用量再翻一个指数级。 agent自举进化期:人们普遍需求,过去一段时间的工作,可以将agent运行轨迹进行提炼和迭代。 过去某项任务,写一个性能提升目标,让 agent autoresearch一晚上,第二天起床发现变强了。 于是,token 的用量再上一个台阶。 agent自主期:24小时运行,但是不再是按人类设定的目标,拥有自主探索和科研发现的伪自我意识,不同于仅仅服务人类需求的小龙虾。 --- 所以,做一个任务完成度假设。 chatbot 20% 只会聊天咨询建议。 agent初期 40% Deep Research 出一整套方案,但是没法干活。 agent发展期 60% claude code 2025夏日版已经可以干活写生产级代码。 agent出圈期 80% 2025年11月 opus-4.5 将 agent 可用性覆盖到文字类工作,非编程类工作,为 openclaw 小龙虾起飞奠定基础。 多agent协作期 88% 进一步提升完成度。 agent自举进化期 98% 只要舍得砸token,无限将任务完成度推到接近完美。 --- 回看现实,存储建厂扩产,一年增加 20-40%产能, 电力,美国电工缺,建厂慢。 显卡,中国缺,低价显卡迟迟无法大批量运行。 可以说,在蓬勃发展的 AI token 需求下,到处都是物理世界的匮乏,也可以说未来必将会有一场严重供需失衡的token饥荒。
더 보기