何恺明的新模型通过diffusion完成语言推理,最大优势就是不需要海量的kv cache了。存储的故事估计要开始出现裂缝了。
最近准备vibe coding一个不需要全局kv cache的LLM推理引擎。看看实际效果怎么样
拉长五年周期看,AI相关的半导体相关的基础设施一定是通缩的。这是因为AI越强大,越接近一种基本人权。在当前这个剧烈分化的社会结构面前,一个通缩的基础设施成为民生工程的基础。东大已经在过去二十年从信息高速公路上通过降费增速多次把基础设施做成了民生保障系统。当然这有一定的zz考量因素。但是如果放到漂亮国,剧烈的k型分化导致AI成为一种民生基础要求,那么基础设施必须要进入affordability范围内。AI越强大,市场反推的需求越强大。
顯示更多
很多未来要发生的事情,在新技术出现后前三年大部分已经都出现了。未来也是过去的一种隐喻。并不是完全石头缝里蹦出来的。
过去一段时间研究kv cache 压缩发现一个计算与存储的矛盾:因为当前AI存储需求是基于计算妥协导致,长期看计算慢慢吃掉多余存储空间,导致存储供应过剩。所以如果计算下跌,存储会跌的更多,如果存储上涨,计算会涨的更多。如果计算没存储涨的多,说明市场存储泡沫进一步放大,只需要加仓计算就行了。
顯示更多
我看很多人把agentic os理解成cron,loop,context管理。我最近感觉更接近agentic os的是推理引擎,virtual file for page attention,kv cache状态管理,prefill/decode i/o 管理。本地模型部署。
顯示更多
刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊!
OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。
完全不用联网、不用交月费,还支持131K超长上下文。
日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。
非常适合公司的一些部门使用啊!
以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。
模型直达👉
顯示更多
感觉段永平彻底转向了消费领域。手里股票除了伯克希尔,西方石油,基本上都是消费股。苹果,腾讯是数字消费,pdd,阿里是电商消费,ppmt和茅台是情绪消费
顯示更多
低利率环境非常适合流动性扩散,特别是符合进入商业化阶段的带有护城河的早期标的。
现在笼统相关分析,btc就是在两条宏观线之间反复被预期和情绪交易。一条是战争,包括伊朗战争,也包括贸易战。另一条就是货币政策,财政政策其实相关性都很模糊。尽管很多宏观分析把美国财政操作覆盖在内。而货币政策现在基本上被通胀牵制。这里有一点感叹:战争总会结束的,即使不结束也会被遗忘。但是通胀不会,而且时不时出来刺激一下市场。而btc somehow总是可以提前对这些宏观因素进行计价。对普通人来讲是黑天鹅,但是对有的人可能不是。这也没有办法。
而美股的交易主题就是AI了。AI的供需紧张已经可以无视宏观上的干扰,但是市场对基本面风吹草动的扰动非常敏感。也就会经常发生事后矫正的情况。相比现代战争,产业供需关系算是一个年度为单位的长周期事件,price in的过程需要好几个季度的基本面正面。所以关键的前瞻性思考需要聚焦在产业的主题上。
想想现在市场的这种微妙感受也挺有趣的。
顯示更多
saylor 打破只买不卖的人设预期,应该是对btc相关的宏观前瞻性有一定的预设。strategy的mnav 变成btc市场波动性的一个放大因子。btc的波动性是价值储备的负面因素,swing交易的正面因素。零和博弈的宿命。
顯示更多
从四个维度判断自己是否在投资/投机的路上进步:
开始阶段:知道自己知道
ego/fomo阶段:不知道自己不知道
fomo/ego阶段:不知道自己知道
系统阶段:知道自己不知道
ego/fomo->fomo/ego 有点loop性质,很容易来回切换。
顯示更多
巴菲特持续卖出的时候并不可怕,可怕的是大家都在嘲笑巴菲特的时候。😂
现在AI圈子里各种爽,vibe coding爽,买AI股票也爽。反观crypto就是各种虐,涨了没追虐,跌了没卖更虐。这是为何?可能原因就在巴菲特的一个观点里:没有现金流的资产,只能靠后边的人接盘实现退出。这个本质问题把大部分的crypto 持有者拖入了一个零和游戏中以邻为壑。要赤裸裸正视人性。这很难,而且大部分普通人都无法承受这种压力。这就注定了一个慢慢被边缘化的命运。黄金投资者其实也只是投资群体里minority。
顯示更多