注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 第一次跟路人開房間
第一次跟路人開房間 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 第一次跟路人開房間 的推特
在西門町被酒店經紀搭訕 問我要不要做酒店小姐 我直接拒絕❌ 沒想到他對我死纏爛打 纏著纏著就直接去附近的旅館持槍進入我的洞穴… 很莫名其妙..但蠻爽的🥵 #第一次跟路人開房間# 無套約呀 做了後還對我有佔有慾 不准我做酒店了??
显示更多
2023 年,Meta 首席 AI 科學家楊立昆給當時的 LLM 熱潮潑了一盆冷水。 他指出 LLM 有根本性的缺陷:沒有持久記憶、無法從單一經驗學習、缺乏對物理世界的理解。本質上,它只是在做「下一個 token 的預測」。 從學術的角度看,他說得完全正確。 直到今天,LLM 的底層架構依然沒有變。它依然是一具每次啟動都空空如也的統計引擎。 但在三年的工程演進後,我們發現了一個讓科學家尷尬的事實:學術上的根本缺陷,工程上不一定要正面解決,繞過去一樣能起飛。 楊立昆主張要走「世界模型」的路線,讓 AI 像人一樣建立對物理規律的理解。他認為 Scaling Law(規模定律)有天花板,LLM 光靠堆算力不能產生真正的智慧。 但工程界用兩件事回應了他: 第一,資本的暴力美學。過去三年,人類往算力砸錢的瘋狂程度,讓模型規模產生的「湧現」直接蓋過了架構的粗糙。 第二,系統性的外掛補丁。模型記不住?掛上向量資料庫。模型理解不夠?接上 Vision 和工具。 這就是工程學最迷人的地方:解決問題不需要追求「本質的優雅」。 楊立昆在研究神經元的排列,而工程師在研究如何把這個「不完美的大腦」裝進一個強大的「機械外骨骼」裡。 楊立昆對 LLM 的核心批評,是他認為 Pattern Matching(模式匹配)不算真正的學習。 但如果這種模式匹配的複雜度足以模擬出文明的所有邏輯,那「學習本身到底是什麼模式」還重要嗎? 飛機與鳥的飛行原理完全不同。飛機沒有羽毛、不會拍翅膀,但在它飛得更高、更遠、更穩定的那一刻,它到底「算不算在飛」已經不重要了。 但繞過去的,跟真的解決,是兩回事。 只要底層架構沒變,楊立昆講的那些缺陷就真實存在。記憶是外掛的,不是原生的。就像義肢,裝上去能走能跑,但它跟真正的腿就是不一樣。你不能假裝它不存在。 所以雖然 AI 已經很強了,推理、寫作、寫程式,很多事做得比大部分人好,但它每次都是一個全新的大腦。沒有連續的意識,沒有累積的經驗。它所有的「記憶」、「理解」、「偏好」,全部來自你這次塞給它的上下文。 如果你去看 OpenClaw 最近的 repo 更新,你會發現記憶管理佔了很大的篇幅。怎麼讓 AI 在對話之間記住該記住的東西。 他們最近推的 QMD,把關鍵字搜尋跟語意搜尋混在一起用,就是為了解決一個問題:你三天前跟 AI 聊過的東西,它下次怎麼找得回來。 模型本身的能力會繼續進步,但只要底層是 LLM,記憶管理就是一個繞不開的大山。 用工程的角度來說,就是 Context Engineering 的重要程度,會逐漸超過模型本身。 你怎麼管理每次丟給模型的那包上下文,決定了 AI 能幫你做到什麼程度。哪些資訊該放、哪些不該放。什麼時候該砍掉重來、什麼時候該接著繼續。不同對話之間的記憶怎麼同步、怎麼取捨。 我自己每天都在處理這個問題。 舉個例子,我的 OpenClaw Agent KAI,它常常在多個頻道處理不同任務,但它們的記憶不是即時同步的。只要 還沒更新,它們就不知道彼此剛做了什麼。 所以我常常要幫它做認知同步。譬如告訴 A 分身,B 分身目前正在做什麼,然後要求 B 把做的東西整理好傳過去。或者更簡單一點,直接叫 A 去讀另一個 Discord 頻道最近兩小時的對話,讓它自己同步 B 的工作內容。 這種「認知斷裂」的現象,只要你常用 AI,一定會有很強烈的感覺。 從人格化的角度看,你會覺得它們是同一個人。但事實上,它們只是共享同一份記憶。只要記憶沒有同步,它們就是不同的人。 我現在花比較多時間在學這一塊。譬如今天 KAI 就教了我,如果讓 Claude Code 的 Opus 4.6 從外部調用 GPT 5.3-Codex,用 MCP 跟 coding-agent skill 的差異是什麼。 KAI 告訴我,差異的核心在於:中間過程要不要進主 context。 用 MCP 調用 Codex,每一個 tool call 都走 MCP 協議。Codex 過程中的每一個 turn,讀檔、改檔、跑測試、報錯、retry,全部以 tool result 的形式灌回 Opus 的 context。一個 coding task 可能產生幾十個 turn,跑完之後 Opus 的 context window 已經被中間過程塞滿了,後面每一 turn 都要重送這些垃圾。這就是 context 污染。 而 coding-agent skill 的設計完全不同。它把整個 coding task 交給一個獨立的 sub-agent,這個 sub-agent 在自己的 context 裡完成所有中間過程。跑完之後,回傳給 Opus 的是一個精簡的 handoff summary:改了哪些檔案、測試跑過了沒、有沒有殘留問題。中間那幾十個 turn 的掙扎,Opus 完全不需要知道。 同樣一件事,兩種做法,Opus 的 context 乾淨程度天差地遠。 所以同一個模型,不同的人用,產出可以差十倍。 人與人之間原本的能力差距,已經沒那麼重要了。你的學歷、你的年資、你寫程式的底子,這些東西的權重正在被 AI 快速壓縮。 取而代之的,是你怎麼使用 AI。這件事的精度,才是現在真正決定產出的變數。 你理不理解它的記憶是怎麼運作的。你知不知道什麼時候該砍掉 context 重來、什麼時候該讓它接著跑。你能不能在對的時間,把對的資訊塞進那個 context window。 這些東西有一個名字,叫 Context Engineering。 它不是什麼高深的學問,但它是所有想把 AI 用好的人,都應該深入研究的東西。
显示更多
0
51
980
166
转发到社区
【路人街头采访系列💕】 距离第一次拍这个系列时隔半年了,那部作品已经超40万点赞啦~,这次抓路人问他“选礼物还是跟我约会一天”❓他居然选了礼物🎁😈 你会怎么选呢?
显示更多
0
0
437
100
转发到社区
街头采访【路人街头采访系列💕】距离第一次拍这个系列时隔半年了,那部作品已经超40万点赞啦~,这次抓路人问他“选礼物还是跟我约会一天”❓他居然选了礼物🎁😈你会怎么选呢?
显示更多
0
9
328
74
转发到社区
Lighter终于结束了,第一次全身心的陪伴了一个项目半年,感慨万千,所以想写下一篇文章来纪念: 先说战果,积分几千分,成本我控制在一分2u左右,虽然比不上很多老哥们,但是基于我没有工作室,所以结果我还是比较满意的 但是比起结果,我更想跟大家分享的是我从4月份正式分享lighter以来的故事 ———— 其实我一开始知道这lighter是因为我参加了丰密老师 @KuiGas 的kui3 当时丰密老师在3月中的月会上照例分享了一系列的项目,里面我记得有lighter、sentiment、succicent这些 我当时选上lighter纯粹是因为他是最冷门的那个,再加上当时丰密老师激励推荐我们写推当KOL,所以就准备边上号边写文章了 所以最开始要感谢蜂蜜老师,没有蜂蜜老师我就不会选到lighter这个项目 ———— 但是当我开始干的时候发现碰到不少问题,在推特方面是我写的东西没人看(事后回头看我自己写的也烂),现在不少人刷的extended、ostium、varational、paradex这些我在四五月份为了调研perpdex赛道时候就开始尝试了并且写了推文 因为我写的调研压根没人看,其实当时都准备放弃做推了,不过当时碰到了 @xfrom2010 老哥,老哥应该算是早期唯一会看我做perpdex投研的人,当时还给我转了100刀的咖啡钱让我得到了正反馈,然后就坚持了下去 在项目方面我也碰到不少问题,主要是我对perpdex项目的不熟悉,我入圈玩过perp输了很多钱之后转撸毛了,中间没有学过一点关于perpdex的知识,所以只能学中干,干中学 再加上当时lighter早期的各个方面做的确实一般:充值提现卡顿、清仓价格经常标错、时不时的平台升级,再加上得分效率不高 当时搞得我很是疲惫,我甚至怀疑我走perpdex方向是不是错的,直到看到大赌哥 @y95277777 和里奇哥 @cryptolfggo 当时写的关于lighter的调研并都认为这是一个非常不错的项目,我又重新收拾信心准备继续干 后续我就多开了几个号,尝试了各个指标和方法,发现当时 @0xTria 老哥推上提到爆仓拿分相对来说是比较快的,但是缺点也是要赔出去清仓费,当时就咬咬牙准备当作ico做了 我也渐渐的对爆仓法有了心得,所以也开始在推特上分享自己的详细步骤,也是在这个时候我的follower增加了,看我的人也变多了 后面遇见了茶老师 @mdzzi 和塞哥 @EvanCrypto17 ,茶老师当时应该是把我拉进了他当时创建的一个perpdex群,但是后面因为微信群被封了就没有再做了 又过了一段时间茶老师建议我自己拉个群,当时为了讨一个好彩头就叫lighter research(因为茶老师之前搞得叫hyperliquid research,想的是lighter能继承hyper的大毛) 后面就因为群友的人脉不断拉人,我也是和很多推特上牛逼的老师们当上了群友,虽然现在又被封了😭 塞哥当时也把我拉进他的一个群里和大家交流,群里主要是他玩的好的朋友们和follower 在里面说话多了之后我也和塞哥的几个朋友现在也保持了很好的关系,大家也会经常线下约饭和商量策略 当时还因为塞哥的介绍遇见了南姐 @ec_unoxx ,请教了不少关于如何做账号的问题 南姐人真的是太好了!!我当时粉丝只有几百个,但是南姐依然很慷慨的给了不少建议,后来想给姐发个红包也没收 ———— 到了8月份的时候,roger哥 @HassnHh30961 在群里说团队可能要来香港,说群友们可以一起吃饭,当时我已经是lighter的OG,大家就让我带着几个问题去和团队线下见面并提问一些问题 到了深圳先是跟Roger哥面基上了,对了,roger哥不仅是lighter的contributor,而且基本上大陆所有的线下会议都是roger哥协调和举办的,老哥真的很牛逼 roger当时带我一起去了香港,一起见了03哥 @0Xlynn03 ,见识到了什么叫做web2大佬和人型量化 虽然我知道已经说了很多遍了,但是我还是想说我看见03哥吃饭都在开单的时候终于知道了什么叫做比你牛的还比你努力😂 在香港时候也碰到了maggie姐 @0xmaggie5 和brodie哥 @0xbrodiezZ ,向他们了解到了机构的大概运行规则和一些交易所的组成架构,打开了我的世界观 搞微信群的同时和另外两个og @timemoonc 老哥和as老哥 @The3222646 加上了微信。 timemoon老哥真的和老大哥一样会把自己的好思路耐心的讲解给我听,也会经常会跟我分享一些他对行业和赛道的看法,我总是收益良多 可惜的是没参加深圳的聚会,年后应该还会拜访一下老哥,好好的学习一下大局观 as老哥在深圳线下聚会时见过了,老哥是非常有意思的一个人 跟他聊天能感觉到很开心,问老哥密码的时候也能不藏私的把自己的观点和角度说出来,是一个很大方的老哥 还有益达哥 @lyghanjian001 ,益达哥有时候看见我走弯路的时候真的会很诚恳的给我建议和方向,不想让我瞎走歪路 当我一时半会没想明白思路的时候也愿意花时间私信让我明白其中的脉络去向 后续在长沙行的时候,也感谢路飞老哥 @DLF2216 邀请我第一次见识了线下工作室,路飞哥的工作室真的是顶级工作室,第一次给我的价值观造成了冲击,真的是太牛了 真的想感谢的人太多了,难免会有漏掉的,但是篇幅有限,就只写到这 ———— 回看过去,感慨万千,当初只感觉眼下都是迷雾屏障,走的跌跌撞撞 抵达终点之后发现每次坚持不下去的时候都会有一个贵人伸手扶我一把 一路走过来全是老师,感谢大家!! 话说回来,真的有太多的第一次献给了 @Lighter_xyz 第一次因为一个项目当博主 第一次粉丝过千,第一次被0xsun、大赌哥、风无向等这些大佬关注 第一次在cookie单项目的榜单上排名第二名…… ———— 最后,2025年所剩无几,真心地感谢每一位老师的帮助和扶持,没有你们的帮助我拿不到这些结果 在祝愿大家赚麻的同时更希望大家身体健康,身体才是真正的财富 今年真的是不容易的一年,币圈行情并没跑过场外的美股、黄金,也没有大规模的流动性进入场内 但是希望2026年会有更多的好事,也希望大家能平平安安,健健康康,也真心祝愿各位和身边的人能够平安无事!
显示更多
0
146
330
14
转发到社区
仔细盘了一下我从19年到现在在web3错过了好几次a8的机会(rmb非usdt) 第一次是defi summer的时候20年末21年初在链上搬砖 那时候写脚本做eth链dex小币种套利 一天有6000刀的利润 套了一个月大概赚了10wu左右 但是如果有做其它链比如bsc和heco okt 那种的话 周围好几个朋友都做小币种搬砖到a8了 结果我孤守eth后面卷不过别人 持续几个月就赚了12wu 我估计是那轮defisummer最失败的套利者 第二次是21年末发nft的时候,很多朋友卖nft一个卖0.05eth,卖10000个,一般一次能收500eth左右,那时候eth一个3000u左右 我当时发了很多,最后太傻逼想去做市,都没怎么赚 到了21年底gamefi真的疯狂,只要套上gamefi的壳子,一上线就被秒 赚了一点钱 最后开合约亏没了 到了22年初,发freemint nft,一周两套,一套能收个1eth左右到手续费,赚了有40wu,最后都买xpet亏没了 到了23年铭文的时候,byd 在20u的时候一直按头叫我买ethi,我觉得叙事一般,就一直没买,最后一张涨到了5000u(没错就是那个解构师 @0xBeyondLee )自己也做了rune原生的cdp项目,后面找vc,才发现vc的人真的一点认知都没有,一点加密都不懂,纯纯傻比一堆,后面就挺反感vc的 23年也感谢@WTFAcademy_@0xAA_Science 举办了北京黑客松,认识了许许多多的朋友,也拿了很多奖,那时候就有了做空meme的想法和demo,并且做出来了这个项目,也算是 @ZeroBankDapp 的雏形 后面认识的好朋友可以一起来骂傻逼vc,后面发现那些骂vc傻逼的人都过得很好,也拿到了一些成绩,当然那些更牛逼的就是一边骂vc傻逼一边忽悠vc拿到钱的,他们更牛逼 到了24年meme szn 我就不怎么玩了,因为当时觉得meme叙事不性感,我也没兴趣 到了25年初想从新玩meme就买了5wu的tst买了千2,后面赚了1m左右 后面3m买了千5的giggle,胆子太小了,赚了20wu就跑完了,只记得那时候奶子哥,一直在买,我一直在出,结果大腿拍肿了,到了25年底大四辍学了 6年币圈路,满身荒唐泪 遥想刚刚来web3的时候的想法,就是每个月赚1000块,为了不跟家里要钱 恍如隔世
显示更多
0
48
69
1
转发到社区
#GM# 币枭榜榜一大哥笪鸿飞 @dahongfei 发币集团 ➡️上海总部  关联人:笪鸿飞 — 王佳超 — 刘仁栋 / 谈元 关联项目 @FlamingoFinance  $FLM  BN 下架     @PolyNetwork2             被盗跑路 @OMOSwapX $O3    归零 @SpoonOS_ai  表面上 Polynetwork 是被黑客攻击资产被盗后直接跑路,实则是笪鸿飞/王家超/谈元 这哥三自导自演的一出崩盘大戏; 同时带崩的还有 $FLM 及 $O3 等关联Defi 项目。 而笪鸿飞/王佳超 /刘仁栋 的 $FLM ,从20年9月上线BN后的最高位 $1.59 ,常年下跌至现价 $0.006 , 跌了260倍。 至于 $O3 ,已经归零。  王家超John  @wjcbaggio ,关于你在上海的全款房子,你最好能编出来合理的款项来源。 ➡️宁波分部 关联人: 笪鸿飞 —  陈永强 — 王佳超  关联项目 @EXT_Foundation   $EXT     归零币  @FlamingoFinance  $FLM   BN下架 @OMOSwapX         $O3   跌11800倍 陈永强 @EEEEdison1992 艾迪生 ,是笪鸿飞发币集团宁波分部的头号马仔。 2018年,陈永强第一次在NEO上发币—历链Exchain $EXT ,募了23000个  $ETH 左右。历链Exchain $EXT 难逃归零的命运。 陈永强不愧是宁波创业之星/宁波城市之光啊, 第二次发币的  $O3 从上线之后的最高位 $15 到现价,直接跌了 11800倍。 $O3 的前身为 O3 Wallet,上轮2021年陈永强携手笪鸿飞/王佳超 主导O3Swap 收割完成之后,于2022年下半年跟着笪鸿飞一起跑路到了新加坡。 至于 O3 其他人,都只是面上站台的而已。  这两年,陈永强以 Hashlook 创始人的名义对外 ,本轮其最新所发项目是 @Tako Protocol。 陈永强 ,怀念跟朱雅妮在16号楼202的时光么?
显示更多
0
16
41
5
转发到社区
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
61
1K
303
转发到社区
美国人破防:中国简直逆 天,竟想用电磁力,从月球 将氦-3运回地球 自嫦娥七号抵达海南文昌发 射场不过短短三周,美国 《太空新闻》《大众机械》 等一众主流媒体便纷纷沸腾 起来。 它们以“超乎想象的科幻照进 现实”、“重塑太空规则”等震 撼性词汇,对中国航天的一 项前沿构想展开了铺天盖地 的报道。 这一令美国媒体集体哗然的 计划,简而言之,便是中国 计划在月球上构建一台“电磁 弹射装置”,无需消耗一滴火 箭燃料,即可将月球上的宝 贵资源——氦-3,精准弹射回 地球。 此消息一出,全球网友皆为 之惊叹,有人戏称这是“现实 版的人间巨炮”,也有人感慨 “他人尚在探索登月之路,中 国已开启月球物流新篇章”。 细思之下,这并非遥不可及 的幻想,而是中国深空探测 实验室正在严谨论证的技术 蓝图,其背后,隐藏着关乎 人类未来能源格局的深远布 局。 首先,让我们揭开氦-3的神 秘面纱。 它被誉为“宇宙中的黄金”,实 至名归,因其是目前人类已 知的最理想核聚变燃料,无 出其右。 我们常提及的可控核聚变, 主流方案多采用氘与氚,虽 能量巨大,却伴随着高能中 子的产生,这些中子不仅会 侵蚀反应堆结构,还会留下 难以处理的长寿命放射性废 料。 而氦-3则截然不同,当它与 氘发生聚变时,仅产生质子 与氦-4,几乎无中子辐射, 亦无长寿命放射性废料之 忧。 这意味着什么?意味着氦-3 核电站可安全建于城市中 心,无需担忧核泄漏风险, 亦无需构建厚重的防辐射屏 障。 更令人惊叹的是其能量密 度,据国际原子能机构2022 年发布的核聚变能源数据库 显示,一公斤氦-3完全聚变 所释放的能量,相当于燃烧 11900吨优质煤炭,或1400 吨汽油。 简而言之,100吨氦-3即可满 足全人类一年的电力需求, 25吨则能让中国全年摆脱火 电依赖。 若月球上的氦-3得以全面开 采,足以支撑全人类600至 2600年的能源需求,能源危 机、碳排放、石油战争等议 题,或将永远成为历史。 然而,现实是残酷的,地球 上的氦-3资源极为稀缺,全 球可经济开采的储量尚不足 半吨。 这点量,连实验室研究都显 得捉襟见肘,更遑论用于发 电。 当前,一克氦-3的价格远超 黄金数十倍。 为何地球上如此匮乏氦-3? 原因在于地球拥有厚实的大 气层与强大的磁场,几乎将 太阳风中的氦-3粒子全部阻 挡在外。 反观月球,它既无大气层, 也无磁场,数十亿年来,如 同一个巨大的吸尘器,默默 收集着太阳风中的氦-3。 这些氦-3原子深深嵌入月壤 颗粒表面,形成了一层薄薄 的“能源外衣”。 据嫦娥五号带回的月壤样本 分析,仅月球南极地区的 氦-3储量就超过100万吨,整 个月球的浅层总储量在100万 至500万吨之间。 这无疑是上帝赐予人类的最 后一份能源厚礼,谁先掌握 月球氦-3的开采与运输技 术,谁便掌握了未来世界的 能源命脉。 然而,将月球上的氦-3运回 地球,绝非易事,运输成本 是最大的障碍。 传统方式依赖火箭发射登月 舱,采集月壤后再用火箭发 动机返回地球。 但此方式成本高昂,据估 算,将一公斤物品从地球送 至月球需约10万美元,而将 一公斤月壤从月球运回地 球,成本更是高达数十万美 元。 若以此方式运输氦-3,别说 盈利,连成本的零头都难以 收回。 且火箭运输效率低下,一次 仅能带回几公斤物品,实现 商业化开采,无异于天方夜 谭。 这也是为何多年来,尽管月 球资源广为人知,却无人真 正动手开采的原因。 正当全球科学家束手无策之 际,中国工程师突破传统思 维框架,提出了一个颠覆性 的解决方案:摒弃火箭,改 用电磁力。 这一方案正式命名为“月基磁 悬浮旋转抛射系统”,其原理 与奥运会上的掷链球比赛颇 为相似。 想象一下,在月球表面构建 一个巨大的旋转装置,配备 一根数十米长的旋臂。 将装满氦-3的返回器固定于 旋臂末端,利用高温超导电 机驱动旋臂高速旋转。 随着转速不断提升,返回器 的速度亦随之加快,当达到 每秒2.4公里,即月球的逃逸 速度时,精准释放返回器。 此时,返回器便如同被甩出 的链球,沿预设轨道飞向地 球。 整个过程无需任何化学燃 料,完全依靠电力驱动,且 月球几乎无空气阻力,能量 损耗极小。 更令人称奇的是,每次抛射 完成后,旋转装置的制动系 统还能回收70%以上的动 能,转化为电能循环利用。 这简直是一台近乎永动机的 存在,能源利用率高得惊 人。 或许有人会问,如此庞大的 装置,如何运至月球?中国 科学家早已未雨绸缪。 整套系统总重约80吨,可拆 分为多个模块,利用正在研 制的长征九号超重型火箭分 两次运至月球表面。 长征九号的三级半不回收构 型地月转移轨道运载能力达 50吨,运送这些模块绰绰有 余。 运至月球后,再由月球机器 人进行组装,整个过程无需 宇航员亲自操作,大大降低 了风险与成本。 据测算,该系统建成后,每 日可执行两次发射任务,每 次运送数百公斤有效载荷, 每年稳定运输3至5吨氦-3。 按当前市场价格,一吨氦-3 价值30亿美元,3吨即达90 亿美元,折合人民币约650亿 元。 而整套系统的建设成本约 1300亿元人民币,意味着两 年多即可收回全部成本,之 后便是纯盈利。 且该系统设计使用寿命至少 20年,这无疑是一笔稳赚不 赔的生意。 当然,除了运输氦-3外,该 系统还有诸多其他用途。 如可用于运输月球上的水 冰、金属矿产等其他资源, 甚至可用于发射卫星与探测 器。 未来,从月球发射卫星,无 需火箭,直接利用电磁弹弓 即可,成本可降低90%以 上。 这将彻底改写太空运输规 则,使地月之间的物资运输 变得如同今日快递般便捷高 效。 届时,月球基地将不再是一 个孤立的前哨站,而是真正 意义上的太空工业基地。 我们可在月球上就地取材, 生产太阳能电池板、航天器 零部件,甚至建造大型太空 电站,再利用电磁弹弓将这 些产品运回地球或送往其他 星球。 这将开启人类太空工业化的 新时代,其意义不亚于当年 的工业革命。 或许有人认为,这一切尚显 遥远,只是美好的幻想。 但实际上,中国在相关技术 领域已积累了深厚基础,诸 多关键技术均已取得突破性 进展。 首先是电磁弹射技术,我们 的福建舰航母已装备世界上 最先进的电磁弹射系统,表 明我们在大功率电磁加速、 能量储存与控制等方面已达 到世界领先水平。 月基磁悬浮抛射系统实为电 磁弹射技术的延伸与应用, 原理相通。 其次是高温超导技术,中国 的高温超导材料研究一直走 在世界前列,已实现商业化 应用。 高温超导电机与磁悬浮轴承 是该系统的核心部件,无它 们则无法实现如此高的转速 与能量利用率。 再者是月球探测技术,我们 已成功完成嫦娥一号至嫦娥 六号任务,实现了月球正 面、背面与南极的软着陆与 采样返回。 我们对月球的地形地貌、地 质结构、资源分布已有了深 入了解,为未来建设月球基 地与开采氦-3奠定了坚实基 础。 据中国航天公布的规划,我 们将在2030年前实现载人登 月,2035年前后建成国际月 球科研站。 而月基磁悬浮抛射系统的关 键部件研制工作将于2030年 左右完成,2035年前后随月 球科研站一同部署至月球。 预计到2045年,我们便能实 现月球氦-3的商业化开采与 运输,为地球提供源源不断 的清洁能源。 这一时间表看似激进,但考 虑到中国航天过去几十年的 发展速度,实则并不夸张。 回想20年前,我们尚只能发 射几吨重的卫星,如今已拥 有自己的空间站,还能从月 球背面采样返回。 再过20年,实现从月球用电 磁力运氦-3回地球,又有何 不可能? 当然,面对中国在 太空领域的迅猛发展,美国 自然坐立不安。 其实,美国早在几十年前便 提出过类似的月球资源开发 计划,但一直停留在纸面 上,未见实质性进展。 如今见中国已将此计划提上 日程,美国媒体才惊呼中国 “抢跑”。 美国的一些私营公司也开始 跟风,如蓝色起源与月球前 哨站公司便宣布要在2030年 代初期实现月球氦-3的初步 开采。 但他们的方案仍采用传统火 箭运输方式,成本根本无法 与中国电磁抛射系统相提并 论。 且美国如今连重返月球都一 拖再拖,阿尔忒弥斯计划已 多次推迟,能否在2030年前 实现载人登月尚存疑问。 更遑论建设月球基地与开采 氦-3了,那更是遥遥无期。 除美国外,俄罗斯、欧洲、 日本等国家和地区也均有自 己的月球探测计划。 但他们要么技术实力不足, 要么资金匮乏,根本无法与 中国相提并论。 可以说,在未来的月球资源 开发竞赛中,中国已占据明 显领先优势。 这并非偶然,而是中国几十 年如一日坚持自主创新、厚 积薄发的结果。 我们一步一个脚印,从跟跑 到并跑,再到如今的领跑, 靠的是无数航天人的辛勤付 出与无私奉献。 或许有人会问,我们当前尚 有许多问题未解,为何要投 入巨资进行太空探索?其 实,这个问题答案显而易 见,因为太空探索代表着人 类的未来。 地球资源有限,终有耗尽之 日,人类若想继续生存与发 展,必须走向太空。 月球是人类走向深空的第一 站,也是最重要的一站。 掌握月球资源开发利用技 术,人类便拥有了无限的能 源与物质资源,可摆脱地球 束缚,真正成为一个星际文 明。 且太空探索带来的技术溢出 效应巨大,我们如今使用的 诸多物品,如GPS、尿不 湿、不粘锅、核磁共振等, 均为航天技术的副产品。 可以说,今日在航天领域投 入的每一分钱,未来都将以 百倍千倍的形式回报给我 们。 当然,我们也要清醒地认识 到,月球氦-3的开发利用尚 有许多技术难题待解。 如月尘对设备的磨损问题、 月球极端温度环境对材料的 影响问题、返回器的精准控 制与回收问题等。 这些问题非一朝一夕可解, 需科学家们长期努力。 但只要我们保持当前发展势 头,一步一个脚印地前行, 这些问题终将被我们一一攻 克。 相信不久的将来,我们便能 目睹第一艘满载氦-3的返回 器从月球启程,飞向地球。 届时,人类将正式迈入清洁 能源时代,一个无能源危 机、无环境污染、无战争的 美好未来正向我们招手。 最后,我想说,中国航天从 未以称霸太空为目标,而是 致力于和平利用太空资源, 造福全人类。 我们一直主张在平等互利、 和平利用、包容发展的基础 上,加强国际航天合作。 中国的国际月球科研站已向 全世界开放,欢迎所有国家 和地区参与进来,共同探索 月球的奥秘。 相信在全人类的共同努力 下,我们定能实现从月球开 采氦-3的梦想,为人类的可 持续发展开辟一条全新道 路。 让我们共同期待那一天的到 来,见证中国航天创造更多 奇迹,见证人类文明迈向更 加辉煌的未来。 信源: 《央视新闻》——《中国探月 工程 “时间表” 公布 2030 年 前将实现载人登月》 《中国新闻网》——《中国科 学家首次成功获得嫦娥五号 月壤中氦 - 3 含量及提取温 度》 《国家航天局》——《国际月 球科研站,这样建!—— 访 中国探月工程总设计师吴伟 仁》 《中国科学院宁波材料技术 与工程研究所》——《月壤玻 璃:捕获和保存氦 - 3 气体的 关键物质》
显示更多
🦞 如何 免費使用 AI ? Qwen3.6 27B 模型直接在 MacBook Pro 上用 llama.cpp + Pi coding agent 完全本地運行,飛航模式、零網路!😱😱 這樣本地跑(llama.cpp + Pi coding agent),你就完全不用花錢 subscribe 任何雲端 AI了! • 不用 Claude Pro、ChatGPT Plus、Grok Premium 之類的月費 • Qwen3.6 27B GGUF 模型從 Hugging Face 一次下載就永久免費使用 • Pi coding agent 本身也是完全開源 MIT 免費(npm 安裝就行) • 之後不管跑多少次、做多少 coding 任務,都零 API 費用 唯一的小成本只有: ✅ MacBook 要夠力(推薦 32GB+ 記憶體,M 系列 Metal 加速最順) ✅ 第一次下載模型花一點時間跟硬碟空間 ✅ 跑的時候電費會多一點點 但之後就是真正零月費、無限使用的本地 AI coding 神器! 隱私還 100% 保障,飛航模式也能跑,超爽👍 處理 Hugging Face 真實程式碼庫的複雜任務,表現幾乎追平 Claude Opus! 這就是 AI「第二革命」——強大本地模型正式實用化! 隱私、安全、資料主權一次到位,早鳥直接起飛 💨 👉🏻👉🏻 想自己馬上開始裝嗎?超簡單上手(Mac 適用): 1. 安裝並啟動 llama.cpp server(下載 Qwen3.6 27B GGUF 模型,推薦 Q4_K_M 量化,Mac 用 Metal 加速) 2. npm install -g @mariozechner/pi-coding-agent 3. 編輯 ~/.pi/agent/models.json 指向本地 llama.cpp(baseUrl: http://localhost:8080/v1) 4. 在你的專案資料夾直接執行 pi 指令就起飛! 詳細文件: (或 Pi GitHub: 開源本地 AI,真的要改變遊戲規則了!誰來一起玩?🔥 推薦用 etherfi卡 買MacBook 能省3~4%
显示更多
This is where we are right now. And i’m not gonna lie it feels pretty magical 🧚‍♀️ Qwen3.6 27B running inside of Pi coding agent via Llama.cpp on the MacBook Pro For non-trivial tasks on the @huggingface codebases, this feels very, very close to hitting the latest Opus in Claude Code, or whatever shiny monopolistic closed source API of the day is. In full airplane mode. Most people haven’t realized this yet. If you have, it means you have a huge headstart to what I call the second revolution of AI. Powerful local models for efficiency, security, privacy, sovereignty 🔥
显示更多