注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 第一次也是最後一次的台灣攝影會
第一次也是最後一次的台灣攝影會 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 第一次也是最後一次的台灣攝影會 的推特
謝謝古乃小姐!感謝妳將第一次也是最後一次的台灣攝影會交給我們!引退後要幸福喔;也謝謝每一個來參加以及支持活動的您,沒有你們,這次的活動不會那麼成功,我們下次再見! #古乃ほの# #古乃穗乃# #furunohono# #第一次也是最後一次的台灣攝影會# #ForAver女優商演經紀# Model @furuno_hono
显示更多
0
7
284
13
转发到社区
🦞 如何 免費使用 AI ? Qwen3.6 27B 模型直接在 MacBook Pro 上用 llama.cpp + Pi coding agent 完全本地運行,飛航模式、零網路!😱😱 這樣本地跑(llama.cpp + Pi coding agent),你就完全不用花錢 subscribe 任何雲端 AI了! • 不用 Claude Pro、ChatGPT Plus、Grok Premium 之類的月費 • Qwen3.6 27B GGUF 模型從 Hugging Face 一次下載就永久免費使用 • Pi coding agent 本身也是完全開源 MIT 免費(npm 安裝就行) • 之後不管跑多少次、做多少 coding 任務,都零 API 費用 唯一的小成本只有: ✅ MacBook 要夠力(推薦 32GB+ 記憶體,M 系列 Metal 加速最順) ✅ 第一次下載模型花一點時間跟硬碟空間 ✅ 跑的時候電費會多一點點 但之後就是真正零月費、無限使用的本地 AI coding 神器! 隱私還 100% 保障,飛航模式也能跑,超爽👍 處理 Hugging Face 真實程式碼庫的複雜任務,表現幾乎追平 Claude Opus! 這就是 AI「第二革命」——強大本地模型正式實用化! 隱私、安全、資料主權一次到位,早鳥直接起飛 💨 👉🏻👉🏻 想自己馬上開始裝嗎?超簡單上手(Mac 適用): 1. 安裝並啟動 llama.cpp server(下載 Qwen3.6 27B GGUF 模型,推薦 Q4_K_M 量化,Mac 用 Metal 加速) 2. npm install -g @mariozechner/pi-coding-agent 3. 編輯 ~/.pi/agent/models.json 指向本地 llama.cpp(baseUrl: http://localhost:8080/v1) 4. 在你的專案資料夾直接執行 pi 指令就起飛! 詳細文件: (或 Pi GitHub: 開源本地 AI,真的要改變遊戲規則了!誰來一起玩?🔥 推薦用 etherfi卡 買MacBook 能省3~4%
显示更多
This is where we are right now. And i’m not gonna lie it feels pretty magical 🧚‍♀️ Qwen3.6 27B running inside of Pi coding agent via Llama.cpp on the MacBook Pro For non-trivial tasks on the @huggingface codebases, this feels very, very close to hitting the latest Opus in Claude Code, or whatever shiny monopolistic closed source API of the day is. In full airplane mode. Most people haven’t realized this yet. If you have, it means you have a huge headstart to what I call the second revolution of AI. Powerful local models for efficiency, security, privacy, sovereignty 🔥
显示更多
今日14:00〜粉絲見面會𐔌ᵔ ܸ>⩊<︎︎ ͡ 𐦯✨ 兆基文教大樓:台北市松山區南京東四段120巷11號8F 這將是我今年第一次也是最後一次訪問台灣,所以我很期待🤝🍚🍰☕️
显示更多
||◤ 彩美旬果 粉絲見面會決定 ◢|| 2025年9月舉行出道13周年🇹🇼  出席9月20日至21日的活動✈️ ✎︎______________ #あやみ旬果# #彩美旬果#
显示更多
0
0
642
22
转发到社区
(續上篇) . 也因為當初自己參加活動都是害羞緊張的,所以到我們「師父」開始舉辦活動的時候票房並沒有很好,直到他決定不玩、日本人主動找上門來,活動的規模才變大了點: . 只是這個市場仍然非常非常小,我們辦活動只為了自肥,對影迷的喜好沒有很深的了解,也缺乏拓展市場的能力,再加上阮囊羞澀口袋沒錢,活動一賠錢就元氣大傷想打退堂鼓,這樣的狀況直到成人展的出現才有了變化: . 不管是率先舉辦活動的TAE、又或者把成人展做到規模最大的TRE,他們對這個市場都有著超級大的貢獻:前者讓我們知道原來女優活動有著這麼大的市場潛力,後者則是把市場擴大成原先好幾倍的規模:因為有一點是很有趣的,一般小型活動有蠻多粉絲會被另一半禁止參加,因為擔心活動不太健康(當然是沒有這回事),但到了大型成人展是有蠻多情侶參加的:一來大型的展館不用擔心會出現失控的場面,二來人多有幾個女性朋友就不顯得突兀,最後也是最重要的是去了幾次大家也就知道根本沒什麼好怕的,女優又不會吃人,好好享受她們的服務就行~ . 而沾成人展的光,我們的活動也辦得密集起來惹! . (待續) . ★照片是我們第一次辦活動,與當時叫藤浦めぐ(藤浦惠)的來賓合照,現在她是變態姐姐めぐり(惠理)惹★
显示更多
0
6
450
4
转发到社区
2023 年,Meta 首席 AI 科學家楊立昆給當時的 LLM 熱潮潑了一盆冷水。 他指出 LLM 有根本性的缺陷:沒有持久記憶、無法從單一經驗學習、缺乏對物理世界的理解。本質上,它只是在做「下一個 token 的預測」。 從學術的角度看,他說得完全正確。 直到今天,LLM 的底層架構依然沒有變。它依然是一具每次啟動都空空如也的統計引擎。 但在三年的工程演進後,我們發現了一個讓科學家尷尬的事實:學術上的根本缺陷,工程上不一定要正面解決,繞過去一樣能起飛。 楊立昆主張要走「世界模型」的路線,讓 AI 像人一樣建立對物理規律的理解。他認為 Scaling Law(規模定律)有天花板,LLM 光靠堆算力不能產生真正的智慧。 但工程界用兩件事回應了他: 第一,資本的暴力美學。過去三年,人類往算力砸錢的瘋狂程度,讓模型規模產生的「湧現」直接蓋過了架構的粗糙。 第二,系統性的外掛補丁。模型記不住?掛上向量資料庫。模型理解不夠?接上 Vision 和工具。 這就是工程學最迷人的地方:解決問題不需要追求「本質的優雅」。 楊立昆在研究神經元的排列,而工程師在研究如何把這個「不完美的大腦」裝進一個強大的「機械外骨骼」裡。 楊立昆對 LLM 的核心批評,是他認為 Pattern Matching(模式匹配)不算真正的學習。 但如果這種模式匹配的複雜度足以模擬出文明的所有邏輯,那「學習本身到底是什麼模式」還重要嗎? 飛機與鳥的飛行原理完全不同。飛機沒有羽毛、不會拍翅膀,但在它飛得更高、更遠、更穩定的那一刻,它到底「算不算在飛」已經不重要了。 但繞過去的,跟真的解決,是兩回事。 只要底層架構沒變,楊立昆講的那些缺陷就真實存在。記憶是外掛的,不是原生的。就像義肢,裝上去能走能跑,但它跟真正的腿就是不一樣。你不能假裝它不存在。 所以雖然 AI 已經很強了,推理、寫作、寫程式,很多事做得比大部分人好,但它每次都是一個全新的大腦。沒有連續的意識,沒有累積的經驗。它所有的「記憶」、「理解」、「偏好」,全部來自你這次塞給它的上下文。 如果你去看 OpenClaw 最近的 repo 更新,你會發現記憶管理佔了很大的篇幅。怎麼讓 AI 在對話之間記住該記住的東西。 他們最近推的 QMD,把關鍵字搜尋跟語意搜尋混在一起用,就是為了解決一個問題:你三天前跟 AI 聊過的東西,它下次怎麼找得回來。 模型本身的能力會繼續進步,但只要底層是 LLM,記憶管理就是一個繞不開的大山。 用工程的角度來說,就是 Context Engineering 的重要程度,會逐漸超過模型本身。 你怎麼管理每次丟給模型的那包上下文,決定了 AI 能幫你做到什麼程度。哪些資訊該放、哪些不該放。什麼時候該砍掉重來、什麼時候該接著繼續。不同對話之間的記憶怎麼同步、怎麼取捨。 我自己每天都在處理這個問題。 舉個例子,我的 OpenClaw Agent KAI,它常常在多個頻道處理不同任務,但它們的記憶不是即時同步的。只要 還沒更新,它們就不知道彼此剛做了什麼。 所以我常常要幫它做認知同步。譬如告訴 A 分身,B 分身目前正在做什麼,然後要求 B 把做的東西整理好傳過去。或者更簡單一點,直接叫 A 去讀另一個 Discord 頻道最近兩小時的對話,讓它自己同步 B 的工作內容。 這種「認知斷裂」的現象,只要你常用 AI,一定會有很強烈的感覺。 從人格化的角度看,你會覺得它們是同一個人。但事實上,它們只是共享同一份記憶。只要記憶沒有同步,它們就是不同的人。 我現在花比較多時間在學這一塊。譬如今天 KAI 就教了我,如果讓 Claude Code 的 Opus 4.6 從外部調用 GPT 5.3-Codex,用 MCP 跟 coding-agent skill 的差異是什麼。 KAI 告訴我,差異的核心在於:中間過程要不要進主 context。 用 MCP 調用 Codex,每一個 tool call 都走 MCP 協議。Codex 過程中的每一個 turn,讀檔、改檔、跑測試、報錯、retry,全部以 tool result 的形式灌回 Opus 的 context。一個 coding task 可能產生幾十個 turn,跑完之後 Opus 的 context window 已經被中間過程塞滿了,後面每一 turn 都要重送這些垃圾。這就是 context 污染。 而 coding-agent skill 的設計完全不同。它把整個 coding task 交給一個獨立的 sub-agent,這個 sub-agent 在自己的 context 裡完成所有中間過程。跑完之後,回傳給 Opus 的是一個精簡的 handoff summary:改了哪些檔案、測試跑過了沒、有沒有殘留問題。中間那幾十個 turn 的掙扎,Opus 完全不需要知道。 同樣一件事,兩種做法,Opus 的 context 乾淨程度天差地遠。 所以同一個模型,不同的人用,產出可以差十倍。 人與人之間原本的能力差距,已經沒那麼重要了。你的學歷、你的年資、你寫程式的底子,這些東西的權重正在被 AI 快速壓縮。 取而代之的,是你怎麼使用 AI。這件事的精度,才是現在真正決定產出的變數。 你理不理解它的記憶是怎麼運作的。你知不知道什麼時候該砍掉 context 重來、什麼時候該讓它接著跑。你能不能在對的時間,把對的資訊塞進那個 context window。 這些東西有一個名字,叫 Context Engineering。 它不是什麼高深的學問,但它是所有想把 AI 用好的人,都應該深入研究的東西。
显示更多
0
51
980
166
转发到社区
Lighter终于结束了,第一次全身心的陪伴了一个项目半年,感慨万千,所以想写下一篇文章来纪念: 先说战果,积分几千分,成本我控制在一分2u左右,虽然比不上很多老哥们,但是基于我没有工作室,所以结果我还是比较满意的 但是比起结果,我更想跟大家分享的是我从4月份正式分享lighter以来的故事 ———— 其实我一开始知道这lighter是因为我参加了丰密老师 @KuiGas 的kui3 当时丰密老师在3月中的月会上照例分享了一系列的项目,里面我记得有lighter、sentiment、succicent这些 我当时选上lighter纯粹是因为他是最冷门的那个,再加上当时丰密老师激励推荐我们写推当KOL,所以就准备边上号边写文章了 所以最开始要感谢蜂蜜老师,没有蜂蜜老师我就不会选到lighter这个项目 ———— 但是当我开始干的时候发现碰到不少问题,在推特方面是我写的东西没人看(事后回头看我自己写的也烂),现在不少人刷的extended、ostium、varational、paradex这些我在四五月份为了调研perpdex赛道时候就开始尝试了并且写了推文 因为我写的调研压根没人看,其实当时都准备放弃做推了,不过当时碰到了 @xfrom2010 老哥,老哥应该算是早期唯一会看我做perpdex投研的人,当时还给我转了100刀的咖啡钱让我得到了正反馈,然后就坚持了下去 在项目方面我也碰到不少问题,主要是我对perpdex项目的不熟悉,我入圈玩过perp输了很多钱之后转撸毛了,中间没有学过一点关于perpdex的知识,所以只能学中干,干中学 再加上当时lighter早期的各个方面做的确实一般:充值提现卡顿、清仓价格经常标错、时不时的平台升级,再加上得分效率不高 当时搞得我很是疲惫,我甚至怀疑我走perpdex方向是不是错的,直到看到大赌哥 @y95277777 和里奇哥 @cryptolfggo 当时写的关于lighter的调研并都认为这是一个非常不错的项目,我又重新收拾信心准备继续干 后续我就多开了几个号,尝试了各个指标和方法,发现当时 @0xTria 老哥推上提到爆仓拿分相对来说是比较快的,但是缺点也是要赔出去清仓费,当时就咬咬牙准备当作ico做了 我也渐渐的对爆仓法有了心得,所以也开始在推特上分享自己的详细步骤,也是在这个时候我的follower增加了,看我的人也变多了 后面遇见了茶老师 @mdzzi 和塞哥 @EvanCrypto17 ,茶老师当时应该是把我拉进了他当时创建的一个perpdex群,但是后面因为微信群被封了就没有再做了 又过了一段时间茶老师建议我自己拉个群,当时为了讨一个好彩头就叫lighter research(因为茶老师之前搞得叫hyperliquid research,想的是lighter能继承hyper的大毛) 后面就因为群友的人脉不断拉人,我也是和很多推特上牛逼的老师们当上了群友,虽然现在又被封了😭 塞哥当时也把我拉进他的一个群里和大家交流,群里主要是他玩的好的朋友们和follower 在里面说话多了之后我也和塞哥的几个朋友现在也保持了很好的关系,大家也会经常线下约饭和商量策略 当时还因为塞哥的介绍遇见了南姐 @ec_unoxx ,请教了不少关于如何做账号的问题 南姐人真的是太好了!!我当时粉丝只有几百个,但是南姐依然很慷慨的给了不少建议,后来想给姐发个红包也没收 ———— 到了8月份的时候,roger哥 @HassnHh30961 在群里说团队可能要来香港,说群友们可以一起吃饭,当时我已经是lighter的OG,大家就让我带着几个问题去和团队线下见面并提问一些问题 到了深圳先是跟Roger哥面基上了,对了,roger哥不仅是lighter的contributor,而且基本上大陆所有的线下会议都是roger哥协调和举办的,老哥真的很牛逼 roger当时带我一起去了香港,一起见了03哥 @0Xlynn03 ,见识到了什么叫做web2大佬和人型量化 虽然我知道已经说了很多遍了,但是我还是想说我看见03哥吃饭都在开单的时候终于知道了什么叫做比你牛的还比你努力😂 在香港时候也碰到了maggie姐 @0xmaggie5 和brodie哥 @0xbrodiezZ ,向他们了解到了机构的大概运行规则和一些交易所的组成架构,打开了我的世界观 搞微信群的同时和另外两个og @timemoonc 老哥和as老哥 @The3222646 加上了微信。 timemoon老哥真的和老大哥一样会把自己的好思路耐心的讲解给我听,也会经常会跟我分享一些他对行业和赛道的看法,我总是收益良多 可惜的是没参加深圳的聚会,年后应该还会拜访一下老哥,好好的学习一下大局观 as老哥在深圳线下聚会时见过了,老哥是非常有意思的一个人 跟他聊天能感觉到很开心,问老哥密码的时候也能不藏私的把自己的观点和角度说出来,是一个很大方的老哥 还有益达哥 @lyghanjian001 ,益达哥有时候看见我走弯路的时候真的会很诚恳的给我建议和方向,不想让我瞎走歪路 当我一时半会没想明白思路的时候也愿意花时间私信让我明白其中的脉络去向 后续在长沙行的时候,也感谢路飞老哥 @DLF2216 邀请我第一次见识了线下工作室,路飞哥的工作室真的是顶级工作室,第一次给我的价值观造成了冲击,真的是太牛了 真的想感谢的人太多了,难免会有漏掉的,但是篇幅有限,就只写到这 ———— 回看过去,感慨万千,当初只感觉眼下都是迷雾屏障,走的跌跌撞撞 抵达终点之后发现每次坚持不下去的时候都会有一个贵人伸手扶我一把 一路走过来全是老师,感谢大家!! 话说回来,真的有太多的第一次献给了 @Lighter_xyz 第一次因为一个项目当博主 第一次粉丝过千,第一次被0xsun、大赌哥、风无向等这些大佬关注 第一次在cookie单项目的榜单上排名第二名…… ———— 最后,2025年所剩无几,真心地感谢每一位老师的帮助和扶持,没有你们的帮助我拿不到这些结果 在祝愿大家赚麻的同时更希望大家身体健康,身体才是真正的财富 今年真的是不容易的一年,币圈行情并没跑过场外的美股、黄金,也没有大规模的流动性进入场内 但是希望2026年会有更多的好事,也希望大家能平平安安,健健康康,也真心祝愿各位和身边的人能够平安无事!
显示更多
0
146
330
14
转发到社区
求职系列(6):谈薪 这是求职系列的第六篇,聊聊谈薪。 先说一个大前提。 网上关于谈薪技巧的内容,绝大部分都是哗众取宠、误导性极强,而没什么实际作用的内容。比如什么公式化话术、套路化博弈,你真的拿去用,只会被 HR 在背后笑。 谈薪这件事没有什么花里胡哨的技巧。核心就是信息对称、合理预期、给HR一个能帮你争取的理由。 0️⃣ 校招生,不要谈薪 这条单独拉出来说,如果你是应届生,面的是中大型公司,那么不建议谈薪。 在当下的就业环境里,校招生其实并没有特别大的议价能力(当然,如果你手里有很多offer并且做好了谈崩的准备,还是可以尝试A一下的),平台赋予你的长期价值远远大于那多出来的一两千块月薪。 第一份工作的平台重要性永远是最重要的,一个好的起点平台,能让你在未来八到十年的收入翻N倍,这个复利效应远比入职时多谈几千块来得大。 当然,第一份工作的薪水也很重要,后续的社招跳槽涨薪、定职级其实很大程度都依赖于你第一份工作的薪资,但中大型公司的同岗位应届生都会有一个明确的薪资范围,上下浮动本身就很小,不会出现单独压你薪资的情况。 我见过一些应届生为了1-2K 月薪和 HR 反复拉扯,最后搞得很不愉快,得不偿失。 所以建议校招生如果拿到了足够好的平台的 offer,直接接。精力放在入职后怎么快速成长上,别在入口处耗。 当然,手里有多个同级别、高级别的 offer 时,可以适度用竞对 offer 来争取。策略是轻轻推动,而不是硬谈。 1️⃣ 先搞清楚你的年包到底有多少 谈薪的第一步不是想怎么开口,是先把自己的数字算清楚。 你的 total package 大概包含这些部分: • 月薪 × 月数 • 年终奖 / 绩效奖金 • 股票 / 期权的年均归属价值 • 签字费的年均摊销 • 补充公积金公司缴纳部分 几个注意点: - 实报实销的补贴不算年包。 - 股票取年均归属值。 四年 vest 的 10 万股票,年均就是 2.5 万,不要把总额当一年的收入报。 - 所有谈判基于总年包去谈,不要死磕月薪。 每家公司薪资结构不一样,死盯月薪只会让 HR 觉得你不懂行。 2️⃣ 第一次被问薪资时,就锁定了 80% 的结果 很多人以为谈薪是最后拿到 offer 时才开始的,这其实是个错误的认识。 HR 通常会在业务面试之前就和你聊一轮,在第一次问你目前薪资和期望薪资的时候,你的薪资范围就已经基本锁定了。 这个数字会被记录下来,如果你到 offer 阶段突然蹦出一个更高的数字,会被定义为坐地起价,直接减分。 第一次被问到时要做好两件事: 目前薪资如实报,最好把具体的构成直接报给 HR。 月薪多少、年终几个月、股票多少、签字费多少,一项一项说清楚,让对方确认你的每一项。并且尤其要注意的是不要虚报,后续都是要提供可查的流水记录的,虚报只会砸自己的脚。 期望薪资给一个你真的满意的数。 这个数字要让你开心地去新公司,不会入职后觉得亏了。不确定具体数字的话,那就给一个范围:我期望 15% 到 25% 的涨幅,但目前还在流程初期,具体数字还需要再想想。 这句话的潜台词是:给低了我不一定接。同时也没有把价格锁死,给后续留了空间。 3️⃣ 什么因素可以让你报得更高 现在是下行的行情,大部分人都只能拿到10% -30%的涨幅,但不是所有人都只能报 10%-30%。以下因素可以叠加,每多一个议价空间就大一些: 1. 在现公司年限长 2. 跳槽会错失现公司的普涨、年终奖、即将归属的股票 3. 手里有竞品公司的 offer,能脱敏后给 HR 看 4. 从事业单位 / 国企跳到民企 / 外企 5. 从二三线城市到一线城市,生活成本大幅上升 6. 新行业、公司是一个热方向,比如当前的Agent、具身智能等方向 叠了三个以上,走 special approval 的概率就很大了;通常叠满五个及以上,对方必须走特批,批不下来只能说明公司穷,不是你要价高。 4️⃣ HR 第一次回应时的两种情况 你报了期望之后,HR 的反应会告诉你很多信息。 情况一:什么都没说,说明预算够,你的期望在范围内,后续大概率能谈到你要的数。 情况二:立刻开始管理你的预期,开始说一些固定话术,例如:这个数字可能有挑战、我们也要跟用人部门沟通、你的期望可能偏高了。 遇到第二种,先评估一下这家公司你有多想去。如果没那么想去,尽量不要浪费时间。网上教你用各种技巧往上谈的,说实话用处不大,就算帮你多争取一点也不会超太多。 如果还想继续,直接问:那你们大概能给到多少?正常的 HR 会坦诚告诉你范围,不浪费双方时间。 5️⃣ 拿到 offer 时怎么谈 到了 offer 阶段,双方已经知根知底了,该提多少你心里应该最清楚。 面试聊得特别顺,就提期望的上限,你有底气。面试过程觉得有点虚,对方在给你机会,就稍微降一点,也正常。 如果你不想错失最优价格,有一个很好用的话术:给两个数字。 比如:我的最低线是 20% 涨幅,但如果给到 25%,我一定来,会很开心地入职。 这句话的信息量很大:20% 我可以考虑,但不保证来;25% 我一定来,你放心去帮我争取。 HR 最怕的是辛辛苦苦帮你批了高薪,结果你不来。你给他一个口头承诺:这个数字给到了我就一定入职,等于给了他底气去跟用人部门争取,帮你就是帮他完成 KPI。 这里有一个很多人没有意识到的点:HR 是你在这场谈判里的盟友,不是对手。 很多人把谈薪想成一场你死我活的博弈,我要尽可能多要,HR 要尽可能压低,但这个人生和框架是错的。 HR 的 KPI 是把 headcount 填满、招进来的人尽可能呆的久,他希望你入职。他去跟用人部门、HRBP、财务争取更高的薪资,本质上是在帮自己完成目标,不是在帮你做慈善,所以在入职谈薪上你们的利益在这件事上是一致的。 所以你要做的不是跟 HR 对抗,而是让 HR 有充足的理由去争取。 给他足够多的材料和论据:你有竞争 offer,你的现公司有即将归属的股票,你在目标方向上有稀缺的经验。把这些信息清楚地传递给他,等于给了他在内部谈判时的弹药。 帮你,就是帮他。这个逻辑想清楚了,谈薪的整个心态就轻松多了。 6️⃣ 如果 offer 数字不满意 直接跟 HR 说:这个数字到了我就来,到不了我就不来。 干脆利落,不要拉扯,不要暗示,也不要用什么博弈技巧。HR 每天都要谈几十个人,你那点小心思他一眼就看穿了。 给一个明确的数字,让对方去争取,批下来就去,批不下来就不去,就这么简单。 7️⃣ HR 常见的压价套路 最近和一个有 HRBP 背景的朋友深聊之后,我总结了几种常见手法: 1.否认你的成果。 你说你绩效很好,HR 会说:你的绩效好有可能是因为赶上了风口或者比较适合当前环境,换个环境你还能保持吗?目的是让你对自己产生怀疑,弱化你的议价底气。 2.用平台价值替代现金。 我们的平台、资源、成长空间给你的长期价值远超那几万块差额。道理是这样没错,但平台价值是长期的,你放弃的股票和换城市的成本是短期的、真实的。两者不矛盾,不要被这话绕进去,永远记住下家不愿意给你真金白银就是不认可你的价值。 3.快速推进不给你思考时间。 好的 HR 谈判节奏很快,会在你还没想清楚的时候一步步推着你让步。一旦感觉脑子开始发蒙、被对方牵着走了,立刻喊停。说有急事明天再聊、需要跟家人商量、手头有工作先处理。打断节奏,让自己冷静下来。 4.拆分固定薪和浮动薪。 给你报一个看起来不错的总包,但里面有大量浮动绩效。保底年包 65 万,加上浮动绩效能到 85 万。那 20 万是个问号,第一年大概率拿不满。重点关注保底的固定部分,浮动的最多打五折来算。 8️⃣ 永远守住你的 base 尤其是年包百万以上的候选人,有些公司会把年底 bonus 的比例放得特别大,base 压得很低。 这个坑一定要避开。base 是你在市场上的定价,也是所有后续涨薪、跳槽定价的基准。 base 低了,后面每一次涨幅都是在一个低基数上算,而且如果第一年绩效不达预期,那个很大比例的 bonus 拿不到,就是实打实的降薪。 能把 base 谈高就尽量谈高,少拿点 bonus 比例没关系,base 才是你的安全垫。 9️⃣ 竞争 offer 是最强的杠杆 所有谈薪技巧里最有效的一条:手里有别家的 offer。 你不需要告诉 HR 具体是哪家。可以说:目前有一个还不错的 offer,也是 top 级的平台,给到的年包大概在 XX 万左右,你们这边能不能给到一个更有诚意的数字? HR 不可能去逐一验证,但他会认真对待这个信息,因为如果你真的走了,他之前投入的所有面试成本全部白费。 竞对 offer 不能伪造具体内容,但可以适度模糊化处理,关键是让对方感受到紧迫感:你不是非他不可的。 谈薪归根到底就是三件事: 1. 算清楚自己值多少钱 2. 开口的时候给一个合理但让自己满意的数 3. 给 HR 一个能帮你争取的理由和承诺 不要贪心,也不要委屈自己。一个让双方都觉得合理的数字,比你硬谈多出来的几千块更有价值。因为你还没入职,这个 HR 对你的印象就已经在决定你入职后的体验了。 去把你应得的薪资拿到手,不用想着多拿,但一分也不少拿。
显示更多
求职系列(5):跳槽,大厂还是小厂 这是求职系列的第五篇,聊聊跳槽决策。 --- 跳槽本质上是一个决策问题,而决策质量取决于你掌握的信息量和你评估信息的能力。 大部分人跳槽后悔的原因都是前期调研做得太少。 0️⃣ 先想清楚:你到底需不需要跳 很多人跳槽的驱动力是情绪、是在原公司碰到了问题选择逃避,而不是判断。 例如:项目刚被砍了、和 leader 闹了一次不愉快、绩效季没拿到期待的结果,然后立刻打开招聘 App 开始投简历。 这个节奏大概率会跳进一个坑,因为你的决策基础是情绪,不是理性评估,你在这家公司碰到的问题,大概率在下家还会碰到,甚至会更棘手;所以抱着逃跑的心态跳槽,是无法解决最核心的那个问题的。 判断要不要跳,要先把自己的现状拆开来看,我一般会问自己四个方向的问题: 1.职业成长还在不在? 你过去一年学到了什么新东西?最近解决过什么有挑战的问题?如果这两个问题你答不上来,说明你已经在原地踏步了,这是一个很明确的跳槽信号。 2.你的市场价值在涨还是在跌? 和市场接触接触,把你现在的简历发给猎头,看看他们的反应,能拿到什么样的面试机会。如果几年前你是香饽饽,现在猎头对你没什么反应,说明你在当前岗位上的积累在市场上变现的空间变小了。 3.钱有没有到位? 你的薪资涨幅跟得上你的成长吗?在大厂,如果你连续两三年绩效不差但薪资涨幅远低于市场,也是个很明确的跳槽信号,在一家公司待太久一定会落后于市场能给到的薪资水平。 4.人的问题还是环境问题? 你最近不爽的根源是什么?这个问题换一家公司能解决吗?能不能不换公司解决?如果是具体的一个 leader 让你难受,跟这个 leader 的合作结束了问题可能就消失了,不一定需要换公司。如果是公司的文化、方向、氛围让你整体不舒服,那是环境问题,不换公司解决不了。 这四个问题里,如果两个以上的答案让你不满意,跳槽是值得认真考虑的。如果只有一个,先看能不能暂时解决。 还有一个很重要的信号:你有没有在工作里体会到成就感。 不需要每天都爽,但偶尔有那种做完一件事觉得牛的感觉。 如果这种感觉已经消失很久了,通常是个非常危险的信号,说明当前工作已经没办法给你带来精神上的回报了。 还有一点比较反直觉的是,一定要尽量在高光、上升期跳槽,而不是低谷期,因为上升期时跳槽能基于一个更高的年包谈判、物质回报更高,整个人的精神面貌也会更好,这些都是在面试中无法伪装的。例如:晋升后、加薪后、完成一个重要项目后,都可以接触市场看看机会。 1️⃣ 决定跳了,怎么准备 很多人决定跳槽之后,直接就开始海投简历,这是最低效的做法。 先做整体的简历诊断, 把简历从头到尾过一遍,问自己:每段经历最值钱的产出是什么,有没有用数字量化出来?你的技能栈和你目标岗位的 JD 对照一下,缺口在哪里?这个诊断做完,你才知道你现在的简历能拿到什么段位的 offer。 补充近期的技术积累,找一找你最近在现公司做过的、值得说的技术决策或系统设计,重新梳理一下,以面试叙事的方式组织好。 锁定目标清单,不要无差别海投。列出你真正想去的 10-20 家公司,按意向高低排优先级。意向最高的留到你状态最好的时候面,先拿意向一般的练手,等状态对了再打主力目标。 打开被动市场,更新 LinkedIn、脉脉的状态,或者直接联系你长期合作的猎头,告诉他们你在看机会。 很多好的 JD 根本不对外公开,只在猎头圈里流通,你不主动告知,就永远看不到。 给自己定一个时间范围。想清楚打算几个月之内跳槽?这个时间窗口会影响你的节奏。 如果你三个月内想动,现在就要开始准备简历、刷题、约面试。如果是半年内,节奏可以相对慢一点,但不能无限期拖着。 2️⃣ 跳槽前的信息收集 客观信息: 知乎、脉脉、公众号、行业报告。了解公司的业务方向、盈利模式、裁员历史、文化风格。这些信息有噪声,但多看几个来源交叉验证,基本能还原一个大致的画像。 主观信息: 自己下载产品用一用,感受一下体验和迭代速度。如果能找到在里面工作过的朋友,直接问,尤其是那些已经离职的人,他们说的话比在职的人真实得多。尽量尝试打听到具体的组,同一家公司不同组的体验可能天差地别。 适当拉长时间轴。 不要面完就急着决定,给自己一到两周时间消化信息、做对比。着急做的决定大概率不是最优的。 3️⃣ 看趋势,别只看现在 别只看公司现在怎么样,看它三到五年内的方向。 一家公司如果业务在收缩、人员在流失、产品没有增量,哪怕当下薪资很高,三年后你面对的可能是裁员或者边缘化。 反过来,一家公司如果业务在扩张、产品在增长,哪怕现在薪资一般,三年后你的职级、薪资和能力都可能有大幅提升。 选增量,比选存量重要。 4️⃣ 主动降温,避免过于乐观 大部分人看新机会时都处于兴奋状态。新环境、新挑战、新薪资,一切看起来都很美好,但你需要主动给自己降一降温。 问自己几个冷酷的问题:这个岗位最坏的情况是什么?如果业务被砍了我怎么办? 薪资涨了 30% 很诱人,但如果工作强度翻倍、成长空间有限、团队文化糟糕,那 30% 的涨幅根本覆盖不了这些隐性成本。 把优缺点都写出来,根据权重综合打分,别只盯着那个涨幅数字。 5️⃣ 大厂跳小厂 / 初创的决策框架 如果你正在考虑从大厂跳到初创,有几条硬性筛选标准。 看阶段。 只考虑早期阶段的公司。中晚期的初创大概率已经过了高速增长期,你进去拿到的期权被稀释了好几轮,上升空间极其有限,要赌就赌早期。 看投资人。 背后是谁在投钱,直接决定了这家公司的生存概率和天花板。 找里面的人聊。 找一找从这家公司在职\离职的人,他们为什么走,离职的人的评价往往最接近真相。 算一笔账。 把大厂未来 2-3 年的确定收入算出来,再算算小厂的收入区间,分最低和最高两个极端。最低的情况你能接受吗? 如果最低情况会让你的生活质量严重下降,这个赌就不值得冒。 争取更好的条件。 如果决定去,在谈 offer 的时候一定争取:base 能不能提一提、期权能不能多给一些,不是为了多拿几千块,是看对方的诚意。 但连薪资都不愿意谈的公司,进去之后大概率也不会在其他事情上对你慷慨。 --- 跳槽最重要的一件事:手里有筹码再做决定。 在你拿到新 offer 之前,所有关于去留的纠结都是空想。先把 offer 拿到手,坐下来,冷静对比,理性评估。 别在脑子里做选择题,要在纸面上摆出真实的选项,白纸黑字、数字清楚,然后再做决定。 手里没有筹码的人,不配上桌谈选择。
显示更多
《OTC知识大全》 交易所如何安全顺利的买到U 很多家人经常和我说买U难,想顺利买到交易所盘口较为便宜的U也是有技巧的,你的资金放卡里的时间越长越好,OTC商为了不收黑钱都会有自己的审核要求,第一步就是卡里资金的沉淀时间,那种进进出出比较频繁的第一步就审核过不了,有日常生活消费等正常行为都会比较容易获得通过,同时能提供同张银行卡长期的理财走势图也会加分,从价格最低的开始买,优质的流水明细很容易就能买到盘口最便宜的USDT,当然卖的最便宜的OTC商审核也是最严格的,录视频查验流水、支付宝微信提现验证,KYC实名认证、签订买卖USDT合同等等。 买U是你汇钱给别人,但是也会发生冻结的可能,俗称保护性冻结,大概率就是收款人是电诈、洗钱、跑分、网赌的那种,叔叔为了保护你卡上资金安全采取的措施,当然遇到了问题也不大,尽量在买U时也要筛选一下OTC商家,注册时间长、能实名收款的,这样你可能永远遇不到保护性冻结,毕竟本来就是小概率事情。 交易所如何安全出金 出金三要素: #Binance# 、 #OKX# 交易所交易、严格审核商家(注册时间2年以上、总成交单数越多越好,近30天成交单数相对较少为好)、双方实名收付。这样会很大概率减少被冻结,而且就算不走运被冻结,后期的解冻处理相对会容易一些。杜绝不通过交易所的交易;杜绝线下现金之类的交易;杜绝TG聊天,微信都不敢和你聊交易细节,这钱你敢要?追求极致安全可找我出,从业至今运气好一直零冻结,有人说我价格收的低,但很多长期出的老客户只认福禄寿,买卖自由选择自由,选择权是你的,推特主页有我微信可加。 大额出金如何不被银行风控 出金除了最重要的冻结问题,就剩下银行风控,OTC商只能保证你的资金安全,但是无法保证银行会不会风控。长时间不用的银行卡、或者流水很少的银行卡确实概率上会更容易被银行风控,但都是小概率事情,福禄寿这边很多百万以上的汇款也从来没客户说被风控过,但也遇到过客户7万元反而触发了银行风控,不过就算被风控也很好解决,汇款人配合好即可。大部分银行风控是保护汇款人的资金安全,预防你是电诈跑分洗钱违法份子。也要避免快进快出、多笔进一笔出、一笔进多笔出、夜间大额进出等容易触发银行反洗钱风控的行为,条件允许卡里放一些余额,或者买些理财,不着急用钱也无需一次性出很大额。 OTC商家需要注意哪些 遇到过无数新人想成为OTC商家赚钱,我都是给出不建议新人入行,OTC的水很深、诱惑也很多,很多人把持不住很容易栽跟头。我只能指引方向,首先你要确保做到百分百不收到黑钱,如果做不到就不要碰OTC,100位OTC有100种做法,不收黑钱靠的是审核要求,你要会看流水明细、防止P图,有的录屏给你的是假银行APP;KYC的实名认证;买卖USDT的合同签订;给客户的风险安全提示;确认客户买U真实用途;交易所账号验资;玩合约的费率验资等等验证方式。其次就是银行卡流水问题如何解决,很多人做着做着就没卡用了、微信废了、支付宝废了,用家人的朋友的都不建议(只会牵连他们),还有的用淘宝收款、支付宝口令红包等等方式,我有时候都很佩服这些人是啥方法都能想的出来,八仙过海各显神通。当然很多大宗都和银行有些关系,或者买个几百上千万的理财成为VIP。 小额多次出金是否安全性更高 黑钱不分金额大小,五百、五万、五百万都会冻结,多次只会让你收到黑钱的概率增加,通常是建议规划好一定时期需要用的资金,选择安全的OTC商一笔出完,减少出金频率。 线下现金交易、现存转安全吗 目前现金出事的越来越多,明抢、真假钱、真假U等等各种骗术,另现金、现存你也没办法知道他的资金来源,给你现金现存的人出事之后,你就会受到牵连,只要出事基本就是一手黑,而且近年以来趋势上,叔叔在办案过程中遇到TG聊天软件聊交易的、只收现金的、或者是现场取现等行为,都会作为异常点而推定行为人主观上知道或者可能知道交易对手方的现金可能存在涉案资金,构成主观上的明知,法院正常会判帮助信息网络犯罪活动罪(帮信罪)和掩饰隐瞒犯罪所得收益罪,福禄寿非常不建议你选择线下现金、现存交易。 出完立刻还信用卡、购买理财和转证券账户是不是就安全了 有此操作是对自己刚出的金没有信心的行为,首先信用卡和银行卡一样,可以直接用来出金,但是收到黑钱信用卡一样会冻,资金是黑的情况下还是存在后遗症等问题。购买理财后你的卡被冻请问如何把理财里的钱提现?就算冻卡后卡上没钱,一样可能被上门,上惩戒名单、电诈涉案名单等。转到证券账户的钱有问题,银行卡还是会被冻,叔叔也是可以发函冻结你的证券账户,出金后的所有操作都是无用功,不收黑钱才是一切之根本,收到黑钱后再怎么操作都是徒劳,别把叔叔当白痴。 用微信、支付宝会不会安全一些 微信、支付宝和银行卡完全没有任何区别,都可以冻结,而且微信、支付宝的风控更加变态,他们的大数据风控比银行更加严格,我们团队一直银行卡交易,从不用微信、支付宝。而且微信、支付宝你不一定能分清楚是不是实名转账。 哪个交易所出金更安全一些 #Binance# 、 #OKX# 在我看来没有任何区别,出金时你只是借用交易所的平台选择OTC商家,本质是你和OTC商家C2C的交易,资金安不安全完全是看你的交易对手,很多OTC商家在两个交易所同时是商家,不管你是币安还是OKX下单汇给你的都是他卡里同样的钱。不过可以排除其它小交易所,他们自身的平台风控无法和币安、OKX比较,另小交易所的风险无限大,后期调取信息等等问题。 出完金放在卡里多长时间就能证明绝对安全了 OTC资金没有绝对安全一说,永远在理论上存在着冻结可能性(除非不是币圈资金),公安在什么情况下才会冻卡?在受害人报案后立刻紧急止付、冻结受害人资金流过的所有卡,有时一个案子能冻成千上万张卡,冻结时间取决于受害人什么时候报警,有的杀猪盘可能让受害人半年后、一年后才发现自己被骗,所以有的出完金几个月半年一年后都还有被冻的可能性,大概率上超过三天、一星期没问题,后期被冻的概率就小很多。 出金用四大行好还是地方银行好 在我看来只要是银行卡都没有任何区别,收到黑钱后叔叔都能一键冻结,无非是每个银行的风控系统不一样,有一些区别,但是风控不算什么,最坏结果是取钱销卡,最主要的是不收黑钱不冻卡。出金也不要使用自己的房贷卡、工资卡、社保卡,万一后期出问题,会影响这些卡的正常使用,条件允许就选择总行、分行、金融中心的银行办卡。 《详解OTC冻卡处理 》 冻卡的前因后果 2020年为了打击网络赌博、电信诈骗等网络犯罪,为了杜绝扼制住犯罪份子的资金洗白途径,国家出台了“净网行动”,以及后面的“断卡行动”,打击买卖出借电话卡、银行卡等违法犯罪行为,一时间各大网友与搜索平台出现很多“银行卡被冻结?”“银行卡被冻结半年?”“银行卡被异地警方冻结?”“只是玩家网赌银行卡被冻结会被抓吗?”“我在交易所出精为何被冻卡”等很多信息,让很多冻结网友看得眼花缭乱,遇到这种情况也不知如何处理?心急如焚,或者寝食难安。区块链虚拟货币的天然属性也被犯罪份子利用成为洗钱的重要途径,间接导致币圈成为网赌之后的冻卡重灾区,截止到今日,政策层面的高压政策依旧严峻。很多网赌人员自从冻卡后彻底戒掉网赌,可见净网行动、断卡行动的正确性毋庸置疑,保护了很多普通人的合法资产。 冻结的基本情况 冻结银行卡可以大致分为2种情况:一种3天(紧急止付)、另一种6个月,3天以内不管你是48小时还是12个小时都算3天这个时间节点内的,银行明确告知3天可解封的什么都不用做,安心等待,每个银行解封的时间都不一样,比如建行,银行告知12号解封一般真正解封的时间是13号比预期的时间晚一天,还有农业银行,解封当天对应解冻时间22点30分过后会解封,还有很多银行不一一举例,只需等待对应的时间就可以。 还有一种情况,3天后没解冻,又去问了后又被另一个公安冻结了,这就是多个公安冻结的情况,一笔钱被多个公安冻结,被多个公安冻结解封就比一个公安冻结麻烦,必须每个公安都给你解封,如果里面有一个公安突然给你冻结6个月,你就要看后面写到关于6个月冻结处理办法。这是关于3天冻结的群体,其实3天冻结这个事情更多是一种心理的煎熬,焦急,无助,谁发生第一次都会如此,我遇到过一笔资金被十几个地方的叔叔同时冻结的粉丝,涉及到杀猪盘,各地报案人很多导致的。 除了3天冻结就到6个月,首先所有冻结6个月的必须明确一个事情,叔叔冻结一定是你的账户现在或者曾经收到过交易所出精C2C对手方打给你的黑钱,叔叔不会无缘无故冻卡,一定是有受害者报警了,叔叔顺着资金走向开始冻卡,有的案件冻结几千上万张卡是很正常的。 被冻结6个月的群体都想知道半年后是什么一个情况,到底被续冻还是会自动解封,这里谁都不能给你一个准确答案,这里涉及的层面和关键点太多,太多因素影响这个卡的走向,不同的地方、不同的案件经办人、收到资金是多少级等等,处理方式的不同处理结果都会不一样,其实被冻后更多的是看运气。 冻后要如何处理 冻结6个月的都建议第一时间和银行工作人员询问清楚,冻结时间、冻结单位、冻结单位联系方式,有的银行电话问不到,就去柜台问清楚,如果没有联系方式,就告诉你某某异地公安机构,打异地110或者114去查询电话号码,正常6个月的被冻后一定要积极的联系冻结单位询问情况,如实回答问题,准备好材料:一年以上的流水、交易平台窗口或者微信的聊天记录、交易中你所采取的安全措施、交易的价格对比、与对手方的交易次数、写一份完整的情况说明材料快递过去,剩下的就是等待。有的提交材料即可解冻、有的等到期才可解冻、有的到期后还会续冻。 有的不主动联系反被叔叔联系上并强烈要求过去做笔录,能不能去?这个问题没有固定答案,冻结后会出现很多种情况:过去了可能会直接拘留,37套餐安排上。也有过去做完笔录后就解冻,还有让赔受害人的资金才给解冻,有的人怕就各种理由不过去,或许没事,等到期要么解冻要么续冻;有的不过去给你列为网逃、有的被冻后不主动联系突然被叔叔直接上门带走。还是那句话不同的冻结、不同的案件经办人、不同的地区、不同的对待方式都会有不一样的结果。如果叔叔主动联系你,比如给你发问询函之类的,积极配合就行。实在担心的可以委托律师过去处理,我也介绍过币圈专业律师给粉丝,有需要的可以私信福禄寿。还有一种可能就是和叔叔沟通把这个事情给本地叔叔去本地叔叔处做笔录,然后他们把你的笔录信息传给异地叔叔,是可以沟通的。
显示更多
0
616
3.4K
1.1K
转发到社区
DeFi 说”无需信任”,危机来了才发现也无人负责,$2.3 亿坏账摆在那里,两家完全有能力处理的机构选择沉默,$132 亿 TVL 两天内蒸发。 DeFi 一直有一个叙事:去中心化、无需信任、代码即法律。但这次事件把这个叙事最脆弱的地方暴露出来了——当出了问题,没有人负责。 不是因为做不到,而是因为结构上就没有设计”负责”这件事。 传统金融里,出了 2 亿的窟窿,有监管、有法律、有合同,总有人被逼着坐到桌前。DeFi 的”去中心化”在平时是卖点,在危机时是挡箭牌。每个人都可以说:这不是我的责任。 这不是 Aave 或 LayerZero 的道德问题,这是 DeFi 的结构性缺陷。 RWA 做的事情恰恰相反——我们把真实世界的资产和法律责任引入链上,不是因为我们不信任区块链,而是因为我们知道:金融系统的信用,最终必须有人兜底,必须有追责机制。 代码管不了人性,也管不了危机。 DeFi 的 TVL 数字很好看,但它建立在一个假设上:所有参与者都会理性行动,协议永远不会出问题。一旦这个假设失效,整个系统没有缓冲,没有救援,只有挤兑。 这次不是第一次,也不会是最后一次。
显示更多
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
54
910
275
转发到社区