搜索読売新聞相关的推文

2026.03.24 10:00

【民調顯示】多數日本人反對向中東派遣軍艦美國當前繼續向盟友施壓，要求幫助確保霍爾木茲海峽的安全。《讀賣新聞》一項民調顯示，67％的受訪者反對向該地區派遣自衛隊，ANN民調中也有52％反對。兩項調查顯示，日本首相高市早苗（圖左）內閣的支持率分別為71％和65.2％。

显示更多

0

转发到社区

王戴@IoGgnj

2026.05.13 09:31

若日本通過類似美國的相關法律，必將讓那些在日本「明修棧道、暗渡陳倉」的偽民運人士及中共代言人成為熱鍋上的螞蟻！樂見其成。👏 新聞摘要：美國阿卡迪亞市華裔市長王愛琳涉「中共代理人」被捕美國司法部於 2026 年 5 月 11 日證實，南加州阿卡迪亞市（Arcadia）華裔市長王愛琳（Eileen Wang），因涉嫌充當「中國政府非法代理人」遭聯邦政府起訴並逮捕。王愛琳已與檢察官達成認罪協議（司法交易），並於起訴當日辭去市長與市議員職務。一、核心犯罪事實 •受命發布親中宣傳：聯邦調查局（FBI）指出，58歲的王愛琳於 2020 年至 2022 年間，直接聽從中國官員指引，利用其經營的華裔美國人新聞網站，大量發布符合北京立場的政治文宣。 •否認新疆人權問題：起訴書指出，她受中國官員指示，公然在媒體上發表文章，否認新疆存在種族滅絕和強迫勞動。 •未依法登記為外國代理人：王愛琳在明知法規的情況下，未向美國司法部登記，秘密執行外國政府的統戰與宣傳任務。二、涉案背景與後續 •政治生涯告終：王愛琳約 30 年前從中國移民美國，2022 年當選市議員，2026 年 2 月才剛接任市長，任期僅約 3 個月便因案辭職。 •市府全面切割：阿卡迪亞市經理人多米尼克（Dominic Lazzaretto）發表聲明，強調此起訴案僅屬王愛琳個人行為，與市府的財政、日常決策或公共事務無關。 •面臨刑責：根據美國聯邦法律，非法充當外國代理人重罪最高可判處 10 年監禁。王愛琳預計將於數週內正式在法庭提交答辯並完成認罪。此案已引發高度關注，繼中文媒體報導後，日本《讀賣新聞》、《朝日新聞》、《日本經濟新聞》等主流媒體也作了相關報導。

显示更多

0

11

1

转发到社区

BearToBull@Beartobull_ETH

2026.05.13 23:02

*#牛市#**是價格上漲時期——樂觀主義、盈利和 #FOMO# 主導。**#熊市#**是價格下跌時期——恐懼、虧損和投降情緒主導。兩種市場的策略完全不同。 --- 每位加密幣投資者都會經歷牛市和熊市。理解差異並調整行為的人能夠生存和繁榮。不理解的人通常在頂部買入，在底部賣出。 ## 什麼是牛市？牛市是資產價格持續上漲的趨勢——通常定義為從近期低點上漲 20% 以上。 **特徵：** - 價格持續創新高 - 積極的新聞情緒主導 - 新資金湧入（散戶 FOMO、#機構買入）# - 社交媒體和新聞充滿加密幣熱情 ## 什麼是熊市？熊市是持續的下跌趨勢。加密幣熊市通常更為嚴重，常見 70–85% 的回撤。 **特徵：** - 價格持續創新低 - 負面新聞主導（監管打壓、交易所倒閉） - 資本外流 ## 牛市策略 **做：** - 持有核心倉位（#BTC、##ETH）——不要因恐懼過早賣出# - 在投機性山寨幣上漲 3–5 倍時逐步獲利了結 - 在看漲信號達到頂點**之前**制定退出計劃 **不做：** - 在已上漲 1,000% 的幣上 FOMO 追買 - 使用高槓桿 ## 熊市策略 **做：** - 以較低價格定期定額買入 BTC 和 ETH - 持有穩定幣並逐步部署 **不做：** - 在絕對底部恐慌性賣出 BTC/ETH - 在已失敗的山寨幣上「接飛刀」 ## 2026 年市場所處位置根據 2024 年減半周期分析，2026 年處於牛市末期/潛在頂部區域。風險升高，但某些未被充分認可的板塊可能仍有機會。非財務建議。詳細分析請參閱我們的[市場周期指南]( --- ## 延伸閱讀 - [LookIntoBitcoin — 恐懼與貪婪指數]( - [CoinDesk — 如何在熊市中生存](

显示更多

0

转发到社区

猫笔刀的备忘录@mooomoocat

2025.10.01 15:21

反了反了昨晚评论里提了一嘴，说2001年我读大学时每个月的生活费是700-800，同学里还有不少单月上千的。结果我看后台针对那条留言的评论叠了几百楼，主要是惊叹和质疑，认为我夸大了金额。为此我特地找我妈确认，她大一时每个月给我的生活费是700，从大二下半学期开始我就让她不用给了，因为我当时收入已经比她高。至于我的那几个哥们，今天我在群里问了一下，确实都是700-1000这个区间。另外还有两个关系要好的女同学，回忆大学时生活费是1000打底，要是有旅游什么的还经常花超了。怪不得互联网上老说在中国投胎的上上签是江浙沪独生女，当时在同学圈子里大家都习以为常，直到后来接触了内地省份的一些朋友才知道地区差异很大。网友留言的几百楼我都看完了，有和我同龄的大学生当初生活费只有200-300，真不容易，每个月吃饭+手机话费就剩不下几个钱了。我把老婆叫过来问她当时生活费多少钱，她在北航每个月500，被我嬉皮笑脸的挤兑了一番。她说有个师兄毕业了，把家教的客户介绍给她，周末去上课一个小时酬劳100，还能管晚饭，这大大的补贴了生活开销。但好景不长，人家孩子高三毕业就没活了。我当时大概是大学生里赚钱赚的最easy的，一个下午坐在电脑前噼里啪啦打字，稿费就有300-400，一个月接4-5篇，挣的钱就花不完了。那个时候还不懂财经投资，写的主要是游戏和体育。因为我经常在网络论坛上发贴滔滔不绝，会被媒体编辑看到，就私信我约稿，所以在人多的场合不要低调，勇于表达和展示自己，就会获得更多机会。 …… 回想我这半辈子，人生轨迹被互联网多次改变。高中的时候沉迷网吧，在家人看来是屡教不改的玩物丧志，但其实我上网并不只是玩，别人是传奇一刀999，我喜欢探索各大互联网论坛社区，学习各类互联网工具。举个例子，我2000年就已经用mp3听音乐了，这事你现在乍一听觉得没啥，但是在2000年没有腾讯音乐、没有网易音乐、没有酷狗、甚至大部分网吧都没有宽带，还用拨号上网。我能在互联网上找到自己想要的歌曲，用网际快车下载到电脑，再导到mp3，亦或者去华军软件站下载工具，把dvd碟片里的歌曲转格式，再导到mp3。一个2000年的高三学生能完成这些操作，其实已经说明我拥有一些能在互联网时代发光的特质，只是我的长辈们当时不能理解这一切，他们一次次把我从网吧揪出来臭骂。他们这么做也没错，家长都希望孩子好，只是他们以往的人生经验已经很难规划我的未来。我妈以前教训我的时候经常说的一句话是，我未来能有她一半的出息就谢天谢地了，大二之后她就不说了，原因见上文这首歌老网民还有印象吗？是我买了mp3后往里面导的第一首歌。我以前在网上看到过一句很有启发的话，30年后的社会，大概有一半的工作岗位现在都还没出现过。是这样的吧，30年前的中国别说还没有互联网行业，新能源行业，甚至连快递、外卖、网约车都还没有，所以父母在培养孩子时应该保持一定的开放性，不然就会错过一些可能性。 …… 再说说今天有印象的新闻。黄金突破3900+，刷新史高，这其实也不算啥大新闻，机构现在都看到4000+，区别是有人觉得明年到，有人觉得月底到，有人觉得本周到。北京房地产中介协会发文：禁止恶意压价，不得PUA房主。这条标题看到后我还是挺感慨的，我之前20年经历过北京楼市的黄金时代，见识过一边倒的卖家市场有多么强势。以前卖房的真是大爷，税费+佣金默认都是买家承担，一套房到了周末排队预约看房，你还在犹豫讨价还价，别人已经抢着把订金付了。现在竟然演变为中介恶意压价，以及中介pua房东，简直倒反天罡。今年资本市场全面上涨，而房地产已经让过去10年买入的人在不同程度产生亏损，像这种历史级别的岔路口一旦走错就会白白奋斗5-10年。我今天打开贝壳看了一眼我2016年卖掉那套房子的同户型，已经有人报价比我当时卖的还便宜5-10%了，成交价还能谈。今天新闻上看到全国各个景点都是人山人海，我有一个小小的建议，尽量选临近关门的时间去，比如一个景点6点关门，大概玩1个半小时就差不多了，那就4点半入场。这样可以最大程度避开高峰人流，是没有办法的办法。今晚就这些，长假进度1/7，慢慢玩。

显示更多

0

6

1

0

转发到社区

蛋黄堡.ai@Hamburgerai

2026.05.12 15:57

# AI 行业三个月变天，模型榜单已经解释不了全部 1小时46分钟里，这期《半球观察》播客的主持人把 DeepSeek V4、约 1000 条 Cursor 工作轨迹、OpenClaw 出圈、Manus 交易流产和 AI 中转站放在同一张桌上。单看每条都像行业新闻，连起来看就很刺眼：AI 公司正在被新的尺子衡量。模型榜单还重要，但已经解释不了全部。过去我们习惯问一个问题：谁的模型更强？现在还得问另一组问题：谁有真实任务数据，谁掌握用户入口，谁能把价格打下来，谁能穿过监管和资本的窄门。 > **编者注：** 这篇按播客原文提炼判断。DeepSeek 估值、Cursor/xAI 交易、Manus 价格等数字均先按“节目说法”处理，不能直接当作已确认事实。 ## DeepSeek 的强，变成了另一种强主播对 DeepSeek V4 的评价并不客气。V4 Pro 被认为 reasoning 过长，很多任务里像是在思维链中自己和自己打架。V4 Flash 的体感更好，接近 GPT5.4 mini 或 instant API 的水平，但这已经不是 R1 那种“全行业被迫重新估值”的时刻。这就产生了第一个反差：DeepSeek 仍然技术很硬，但它的产品冲击力没有天然压倒别人。节目里提到，Kimi、GLM、MiniMax 等国产模型在 coding 和迭代速度上都给了 DeepSeek 压力。DeepSeek 自己也因为适配国产硬件、减少 CUDA 技术债、拥抱 TileLang 等路线，承受了延期和成本变化。这听起来像掉队。但节目给了另一个定位。节目里说“DeepSeek 正好填补了这个空白”。这个“空白”指的是 OpenAI 不再开放权重、不再详细公开技术路线之后，全球开发者和研究者仍然需要一个前沿模型的公开参照物。DeepSeek 的价值就从“谁最强”变成“谁还愿意把技术路线摊开”。这是一种新的强。它可能不总是最会做产品的公司，也不一定每个版本都压住榜单。但它像开源社区的技术坐标系。大家看它的 report，看它的注意力机制，看它的后训练方法，再把这些东西吸收到自己的模型和产品里。所以，写 DeepSeek V4 不适合写成“王者归来”或“彻底掉队”。更准确的说法是：DeepSeek 正在从爆款模型公司，变成公开 research lab 的基础设施。 DeepSeek 没有消失，它只是从王者变成了坐标系。 ## 数据飞轮开始压过架构叙事这期最有信息量的技术段，落在 OPD 上。节目用一个很好的类比解释 On Policy Distillation：传统后训练像老师先写一大本习题集，学生之后自己看、自己背、自己消化。问题是题太多，领域太杂，学生容易学歪，甚至出现 reward hacking。 OPD 的感觉更像现场教学。 > “学生遇到不会了，老师就过来告诉他为什么不对。” 写代码时，代码老师在旁边；做数学时，数学老师在旁边。学生先尝试，老师实时纠错，模型训练从离线习题集变成在线反馈。这个机制把问题引向更深一层：老师从哪里来？答案是数据。更具体地说，是真实任务里的高质量轨迹。节目提到 Cursor 的 Composer 2 争议时，有一个关键细节：Cursor 被转述为在 Kimi base model 上加入约 1000 条真实用户工作轨迹做 SFT，使 coding 表现明显强于原始 base model。这个数字需要核查，但方向很重要。如果模型架构的边际差距变小，真实任务数据就会变成更贵的东西。 Claude Code 和 Codex 为什么会越做越强？节目里的解释是，它们有真实工程师每天使用的轨迹：怎么打开项目，怎么读代码，怎么改错，怎么跑测试，怎么回退，怎么完成一个长任务。这些数据很难从普通互联网文本里直接获得。它是任务过程。这也是 Cursor、Claude Code、Codex、OpenClaw、Manus 这一类产品被重新定价的原因。它们表面是工具，底层是数据采集口。谁的用户每天把真实任务交给它，谁就能反过来训练更懂任务的模型。模型能力当然还重要。但当大家都足够强时，数据会把差距重新拉开。模型教会产品说话，用户轨迹教会模型做事。 ## OpenClaw 出圈，说明入口开始变形节目把 OpenClaw 称为 Agent 的 ChatGPT 时刻。这句话很大，但它有具体场景支撑。主播把 OpenClaw 接进 Telegram 家庭群，当成一个会记忆、会查资料、会调用 skill 的“电子宠物”。更重要的是，在这个框架里，本地 27B 模型和 GPT5.5 的体感差距被缩小了。原因很简单：OpenClaw 有 memory，有 skill，有连续任务，有工具调用。这就改变了用户感知。单独问一个小模型，它可能不如大模型；把它放进一个 agent 框架里，它能记住昨天说过什么，能查资料，能跑工具，能把一个任务接着做下去。用户看到的是任务完成，而不是模型参数。这也是 OpenClaw 出圈的意义。它把 skills 从程序员小圈子带到普通人场景。节目里提到阿里的电商出海 agent。它可以帮助小商家处理 Shopify、商品上架、趋势分析、网站设计、运营链路。过去这些工作可能需要助理、外包、懂代码的人和运营经验。现在一个小老板可能第一次感到，agent 能把一整套流程接起来。这个变化比模型榜单更接近商业。因为用户不会每天比较 benchmark。他们会比较：这个东西能不能帮我把店开起来，能不能生成网页，能不能做 PPT，能不能整理调研表格，能不能少雇一个人。 Agent 的入口价值，不在会聊天，而在能接活。 ## Manus 的稀缺性，被同类产品反向证明 OpenClaw 出来以后，很多人会自然认为 Manus 不稀缺了。节目里的判断正好相反：OpenClaw 爆火，反而证明 Manus 更稀缺。这个判断的逻辑是产品体验。主播说，很多 computer use 或 open cloud 服务“根本不想用”，Perplexity 的 computer use 被点名为几乎不可用。相反，Manus 能做出详尽网页、PPT、真实调查表格，任务保持程度更好。换句话说，壳不稀缺，稳定交付稀缺。这和 ChatGPT 早期很像。聊天界面谁都能做，真正难的是持续给出有用答案。Agent 时代也是一样。浏览器自动化、工具调用、任务规划、记忆系统、失败恢复，单独看都不是秘密。难的是把它们组合成用户愿意反复使用的产品。 Manus 交易流产把这个问题又推到监管层面。节目讨论了 Meta 交易被撤销、VIE、IP、人才和公司归属问题。这里最值得保留的不是情绪判断，而是创业者面临的新现实：AI agent 这种产品绑定了用户数据、任务轨迹、人才供给、模型合作和国家监管。对中国 AI 创业者来说，路径选择可能会提前。你从第一天就要想清楚，是进入国内生态，还是走海外资本路径；是把团队、IP、数据和客户都放在一个监管框架里，还是冒着未来交易被叫停的风险做跨境结构。这已经超出普通商业选择。这是 AI 产品变成战略资产后的副作用。 Manus 的问题不是卖没卖成，而是它到底属于哪里。 ## AI 开始说钱，也开始被低价倒卖节目后半段最现实。大厂模型开始收费，推理框架项目开始公司化，IPO 和融资叙事吸走市场流动性，AI 中转站开始变成生意。主播说得很直接：节目里那句“大家都开始说钱了，不再说 AGI 的梦想了”，把这层现实说得很直。这句话有点刺耳，但它解释了很多现象。当模型差距大时，用户会追逐最强模型。当多数日常任务都已经够用时，用户会开始追逐便宜、稳定、可接入、不封号、不断线。AI 中转站就在这个缝隙里长出来。节目提到 Sub-to-API 这类工具，把 Claude 或 Codex 的订阅转换成 API，再用更低价格分发。也提到部分中转站可能收集用户数据，甚至标称 Claude，实际替换成更便宜的国产模型。 > **编者注：** AI 中转站涉及服务条款、数据安全和潜在欺诈风险。这里仅按节目内容记录产业信号，不构成使用建议。这说明模型正在商品化。最前沿模型、企业级合规服务、真实工作流数据仍然贵。但对普通聊天、搜索、轻量写作、心理陪伴、日常问答来说，很多用户已经不愿意为“最强”付出太高溢价。这会倒逼模型公司回到互联网逻辑：获客、留存、价格、渠道、生态、数据闭环。 AGI 叙事还在，商业账本已经来了。 ## 最后这期《半球观察》最适合被整理成一组暴论，因为它更像一张行业雷达图。DeepSeek 代表公开技术路线，Cursor 代表 coding 数据，OpenClaw 代表 agent 入口，Manus 代表可交付产品和监管敏感性，AI 中转站代表模型商品化。把这些点连起来，结论很清楚：AI 行业正在从“模型公司竞赛”变成“模型、产品、数据、资本、监管共同定价”的复杂游戏。接下来不能只看模型榜单。要看四个信号。第一，DeepSeek 后续版本能不能重新打出产品体验上的压倒性差距。如果不能，它仍然有开源坐标系价值，但商业位置会不同。第二，Claude Code、Codex、Cursor、OpenClaw、Manus 谁能沉淀最高质量的任务轨迹。真实用户每天交出的工作过程，会比静态语料更贵。第三，agent 产品能不能稳定交付。会调用工具不稀奇，能把网页、PPT、调研、代码修改交付到用户满意，才是分水岭。第四，价格和监管会不会重塑模型分发。中转站、订阅转 API、模型替换套利、跨境交易叫停，都说明 AI 已经离纯技术讨论很远。我对这期的最终判断是：模型能力仍然重要，但它已经不是唯一的解释变量。谁拥有入口，谁拥有数据，谁能把价格做到用户愿意持续用，谁能在监管和资本结构里活下来，谁才可能赢到下一阶段。这也是它最值得写成文章的地方。暴论背后真正冲击人的，是我们判断 AI 公司的尺子正在换。 --- 原始播客：

显示更多

0

转发到社区

Rica@YoooRica

2026.05.24 05:51

🔥日媒《读卖新闻》爆料：川习会上，习近平点名吐槽高市早苗&赖清德“威胁和平”，求川普“别支持”😂 川普并未附和，答道：“高市可不是应该被批的领导人！” 会后秒打电话给高市，详聊并且重申“日美同盟坚不可摧”😂🇯🇵🇺🇸

显示更多

0

22

262

164

转发到社区

leaf@CandyDAO_leaf

2025.12.12 11:22

最近彩虹钱包也要发币空投在coinlist上面进行打新😂 链接：之前还有钱包积分的应该是有空投的你们自己看着办吧现在全是卖币还有 @zama 要打新卖10%的币👇 而且还是密封式的荷兰拍啊说直白点就是所有参与打新的用户自己博弈赌目前还没有读详细的规则就怕是榨干最高价的人？等等官方的详细规则再看是怎么回事吧如果规则不是榨干最高价的人那么还是可以期待起码如果你是有OG NFT的是值得期待的榨干最高价的你们懂怎么回事吧？我想知道空投多少? @zama #ZamaCreatorProgram#

显示更多

0

19

1

转发到社区

土澳大狮兄BroLeon | 🔶BNB |@BroLeon

2026.01.11 10:24

《变成更好，更自由的自己》引用的这篇文章是我今天读到很有共鸣的一篇文章，尤其适合KOL这个赛道。不管你是否打算做KOL，都非常值得花点时间琢磨。如果你用小红书，你会发现这哥们 @thedankoe 已经成了很多博主特别追捧的对象（养活了很多学习号😂😂）。不过有一说一他是有干货的，在个人品牌和数字创作者领域非常有见地，也相当成功。反鸡汤，反主流教育/工作观，很戳“不想一辈子打工的当代年轻人”。好了，说说昨天他这篇长文说了啥。 ~~~~~~~~~~~~~ 拥有多种兴趣不是弱点，而是当今时代（他称为“第二文艺复兴”）的超级优势。不要浪费未来2-3年去强迫自己“专注单一领域”，而应该把多种兴趣整合成一份有意义、可赚钱的生活方式。下面是文章主要观点的提炼（对应原文7大板块）： 1⃣专家时代已经不再吃香工业时代推崇专业化（像工厂流水线），但这导致人变得愚蠢、依赖性强。  真正成功靠三点：自我教育（自己主导学习）自我利益（追求真正对自己和他人有益的事，而不是公司/系统的利益）、自给自足（不把判断权、学习权外包给别人）。  这三者自然催生“通才/泛化者”（generalist），他们能跨领域整合想法、快速适应，而纯专家容易被取代。 2⃣我们正处于第二文艺复兴，抓住机会  像印刷术引发了文艺复兴一样，今天的互联网、AI让知识极度廉价、任何人一生都能掌握多领域。  多种兴趣会产生独特的“视角残留”（residue），形成别人（甚至AI）模仿不了的交叉洞见，这是你最后的护城河。  例子：达芬奇不只画画，还搞工程、解剖；现代人结合心理学+设计、销售+哲学、健身+商业，就能创造别人想不到的价值。 3⃣如何把多种兴趣变成可持续赚钱的生活  需要一个“容器”（vessel）把兴趣整合起来 → 成为创作者（creator）。  把社交媒体当成“公开做笔记”的地方，学习过程本身就是内容。  吸引注意力 → 卖产品（课程、系统、软件等），而不是找一份压抑兴趣的工作。  这样学习=研究、工作=创作，自由度极高，还能快速试错、推出新产品。 4⃣把自己变成一门生意  创业不再需要大资本，只需笔记本+网络。 放弃“技能型路径”（学一门技能→教→卖，容易变成新9-5）；选择发展型路径： ◦追求自己的目标（打造个人品牌） ◦分享学到的东西（内容） ◦帮别人更快达到同样目标（产品） 把自己当成客户画像，帮“过去的自己”解决问题。 5⃣品牌 = 一个环境/世界  品牌不是头像+简介，而是读者3-6个月后脑海中积累的对你的整体印象。  它是你的人生故事、世界观、哲学在所有触点（帖子、Newsletter、页面设计等）的体现。 先写出自己的人生低谷、成长经历，用故事过滤所有内容，保持一致性。 6⃣内容 = 新颖视角  互联网信息爆炸，胜出的靠高信号、高密度想法。  建一个“创意博物馆”（swipe file）：收集旧书、优质博客、顶级账号的高密度想法。筛选标准：有表现潜力（别人会喜欢）+让你兴奋（自己真感兴趣）。  练习：把同一个想法用1000种不同结构写出来（钩子、列表、故事等），提升表达力。 7⃣系统就是新产品  现在人们不想要泛泛的解决方案，他们想要你的独特系统（你自己验证过、迭代出来的方法）。  例子：Dan Koe 的“2小时写作”系统，就是他解决自己内容创作难题的实验结果（收集想法→模板→跨平台复用→Newsletter为核心）。  系统是个人经验的结晶，很难被复制。总结一下，Dan的意思是：把好奇心、多种兴趣通过自我教育 → 公开分享 → 打造系统 → 卖给同频人群这条路径，变成自由、充实又有收入的生活方式。 ~~~~~~~~~~~~~~ 我非常赞同这个思路，原因在于能支撑我多年如一的学习，分享的重要逻辑就是上面的这一条。币圈认知更替速度非常快，你真想学几乎每天24小时全部投入进去都学不完。我对Defi，对交易，对项目投研，对Vibe Coding等知识的学习基本都是自我教育。但如果我想要输出给更多的读者，我需要把自己学习的东西系统化，印证有效，然后才能公开分享出去，并逐步沉淀为自己的铁粉群体。大部分收益我依然来自于自己学习体系的投资和交易逻辑，但分享后带来的额外收益会让我更愿意投入到自我学习这个循环里，并试图做的更好。而且这个循环让我能享受自由充实且有收益的生活方式，让我很乐在其中。他文中的1/2/3/4 都是我已经有做到的，但5/6/7 我还有待提高。 “品牌不是头像+简介，而是读者3-6个月后脑海中积累的对你的整体印象。” -- 我兴趣很杂，到底我应该如何更进一步凝聚读者们对我个人品牌的印象？ -- 需要思考。现在AI的平民化，便利化，让“超级个体”更加容易成为之前一个企业所能达到的规模和影响力。我们的确处在第二个文艺复兴的黄金节骨眼上。我最近几个月远比过去几年焦虑，焦虑的不是如何赚钱，而是如何在这股浪潮里不被淘汰下去。 Dan Koe这篇文章帮助我把过去一些思路理的更清晰了，希望也能对你们有所帮助。 2026，我们一起变的更好

显示更多

0

84

256

30

转发到社区

fin@fi56622380

2026.04.29 04:38

AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发，解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长，为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽同时讨论了，为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大，乐观派认为AI带来的需求比以前要大的多，但市场主流仍然认为前几次上升周期也有需求每年20%+增长，这次又有什么不一样呢？AI不影响HBM和传统DRAM一样有commodity属性，一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。我们可以从算力芯片架构视角,从第一性原理出发，来拆解和推演一下这个问题：为什么这次真的不一样 ------------------------------- 历史：CPU算力时代很久以来，我们都处在CPU主导算力的时代，CPU的最高级KPI就是performance，跑的更快，所以每一代的CPU都用各种方法来提高跑分，最开始是频率上升，后来是架构演进superscaler等等这个时候为什么DDR不需要很快的技术进步速度？比如DDR3到DDR5竟然经历了15年之久因为这个时期的DDR的角色是纯粹的辅助，而且辅助功能极弱，以业界经验，DDR的速度即便是提高一倍，CPU的performance一般只能提高不到20%这个量级为什么DDR带宽速度提高了用处不大？两个原因 1. CPU设计了各种架构去隐藏 DDR延迟，比如superscaler，加大发射宽度，用海量的ROB和register renaming来提高并行度隐藏延迟，一级缓存cache，二级缓存cache，削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高，大部分日常负载比如打开网页，DDR带宽是严重过剩的，甚至云端负载也就是说，在CPU时代，DDR的带宽速度是不太有所谓的，DDR4和DDR5除了少数游戏就没啥差别，甚至JEDEC标准也进步缓慢。另外，绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可，app的size增长没那么快，导致对DDR的容量需求也较为缓慢。所以最近十年来，平均每台电脑上的DDR容量大概从7~8GB变成了23GB，十年只增长了3倍。而这部分升级缓慢直接影响了营收，size容量计价是赚钱的主要方式，速度的提高只是技术升级，提高size的单价，这两个的升级需求都不大，需求主要是随着电脑/手机数量增长而增长所以DRAM在带宽速度和容量这两个维度上，一直是都是芯片产业锦上添花性质的附属品，DDR升级带来的边际效用是很低的，跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代，计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代，不再像CPU那样只看跑分，最高级的KPI不再是算力TOPS/FLOPS，而是token的成本，特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度，因为在agent时代，很多任务变成了串行，token吞吐速度成了用户体验的重要瓶颈。这也是为什么老黄发明AI工厂概念的原因：最低成本的输出最多token，同时尽量提高token吞吐速度 AI训练时代，老黄的经济学是TCO(total cost ownership)，买的GPU越多，省的越多而老黄在推理时代的token经济学是： AI推理的毛利润很可观，所以逻辑已经转换成：Nvidia GPU是这个世界上让token单价最便宜的GPU，买的GPU越多，赚的越多最高的KPI变成了Pareto frontier曲线，在提高token 吞吐throughput和提高token速度两个维度上尽量优化（见图一） NVIDIA 的 token factory 代际进步，其实是在把整条 Pareto frontier 往右上推，这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链，如何从token吞吐量指数型增长的本质出发，推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长单卡GPU推理单线程batch size = 1的时代，token吞吐只有一个维度，就是HBM的带宽速度，带宽速度越高，token吞吐越大但进入NVL72的年代，推理不再是单卡GPU时代，而是72个GPU + 36个CPU整个系统级别的token工厂，把HBM带宽和算力用满，获得极致的token吞吐量 Token 吞吐throughput的增长，依赖两个东西：同时批处理的请求数 X 每个user请求的平均token速度也就是batch size X per user token 速度以Rubin NVL72为例，在平均token速度是100 token/s的情况下，同时批处理1920个请求，得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW（0.12MW）的功率，所以得到单位MW能处理1.6M token/s （见图一）所以，我们需要想方设法提高这两个参数：批处理数量batch size和per user token的平均速度，这两者相乘就是我们的最高KPI，也就是token的吞吐量 ------- 第一个参数：batch size的增长，瓶颈在HBM size 批处理量里的每一个请求req，都会自带kv cache，这部分kv cache是需要存在HBM里的，大小大概在几个GB到数十GB不等因为hot kv cache是随时需要高频高速读取，所以必须放在HBM里，比如一个大模型的层数是80层，那么每一个token的生成阶段，都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长，会带来hot kv cache的线性增长又因为这个批处理量的所有请求的hot kv cache，都要放在HBM上，这也就带来了HBM size必须要随着批处理量batch size线性增长就像是机场接驳车，登机口尽量快的接旅客到飞机，HBM size小了，相当于接驳车size小了，就得多接一趟结论是：批处理量的数量batch size，瓶颈依赖于HBM size的增长 --------- 第二个参数：每个user请求的平均token速度，瓶颈在HBM带宽大模型decode阶段的速度，瓶颈取决于HBM的带宽速度，因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现，在batch不那么大的情况下，把激活权重这个部分搬到了SRAM上，但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高，生成每一个token的速度也就越快，基本上是线性对应的就像是机场接驳车，登机口尽量快的接旅客到飞机，hbm本身带宽速度就像是接驳车的车门有多宽，门越宽，旅客上接驳车越快 GPU的其他配置，都是在适配batch的增长以及要让token compute的速度配平HBM的增长，甚至会用多余的算力来获得部分的带宽（比如部分带宽压缩技术） —----- 在那个接驳车的比喻例子里接驳车的车厢大小 = HBM Size（容量）：决定了一次能装下多少名旅客（也就是能同时装下多少个请求的 KV Cache）。车厢越大，一次能拉载的旅客（Batch Size）就越多。如果车太小，想拉100个人就得分两趟，系统整体的吞吐量就上不去。接驳车的车门宽度 = HBM Bandwidth（带宽）：决定了旅客上下车的速度。门越宽，大家呼啦啦一下全上去了（Decode/生成Token的速度极快）。如果门很窄，哪怕车厢巨大能装200人，大家也得排着队一个一个挤上去，全耗在上下车的时间里了。旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此，我们从逻辑上推演出了token经济学的硬件需求第一性原理： Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI，实际上是高度依赖于HBM的两个维度的进步的如果要维持token throuput每一代两倍的增长，实际上意味着，每一代的单GPU上，HBM size X HBM BW带宽之积要增长两倍！这也是历史上第一次，HBM内存的size可以影响最高的KPI token throughput！要验证这个理论，可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput，和HBM size X HBM BW 放在同一个图里比较（见图二）可以发现，这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快，毕竟HBM决定的是天花板，实际上这个天花板增长的利用率utilization是很难达到100%的，也就是说，HBM size x HBM 带宽就算增长1000倍，其他算力和架构的配合下，很难把这1000倍的天花板潜力全部榨干这条曲线不是巧合，而是系统最优化的必然解 throughput = batch × Bandwidth，这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢？软件的优化会不会降低带宽的需求？降低HBM的需求？这跟硬件是独立两个维度的，这好像在问，如果CPU上的软件优化了之后跑的更快，是不是CPU就十年不用发展了？反正软件跑的更快了嘛这样的话，CPU厂还能赚得到钱吗？CPU想要存活下去，只有一条路可走，在标准benchmark，不考虑软件优化，每一代CPU必须要跑分更高，不然就卖不出去 GPU也是一样，软件优化如何，和自己的token吞吐量KPI每年都要大幅进步，是两回事只要token的需求继续增长，对token throuput的追求就绝不会停止，那么对HBM size X HBM 带宽的追求也不会停止如果HBM size和HBM 带宽发展慢了，老黄一定会亲自到御三家逼着他们技术升级，因为这就是老黄gpu的天花板，天花板要是钉死了不进步，老黄的GPU还能卖出去吗？当然了，Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分，比如LPU就是一个很好的尝试，把Pareto frontier从另一个角度改善了很多（右半边高token速度的部分） —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代，在这条由指数级需求铺就的单行道上，以一种近乎宿命的方式走到了产业史诗的主舞台中央推理范式第一性原理演化到这一步，只要老黄还要卖GPU，HBM就必须翻倍，而且必须代代翻倍。这是supply side的内生压力，与AI需求无关，与宏观周期无关，与hyperscaler的心情也无关剩下的问题，只有一个：当需求被物理锁定为指数增长的时候，供给侧的三个玩家，会不会还像过去三十年那样，亲手把自己再拖回一次周期的泥潭？

显示更多

0

61

1K

303

转发到社区

阑夕@foxshuo

2026.03.24 06:59

很突然，OnlyFans的老板Leonid Radvinsky死了，只活到了43岁，据说是癌症长期治疗无效，氪金都没救回来。很多报道说他是OnlyFans的创始人，这不太准确，创办OnlyFans的是英国人Tim Stokely，这个平台最开始主要为音乐人和网红提供表演变现服务，没有大尺度内容，直到2018年被卖给了Leonid Radvinsky，才真正转型成功。是Leonid Radvinsky一手把OnlyFans从一个总用户量不超过1000万人的小众网站变成了活跃用户超过2亿的成人平台。因为他就是搞黄色起家的，1999年，他才17岁，就建立了色情网站导航站群，老登们应该记得这种古典互联网的商业业务模式，类似hao123，很赚钱。 Leonid Radvinsky那会儿就很有商业头脑，或者说路子很野，他会在导航站上放置萝莉甚至兽交的网站标题，但实际上只会链接到普通的色情网站，于是既没有实际违法，又骗到了很高的点击量。靠着倒卖流量，他在美国读西北大学的时候，每年就有180万美金的睡后收入，毕业之后，他又在2004年创办了MyFreeCams，这是一个通过网络摄像头进行收费色情表演的网站，几年内就做到了500万付费用户，年入千万美金。他的运营风格也是一如既往的大胆，MyFreeCams在发垃圾邮件推广时，假冒微软和亚马逊的名义，告诉用户只要注册就能拿到现金补贴——瞧瞧人家这增长黑客的玩法——后来被微软和亚马逊的法务重拳出击，赔了一大笔钱。总之，他当初收购OnlyFans也是目的性极强的选择，把自己前半生积累下来的经验都用在了这个平台上，然后又特别幸运的——对他而言——赶上了新冠疫情，大家经常憋在家里，只能通过网络倾泻欲望，OnlyFans直接原地起飞，拿到了时代馈赠的丰厚回报。在Leonid Radvinsky的治下，OnlyFans完全作为私营公司运作，不扩张、不融资、不开发App，而且只给他一个人分红，刨开经营成本，每年的利润都打到他一个人的账户里，可以说是特别「纯粹」了。根据英国财政局的披露文件，Leonid Radvinsky总共从OnlyFans拿到了20亿美金左右的分红，但这甚至不到他总资产的一半——你就知道他还有多少隐秘事业了吧——「福布斯」杂志把他排在全球富豪榜的第869名，身家47亿美金。去年，OnlyFans开始在资本市场寻找买家，打包价从80亿美金一路降低到55亿美金，从PE来看属于贱卖了，但还是很多人不理解为啥要这么急于出货，现在知道答案了，原来是自知命不久矣⋯⋯ 有命赚钱，没命花钱，世事就是难料，死亡这事儿，么得关系可找啊。

显示更多

0

25

287

32

转发到社区