注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 読売新聞
読売新聞 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 読売新聞 的推特
【民調顯示】多數日本人反對向中東派遣軍艦 美國當前繼續向盟友施壓,要求幫助確保霍爾木茲海峽的安全。《讀賣新聞》一項民調顯示,67%的受訪者反對向該地區派遣自衛隊,ANN民調中也有52%反對。兩項調查顯示,日本首相高市早苗(圖左)內閣的支持率分別為71%和65.2%。
显示更多
若日本通過類似美國的相關法律,必將讓那些在日本「明修棧道、暗渡陳倉」的偽民運人士及中共代言人成為熱鍋上的螞蟻!樂見其成。👏 新聞摘要:美國阿卡迪亞市華裔市長王愛琳涉「中共代理人」被捕 美國司法部於 2026 年 5 月 11 日證實,南加州阿卡迪亞市(Arcadia)華裔市長王愛琳(Eileen Wang),因涉嫌充當「中國政府非法代理人」遭聯邦政府起訴並逮捕。王愛琳已與檢察官達成認罪協議(司法交易),並於起訴當日辭去市長與市議員職務。 一、 核心犯罪事實 •受命發布親中宣傳: 聯邦調查局(FBI)指出,58歲的王愛琳於 2020 年至 2022 年間,直接聽從中國官員指引,利用其經營的華裔美國人新聞網站,大量發布符合北京立場的政治文宣。 •否認新疆人權問題: 起訴書指出,她受中國官員指示,公然在媒體上發表文章,否認新疆存在種族滅絕和強迫勞動。 •未依法登記為外國代理人: 王愛琳在明知法規的情況下,未向美國司法部登記,秘密執行外國政府的統戰與宣傳任務。 二、 涉案背景與後續 •政治生涯告終: 王愛琳約 30 年前從中國移民美國,2022 年當選市議員,2026 年 2 月才剛接任市長,任期僅約 3 個月便因案辭職。 •市府全面切割: 阿卡迪亞市經理人多米尼克(Dominic Lazzaretto)發表聲明,強調此起訴案僅屬王愛琳個人行為,與市府的財政、日常決策或公共事務無關。 •面臨刑責: 根據美國聯邦法律,非法充當外國代理人重罪最高可判處 10 年監禁。王愛琳預計將於數週內正式在法庭提交答辯並完成認罪。 此案已引發高度關注,繼中文媒體報導後,日本《讀賣新聞》、《朝日新聞》、《日本經濟新聞》等主流媒體也作了相關報導。
显示更多
*#牛市#**是價格上漲時期——樂觀主義、盈利和 #FOMO# 主導。**#熊市#**是價格下跌時期——恐懼、虧損和投降情緒主導。兩種市場的策略完全不同。 --- 每位加密幣投資者都會經歷牛市和熊市。理解差異並調整行為的人能夠生存和繁榮。不理解的人通常在頂部買入,在底部賣出。 ## 什麼是牛市? 牛市是資產價格持續上漲的趨勢——通常定義為從近期低點上漲 20% 以上。 **特徵:** - 價格持續創新高 - 積極的新聞情緒主導 - 新資金湧入(散戶 FOMO、#機構買入)# - 社交媒體和新聞充滿加密幣熱情 ## 什麼是熊市? 熊市是持續的下跌趨勢。加密幣熊市通常更為嚴重,常見 70–85% 的回撤。 **特徵:** - 價格持續創新低 - 負面新聞主導(監管打壓、交易所倒閉) - 資本外流 ## 牛市策略 **做:** - 持有核心倉位(#BTC、##ETH)——不要因恐懼過早賣出# - 在投機性山寨幣上漲 3–5 倍時逐步獲利了結 - 在看漲信號達到頂點**之前**制定退出計劃 **不做:** - 在已上漲 1,000% 的幣上 FOMO 追買 - 使用高槓桿 ## 熊市策略 **做:** - 以較低價格定期定額買入 BTC 和 ETH - 持有穩定幣並逐步部署 **不做:** - 在絕對底部恐慌性賣出 BTC/ETH - 在已失敗的山寨幣上「接飛刀」 ## 2026 年市場所處位置 根據 2024 年減半周期分析,2026 年處於牛市末期/潛在頂部區域。風險升高,但某些未被充分認可的板塊可能仍有機會。 非財務建議。詳細分析請參閱我們的[市場周期指南]( --- ## 延伸閱讀 - [LookIntoBitcoin — 恐懼與貪婪指數]( - [CoinDesk — 如何在熊市中生存](
显示更多
反了反了 昨晚评论里提了一嘴,说2001年我读大学时每个月的生活费是700-800,同学里还有不少单月上千的。结果我看后台针对那条留言的评论叠了几百楼,主要是惊叹和质疑,认为我夸大了金额。 为此我特地找我妈确认,她大一时每个月给我的生活费是700,从大二下半学期开始我就让她不用给了,因为我当时收入已经比她高。 至于我的那几个哥们,今天我在群里问了一下,确实都是700-1000这个区间。另外还有两个关系要好的女同学,回忆大学时生活费是1000打底,要是有旅游什么的还经常花超了。怪不得互联网上老说在中国投胎的上上签是江浙沪独生女,当时在同学圈子里大家都习以为常,直到后来接触了内地省份的一些朋友才知道地区差异很大。 网友留言的几百楼我都看完了,有和我同龄的大学生当初生活费只有200-300,真不容易,每个月吃饭+手机话费就剩不下几个钱了。我把老婆叫过来问她当时生活费多少钱,她在北航每个月500,被我嬉皮笑脸的挤兑了一番。她说有个师兄毕业了,把家教的客户介绍给她,周末去上课一个小时酬劳100,还能管晚饭,这大大的补贴了生活开销。但好景不长,人家孩子高三毕业就没活了。 我当时大概是大学生里赚钱赚的最easy的,一个下午坐在电脑前噼里啪啦打字,稿费就有300-400,一个月接4-5篇,挣的钱就花不完了。那个时候还不懂财经投资,写的主要是游戏和体育。因为我经常在网络论坛上发贴滔滔不绝,会被媒体编辑看到,就私信我约稿,所以在人多的场合不要低调,勇于表达和展示自己,就会获得更多机会。 …… 回想我这半辈子,人生轨迹被互联网多次改变。高中的时候沉迷网吧,在家人看来是屡教不改的玩物丧志,但其实我上网并不只是玩,别人是传奇一刀999,我喜欢探索各大互联网论坛社区,学习各类互联网工具。 举个例子,我2000年就已经用mp3听音乐了,这事你现在乍一听觉得没啥,但是在2000年没有腾讯音乐、没有网易音乐、没有酷狗、甚至大部分网吧都没有宽带,还用拨号上网。我能在互联网上找到自己想要的歌曲,用网际快车下载到电脑,再导到mp3,亦或者去华军软件站下载工具,把dvd碟片里的歌曲转格式,再导到mp3。 一个2000年的高三学生能完成这些操作,其实已经说明我拥有一些能在互联网时代发光的特质,只是我的长辈们当时不能理解这一切,他们一次次把我从网吧揪出来臭骂。 他们这么做也没错,家长都希望孩子好,只是他们以往的人生经验已经很难规划我的未来。我妈以前教训我的时候经常说的一句话是,我未来能有她一半的出息就谢天谢地了,大二之后她就不说了,原因见上文 这首歌老网民还有印象吗?是我买了mp3后往里面导的第一首歌。 我以前在网上看到过一句很有启发的话,30年后的社会,大概有一半的工作岗位现在都还没出现过。 是这样的吧,30年前的中国别说还没有互联网行业,新能源行业,甚至连快递、外卖、网约车都还没有,所以父母在培养孩子时应该保持一定的开放性,不然就会错过一些可能性。 …… 再说说今天有印象的新闻。 黄金突破3900+,刷新史高,这其实也不算啥大新闻,机构现在都看到4000+,区别是有人觉得明年到,有人觉得月底到,有人觉得本周到。 北京房地产中介协会发文:禁止恶意压价,不得PUA房主。这条标题看到后我还是挺感慨的,我之前20年经历过北京楼市的黄金时代,见识过一边倒的卖家市场有多么强势。以前卖房的真是大爷,税费+佣金默认都是买家承担,一套房到了周末排队预约看房,你还在犹豫讨价还价,别人已经抢着把订金付了。 现在竟然演变为中介恶意压价,以及中介pua房东,简直倒反天罡。今年资本市场全面上涨,而房地产已经让过去10年买入的人在不同程度产生亏损,像这种历史级别的岔路口一旦走错就会白白奋斗5-10年。 我今天打开贝壳看了一眼我2016年卖掉那套房子的同户型,已经有人报价比我当时卖的还便宜5-10%了,成交价还能谈。 今天新闻上看到全国各个景点都是人山人海,我有一个小小的建议,尽量选临近关门的时间去,比如一个景点6点关门,大概玩1个半小时就差不多了,那就4点半入场。这样可以最大程度避开高峰人流,是没有办法的办法。 今晚就这些,长假进度1/7,慢慢玩。
显示更多
# AI 行业三个月变天,模型榜单已经解释不了全部 1小时46分钟里,这期《半球观察》播客的主持人 把 DeepSeek V4、约 1000 条 Cursor 工作轨迹、OpenClaw 出圈、Manus 交易流产和 AI 中转站放在同一张桌上。单看每条都像行业新闻,连起来看就很刺眼:AI 公司正在被新的尺子衡量。模型榜单还重要,但已经解释不了全部。 过去我们习惯问一个问题:谁的模型更强? 现在还得问另一组问题:谁有真实任务数据,谁掌握用户入口,谁能把价格打下来,谁能穿过监管和资本的窄门。 > **编者注:** 这篇按播客原文提炼判断。DeepSeek 估值、Cursor/xAI 交易、Manus 价格等数字均先按“节目说法”处理,不能直接当作已确认事实。 ## DeepSeek 的强,变成了另一种强 主播对 DeepSeek V4 的评价并不客气。V4 Pro 被认为 reasoning 过长,很多任务里像是在思维链中自己和自己打架。V4 Flash 的体感更好,接近 GPT5.4 mini 或 instant API 的水平,但这已经不是 R1 那种“全行业被迫重新估值”的时刻。 这就产生了第一个反差:DeepSeek 仍然技术很硬,但它的产品冲击力没有天然压倒别人。 节目里提到,Kimi、GLM、MiniMax 等国产模型在 coding 和迭代速度上都给了 DeepSeek 压力。DeepSeek 自己也因为适配国产硬件、减少 CUDA 技术债、拥抱 TileLang 等路线,承受了延期和成本变化。 这听起来像掉队。 但节目给了另一个定位。 节目里说“DeepSeek 正好填补了这个空白”。 这个“空白”指的是 OpenAI 不再开放权重、不再详细公开技术路线之后,全球开发者和研究者仍然需要一个前沿模型的公开参照物。DeepSeek 的价值就从“谁最强”变成“谁还愿意把技术路线摊开”。 这是一种新的强。 它可能不总是最会做产品的公司,也不一定每个版本都压住榜单。但它像开源社区的技术坐标系。大家看它的 report,看它的注意力机制,看它的后训练方法,再把这些东西吸收到自己的模型和产品里。 所以,写 DeepSeek V4 不适合写成“王者归来”或“彻底掉队”。更准确的说法是:DeepSeek 正在从爆款模型公司,变成公开 research lab 的基础设施。 DeepSeek 没有消失,它只是从王者变成了坐标系。 ## 数据飞轮开始压过架构叙事 这期最有信息量的技术段,落在 OPD 上。 节目用一个很好的类比解释 On Policy Distillation:传统后训练像老师先写一大本习题集,学生之后自己看、自己背、自己消化。问题是题太多,领域太杂,学生容易学歪,甚至出现 reward hacking。 OPD 的感觉更像现场教学。 > “学生遇到不会了,老师就过来告诉他为什么不对。” 写代码时,代码老师在旁边;做数学时,数学老师在旁边。学生先尝试,老师实时纠错,模型训练从离线习题集变成在线反馈。 这个机制把问题引向更深一层:老师从哪里来? 答案是数据。更具体地说,是真实任务里的高质量轨迹。 节目提到 Cursor 的 Composer 2 争议时,有一个关键细节:Cursor 被转述为在 Kimi base model 上加入约 1000 条真实用户工作轨迹做 SFT,使 coding 表现明显强于原始 base model。这个数字需要核查,但方向很重要。 如果模型架构的边际差距变小,真实任务数据就会变成更贵的东西。 Claude Code 和 Codex 为什么会越做越强?节目里的解释是,它们有真实工程师每天使用的轨迹:怎么打开项目,怎么读代码,怎么改错,怎么跑测试,怎么回退,怎么完成一个长任务。 这些数据很难从普通互联网文本里直接获得。它是任务过程。 这也是 Cursor、Claude Code、Codex、OpenClaw、Manus 这一类产品被重新定价的原因。它们表面是工具,底层是数据采集口。谁的用户每天把真实任务交给它,谁就能反过来训练更懂任务的模型。 模型能力当然还重要。但当大家都足够强时,数据会把差距重新拉开。 模型教会产品说话,用户轨迹教会模型做事。 ## OpenClaw 出圈,说明入口开始变形 节目把 OpenClaw 称为 Agent 的 ChatGPT 时刻。 这句话很大,但它有具体场景支撑。主播把 OpenClaw 接进 Telegram 家庭群,当成一个会记忆、会查资料、会调用 skill 的“电子宠物”。更重要的是,在这个框架里,本地 27B 模型和 GPT5.5 的体感差距被缩小了。 原因很简单:OpenClaw 有 memory,有 skill,有连续任务,有工具调用。 这就改变了用户感知。单独问一个小模型,它可能不如大模型;把它放进一个 agent 框架里,它能记住昨天说过什么,能查资料,能跑工具,能把一个任务接着做下去。用户看到的是任务完成,而不是模型参数。 这也是 OpenClaw 出圈的意义。它把 skills 从程序员小圈子带到普通人场景。 节目里提到阿里的电商出海 agent。它可以帮助小商家处理 Shopify、商品上架、趋势分析、网站设计、运营链路。过去这些工作可能需要助理、外包、懂代码的人和运营经验。现在一个小老板可能第一次感到,agent 能把一整套流程接起来。 这个变化比模型榜单更接近商业。 因为用户不会每天比较 benchmark。他们会比较:这个东西能不能帮我把店开起来,能不能生成网页,能不能做 PPT,能不能整理调研表格,能不能少雇一个人。 Agent 的入口价值,不在会聊天,而在能接活。 ## Manus 的稀缺性,被同类产品反向证明 OpenClaw 出来以后,很多人会自然认为 Manus 不稀缺了。节目里的判断正好相反:OpenClaw 爆火,反而证明 Manus 更稀缺。 这个判断的逻辑是产品体验。 主播说,很多 computer use 或 open cloud 服务“根本不想用”,Perplexity 的 computer use 被点名为几乎不可用。相反,Manus 能做出详尽网页、PPT、真实调查表格,任务保持程度更好。 换句话说,壳不稀缺,稳定交付稀缺。 这和 ChatGPT 早期很像。聊天界面谁都能做,真正难的是持续给出有用答案。Agent 时代也是一样。浏览器自动化、工具调用、任务规划、记忆系统、失败恢复,单独看都不是秘密。难的是把它们组合成用户愿意反复使用的产品。 Manus 交易流产把这个问题又推到监管层面。 节目讨论了 Meta 交易被撤销、VIE、IP、人才和公司归属问题。这里最值得保留的不是情绪判断,而是创业者面临的新现实:AI agent 这种产品绑定了用户数据、任务轨迹、人才供给、模型合作和国家监管。 对中国 AI 创业者来说,路径选择可能会提前。你从第一天就要想清楚,是进入国内生态,还是走海外资本路径;是把团队、IP、数据和客户都放在一个监管框架里,还是冒着未来交易被叫停的风险做跨境结构。 这已经超出普通商业选择。 这是 AI 产品变成战略资产后的副作用。 Manus 的问题不是卖没卖成,而是它到底属于哪里。 ## AI 开始说钱,也开始被低价倒卖 节目后半段最现实。 大厂模型开始收费,推理框架项目开始公司化,IPO 和融资叙事吸走市场流动性,AI 中转站开始变成生意。主播说得很直接: 节目里那句“大家都开始说钱了,不再说 AGI 的梦想了”,把这层现实说得很直。 这句话有点刺耳,但它解释了很多现象。 当模型差距大时,用户会追逐最强模型。当多数日常任务都已经够用时,用户会开始追逐便宜、稳定、可接入、不封号、不断线。AI 中转站就在这个缝隙里长出来。 节目提到 Sub-to-API 这类工具,把 Claude 或 Codex 的订阅转换成 API,再用更低价格分发。也提到部分中转站可能收集用户数据,甚至标称 Claude,实际替换成更便宜的国产模型。 > **编者注:** AI 中转站涉及服务条款、数据安全和潜在欺诈风险。这里仅按节目内容记录产业信号,不构成使用建议。 这说明模型正在商品化。 最前沿模型、企业级合规服务、真实工作流数据仍然贵。但对普通聊天、搜索、轻量写作、心理陪伴、日常问答来说,很多用户已经不愿意为“最强”付出太高溢价。 这会倒逼模型公司回到互联网逻辑:获客、留存、价格、渠道、生态、数据闭环。 AGI 叙事还在,商业账本已经来了。 ## 最后 这期《半球观察》最适合被整理成一组暴论,因为它更像一张行业雷达图。DeepSeek 代表公开技术路线,Cursor 代表 coding 数据,OpenClaw 代表 agent 入口,Manus 代表可交付产品和监管敏感性,AI 中转站代表模型商品化。 把这些点连起来,结论很清楚:AI 行业正在从“模型公司竞赛”变成“模型、产品、数据、资本、监管共同定价”的复杂游戏。 接下来不能只看模型榜单。 要看四个信号。 第一,DeepSeek 后续版本能不能重新打出产品体验上的压倒性差距。如果不能,它仍然有开源坐标系价值,但商业位置会不同。 第二,Claude Code、Codex、Cursor、OpenClaw、Manus 谁能沉淀最高质量的任务轨迹。真实用户每天交出的工作过程,会比静态语料更贵。 第三,agent 产品能不能稳定交付。会调用工具不稀奇,能把网页、PPT、调研、代码修改交付到用户满意,才是分水岭。 第四,价格和监管会不会重塑模型分发。中转站、订阅转 API、模型替换套利、跨境交易叫停,都说明 AI 已经离纯技术讨论很远。 我对这期的最终判断是:模型能力仍然重要,但它已经不是唯一的解释变量。谁拥有入口,谁拥有数据,谁能把价格做到用户愿意持续用,谁能在监管和资本结构里活下来,谁才可能赢到下一阶段。 这也是它最值得写成文章的地方。暴论背后真正冲击人的,是我们判断 AI 公司的尺子正在换。 --- 原始播客:
显示更多
🔥日媒《读卖新闻》爆料:川习会上,习近平点名吐槽高市早苗&赖清德“威胁和平”,求川普“别支持”😂 川普并未附和,答道:“高市可不是应该被批的领导人!” 会后秒打电话给高市,详聊并且重申“日美同盟坚不可摧”😂🇯🇵🇺🇸
显示更多
0
22
262
164
转发到社区
最近彩虹钱包也要发币空投 在coinlist上面进行打新😂 链接: 之前还有钱包积分的应该是有空投的 你们自己看着办吧现在全是卖币 还有 @zama 要打新卖10%的币👇 而且还是密封式的荷兰拍啊说直白点 就是所有参与打新的用户自己博弈赌 目前还没有读详细的规则就怕是榨干最高价的人? 等等官方的详细规则再看是怎么回事吧 如果规则不是榨干最高价的人那么还是可以期待 起码如果你是有OG NFT的是值得期待的 榨干最高价的你们懂怎么回事吧? 我想知道空投多少? @zama #ZamaCreatorProgram#
显示更多
0
19
19
1
转发到社区
《 变成更好,更自由的自己 》 引用的这篇文章是我今天读到很有共鸣的一篇文章,尤其适合KOL这个赛道。不管你是否打算做KOL,都非常值得花点时间琢磨。 如果你用小红书,你会发现这哥们 @thedankoe 已经成了很多博主特别追捧的对象(养活了很多学习号😂😂)。 不过有一说一他是有干货的,在个人品牌和数字创作者领域非常有见地,也相当成功。 反鸡汤,反主流教育/工作观,很戳“不想一辈子打工的当代年轻人”。 好了,说说昨天他这篇长文说了啥。 ~~~~~~~~~~~~~ 拥有多种兴趣不是弱点,而是当今时代(他称为“第二文艺复兴”)的超级优势。 不要浪费未来2-3年去强迫自己“专注单一领域”,而应该把多种兴趣整合成一份有意义、可赚钱的生活方式。 下面是文章主要观点的提炼(对应原文7大板块): 1⃣专家时代已经不再吃香 工业时代推崇专业化(像工厂流水线),但这导致人变得愚蠢、依赖性强。
 真正成功靠三点: 自我教育(自己主导学习) 自我利益(追求真正对自己和他人有益的事,而不是公司/系统的利益)、 自给自足(不把判断权、学习权外包给别人)。
 这三者自然催生“通才/泛化者”(generalist),他们能跨领域整合想法、快速适应,而纯专家容易被取代。 2⃣我们正处于第二文艺复兴,抓住机会
 像印刷术引发了文艺复兴一样,今天的互联网、AI让知识极度廉价、任何人一生都能掌握多领域。 
多种兴趣会产生独特的“视角残留”(residue),形成别人(甚至AI)模仿不了的交叉洞见,这是你最后的护城河。
 例子:达芬奇不只画画,还搞工程、解剖;现代人结合心理学+设计、销售+哲学、健身+商业,就能创造别人想不到的价值。 3⃣如何把多种兴趣变成可持续赚钱的生活
 需要一个“容器”(vessel)把兴趣整合起来 → 成为创作者(creator)。
 把社交媒体当成“公开做笔记”的地方,学习过程本身就是内容。
 吸引注意力 → 卖产品(课程、系统、软件等),而不是找一份压抑兴趣的工作。
 这样学习=研究、工作=创作,自由度极高,还能快速试错、推出新产品。 4⃣把自己变成一门生意
 创业不再需要大资本,只需笔记本+网络。
放弃“技能型路径”(学一门技能→教→卖,容易变成新9-5); 选择发展型路径: ◦追求自己的目标(打造个人品牌) ◦分享学到的东西(内容) ◦帮别人更快达到同样目标(产品)
把自己当成客户画像,帮“过去的自己”解决问题。 5⃣品牌 = 一个环境/世界
 品牌不是头像+简介,而是读者3-6个月后脑海中积累的对你的整体印象。
 它是你的人生故事、世界观、哲学在所有触点(帖子、Newsletter、页面设计等)的体现。
先写出自己的人生低谷、成长经历,用故事过滤所有内容,保持一致性。 6⃣内容 = 新颖视角
 互联网信息爆炸,胜出的靠高信号、高密度想法。 
建一个“创意博物馆”(swipe file):收集旧书、优质博客、顶级账号的高密度想法。筛选标准:有表现潜力(别人会喜欢)+让你兴奋(自己真感兴趣)。
 练习:把同一个想法用1000种不同结构写出来(钩子、列表、故事等),提升表达力。 7⃣系统就是新产品
 现在人们不想要泛泛的解决方案,他们想要你的独特系统(你自己验证过、迭代出来的方法)。
 例子:Dan Koe 的“2小时写作”系统,就是他解决自己内容创作难题的实验结果(收集想法→模板→跨平台复用→Newsletter为核心)。
 系统是个人经验的结晶,很难被复制。 总结一下,Dan的意思是: 把好奇心、多种兴趣通过自我教育 → 公开分享 → 打造系统 → 卖给同频人群这条路径,变成自由、充实又有收入的生活方式。 ~~~~~~~~~~~~~~ 我非常赞同这个思路,原因在于能支撑我多年如一的学习,分享的重要逻辑就是上面的这一条。 币圈认知更替速度非常快,你真想学几乎每天24小时全部投入进去都学不完。我对Defi,对交易,对项目投研,对Vibe Coding等知识的学习基本都是自我教育。 但如果我想要输出给更多的读者,我需要把自己学习的东西系统化,印证有效,然后才能公开分享出去,并逐步沉淀为自己的铁粉群体。 大部分收益我依然来自于自己学习体系的投资和交易逻辑,但分享后带来的额外收益会让我更愿意投入到自我学习这个循环里,并试图做的更好。 而且这个循环让我能享受自由充实且有收益的生活方式,让我很乐在其中。 他文中的1/2/3/4 都是我已经有做到的,但5/6/7 我还有待提高。 “品牌不是头像+简介,而是读者3-6个月后脑海中积累的对你的整体印象。” -- 我兴趣很杂,到底我应该如何更进一步凝聚读者们对我个人品牌的印象? -- 需要思考。 现在AI的平民化,便利化,让“超级个体”更加容易成为之前一个企业所能达到的规模和影响力。我们的确处在第二个文艺复兴的黄金节骨眼上。 我最近几个月远比过去几年焦虑,焦虑的不是如何赚钱,而是如何在这股浪潮里不被淘汰下去。 Dan Koe这篇文章帮助我把过去一些思路理的更清晰了,希望也能对你们有所帮助。 2026,我们一起变的更好
显示更多
0
84
256
30
转发到社区
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
61
1K
303
转发到社区
很突然,OnlyFans的老板Leonid Radvinsky死了,只活到了43岁,据说是癌症长期治疗无效,氪金都没救回来。 很多报道说他是OnlyFans的创始人,这不太准确,创办OnlyFans的是英国人Tim Stokely,这个平台最开始主要为音乐人和网红提供表演变现服务,没有大尺度内容,直到2018年被卖给了Leonid Radvinsky,才真正转型成功。 是Leonid Radvinsky一手把OnlyFans从一个总用户量不超过1000万人的小众网站变成了活跃用户超过2亿的成人平台。 因为他就是搞黄色起家的,1999年,他才17岁,就建立了色情网站导航站群,老登们应该记得这种古典互联网的商业业务模式,类似hao123,很赚钱。 Leonid Radvinsky那会儿就很有商业头脑,或者说路子很野,他会在导航站上放置萝莉甚至兽交的网站标题,但实际上只会链接到普通的色情网站,于是既没有实际违法,又骗到了很高的点击量。 靠着倒卖流量,他在美国读西北大学的时候,每年就有180万美金的睡后收入,毕业之后,他又在2004年创办了MyFreeCams,这是一个通过网络摄像头进行收费色情表演的网站,几年内就做到了500万付费用户,年入千万美金。 他的运营风格也是一如既往的大胆,MyFreeCams在发垃圾邮件推广时,假冒微软和亚马逊的名义,告诉用户只要注册就能拿到现金补贴——瞧瞧人家这增长黑客的玩法——后来被微软和亚马逊的法务重拳出击,赔了一大笔钱。 总之,他当初收购OnlyFans也是目的性极强的选择,把自己前半生积累下来的经验都用在了这个平台上,然后又特别幸运的——对他而言——赶上了新冠疫情,大家经常憋在家里,只能通过网络倾泻欲望,OnlyFans直接原地起飞,拿到了时代馈赠的丰厚回报。 在Leonid Radvinsky的治下,OnlyFans完全作为私营公司运作,不扩张、不融资、不开发App,而且只给他一个人分红,刨开经营成本,每年的利润都打到他一个人的账户里,可以说是特别「纯粹」了。 根据英国财政局的披露文件,Leonid Radvinsky总共从OnlyFans拿到了20亿美金左右的分红,但这甚至不到他总资产的一半——你就知道他还有多少隐秘事业了吧——「福布斯」杂志把他排在全球富豪榜的第869名,身家47亿美金。 去年,OnlyFans开始在资本市场寻找买家,打包价从80亿美金一路降低到55亿美金,从PE来看属于贱卖了,但还是很多人不理解为啥要这么急于出货,现在知道答案了,原来是自知命不久矣⋯⋯ 有命赚钱,没命花钱,世事就是难料,死亡这事儿,么得关系可找啊。
显示更多
0
25
287
32
转发到社区