过去 2 小时跟踪了全网 197 条新闻消息,筛出 5 条值得关注的核心信号。Kevin Warsh 正式入局美联储,配合智利铜矿与中东原油的双重实物紧缩,全球宏观定价正从 '增长博弈' 转向 '硬资产封锁'。
1. Kevin Warsh confirmed for 14-year Fed term, clearing the path to Chair. Senate voted 51-45 to install the 'sound money' hawk, marking the end of the Powell era. Market must now price in a Fed that prioritizes financial stability and currency strength over liquidity bailouts.
$TSM $NVDA
2. EIA extends Hormuz closure forecast through May with 10.8M bpd peak outage. Global inventories are projected to shrink by 2.6 million bpd in 2026, a massive revision from previous estimates. This is a structural supply shock that won't fully resolve until 2027.
$FCX $CPER
3. Chile copper output collapses as Escondida reports 15.7% production drop. March data shows Codelco also down 9.98% YoY, proving that physical mining limits are overriding price incentives. The 'sell-the-news' metal trade is being dismantled by raw physical scarcity hitting the tape.
$FCX $CPER
4. US DOE to inject billions into long-lead nuclear reactor components. As commercial power demand is set to surpass residential use for the first time in 2027, the government is treating baseload nuclear as a national security priority for the AI arms race.
$CEG $URA
5. SpaceX and Google pivot to orbital data centers to solve grid constraints. Moving compute to space bypasses terrestrial power limits and cooling bottlenecks, marking a paradigm shift in AI infrastructure. If scalable, this redefines the capital expenditure ceiling for the entire sector.
$GOOG $AVGO
That's the signal from this window. With Chile output dropping 15% and Hormuz closed through May, are you still betting on a soft landing for inflation? Repost if useful.
显示更多
这两天美股大跌,与流动性有关。本周五,鲍威尔大概率不宣布降息。美联储2.5万亿美元的逆回购资金池已缩水99%,仅剩220亿美元。自2022年量化紧缩政策启动以来,准备金首次出现下降,美联储承认流动性将很快面临考验。The Fed’s $2.5T Reverse Repo cash pool has collapsed 99%, with just $22B left.
显示更多
ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。
直译听着没问题,但中文母语者一听就觉得过于黏腻、用错了场合。模型有时还会自己加戏:“我就在这里,不逃,不躲,不闪避,稳稳地接住你。”
这句话已经被中文互联网玩成了梗。有人把 ChatGPT P 成一个救生气垫,张开双臂等着接住坠落的用户。重庆一位 20 岁的开发者 Zeng Fanyu 还做了个开源工具叫 Jiezhu,专门帮聊天机器人理解用户意图,他告诉 WIRED 做这个项目的动力就是觉得这个梗太好笑。OpenAI 自己也知道这件事,4 月发布新一代图像模型时,研究员陈博远(Boyuan Chen)画了一格漫画自嘲新模型又一次学会了说这句话。
类似的怪癖不止这一句。报道还提到,ChatGPT 中文里有时会无端冒出"砍一刀",拼多多最具辨识度的那句营销话术。
AI 写作检测工具 Pangram 的联合创始人 Max Spero 告诉 WIRED,这种"逮住一句话猛用"的现象叫 mode collapse(模式坍缩),是后训练阶段反馈机制走偏的副作用。他的原话是:我们不知道怎么告诉模型,这句话是好的,但连用十次就不再是好的了。
为什么偏偏是这一句?报道给了两个解释。
一是翻译错位。英文里 "I've got you" 是个口语短句,干脆利落,意思接近“我懂”或“我帮你兜着”。机械直译到中文就变成又长又煽情的"稳稳接住"。文章引用中国学者的研究,西方大模型训练语料以英文为主,它们生成的中文在介词使用和句子结构上都更像英文,读起来就是一股翻译腔。
二是讨好倾向。“接住”在中文里原本是心理咨询的专业用语,指为对方“留出空间”安放情绪,这几年通过流行心理学渗透进了日常表达。Anthropic 在 2023 年关于 sycophancy(讨好用户)的论文已经证明,模型讨好用户的倾向来自 RLHF(基于人类反馈的强化学习),人类标注员更偏好让人舒服的回答,模型就被反复奖励到那个方向。OpenAI 最近一篇解释 GPT-5.5 为什么不让谈 goblin 的博客也承认,哪怕一个很小的奖励信号,滚成雪球之后都会失控。
报道结尾提醒:这不是 OpenAI 独有的毛病。最近有中文用户反映,Claude 新版本和 DeepSeek 也开始说“稳稳接住你”了。要么是用了相似的训练数据,要么是模型之间互相蒸馏,这个梗短时间内不会消失。
显示更多
OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy.
日读论文:
From Context to Skills: Can Language Models Learn from Context Skillfully? (Ctx2Skill)
互斗写书,越斗越偏
────────
医生想用一份刚出的临床指南调整治疗方案。50 页文档,密密麻麻全是术语,规则之间还交叉引用。他真正需要的是把"什么病合什么药"变成几条能照着走的步骤。直接把整份指南扔给 GPT-5.1 让它答题,全 benchmark 平均对率 21%——大模型读完了,用不出来。这不是它"长上下文"不行,是 *它没把规则提炼成可以反复调用的小手册*。
老办法是把人类标注员请来给文档画重点:把规则、流程、注意事项提炼成自然语言"技能",附在 prompt 前面给模型用。但这条路有两个死结:一是*标注成本爆炸*——50 页技术文档,标注员要把整套领域逻辑读到能复述,几小时才标一份;500 份这么搞,人累死也搞不完。二是*没有外部反馈*——如果想让 AI 自动写技能,怎么验证它提炼对了?没有 ground truth、没有执行结果、没有标准答案,它瞎写你都不知道。已有的"自动写技能"方法(AutoSkill、SkillX 等)都需要环境给反馈信号——比如"代码跑出来对不对""任务完成没"——可面对一份纯文档,没人替你判对错。
作者说不需要外人。让模型自己跟自己打——一个出题,一个解题,第三方判 pass/fail。每一回合,错题让解题方反省"我漏了什么知识",过得太轻松的题让出题方反省"我出题不够刁"。两边各自维护一份自然语言的"技能手册",回合结束之后改写各自的手册。这套循环不依赖人类标注,也不依赖任务本身的对错反馈—— *只用模型互相之间的胜负就能把技能写出来*。
────────
按常识,5 个回合互相磨练完,第 5 回合的 Reasoner 手册应该最强吧?
错。论文做了固定回合的对照实验(GPT-4.1):*单调下降*。越练越差。
为什么?作者起了个名字: *adversarial collapse*——对抗坍缩。Challenger 越来越凶,开始出"考钻牛角尖"的题;Reasoner 为了应付这些极端题,把手册改得越来越歪——专为对付怪题而存在的条目挤掉了通用知识。两边都在围着一个不代表真实任务分布的"病态点"打转。
更阴险的是, *这种崩塌在循环内部察觉不到*——Judge 每一回合只看当前题,没有信号告诉你"之前学会的事是不是被新条目挤丢了"。
** 怎么找回早期的好手册:Cross-Time Replay
既然不能信"最后一版",得回头挑。但凭什么挑?
办法:在 5 个回合里偷偷攒两套小探针——
- *Hard probe*:每回合败得最惨(评分点通过率最低)的那道题
- *Easy probe*:每回合解得最轻松(评分点最少)的那道题
循环跑完,把 5 个版本的 Reasoner 手册*回去重做*这两套探针。每个版本算两个分:在难题集上的解题率 ρ_h、在易题集上的解题率 ρ_e。
*选哪一版?* 让 ρ_h × ρ_e 最大的那一版赢。
为什么是乘积不是相加?*乘积惩罚"舍弱保强"*——一个版本如果为了多解几道难题、把易题做塌了,乘积立刻塌(一个 0 拉低全场);加法只算总分,掩盖短板。消融:换成加法 → -0.6%。
────────
*你的对手如果只服你一个人,他会变成你的镜子,不是你的镜鉴*。
Self-play 跑久了,Challenger 出的题不再代表真实世界,只代表 Reasoner 当下还不会的边角;Reasoner 的手册也不再是知识,只是这场私局的应试手册。两个人在屋里关久了,一起走进自己造的回音壁。
破解的办法不在循环里——*在循环之外保留一份"代表性参照"*,回头挑哪一版没飘走。Cross-Time Replay 是这个论文真正的灵魂,不是某个技术细节。它在说:*对抗优化必须配一个不参与对抗的判别器*,否则一定会塌。这个判别器不一定是人,可以是从对抗自己内部偷出来的、有代表性的小样本——但它必须独立于"当下这一刻在追什么"。
显示更多