搜索 collapse 相关的推文

念念遵纪守法@qwe91120

2023.10.24 16:42

红尘一醉,白首不离。北京 #北京# #collapse# #cosplayer#

0

1

0

转发到社区

念念遵纪守法@qwe91120

2023.10.24 16:40

宁肯少些，但要好些。深圳 #cos# #collapse# #深圳#

0

转发到社区

The Second Derivative🎰@SecDerivative

2026.05.12 17:08

过去 2 小时跟踪了全网 197 条新闻消息，筛出 5 条值得关注的核心信号。Kevin Warsh 正式入局美联储，配合智利铜矿与中东原油的双重实物紧缩，全球宏观定价正从 '增长博弈' 转向 '硬资产封锁'。 1. Kevin Warsh confirmed for 14-year Fed term, clearing the path to Chair. Senate voted 51-45 to install the 'sound money' hawk, marking the end of the Powell era. Market must now price in a Fed that prioritizes financial stability and currency strength over liquidity bailouts. $TSM $NVDA 2. EIA extends Hormuz closure forecast through May with 10.8M bpd peak outage. Global inventories are projected to shrink by 2.6 million bpd in 2026, a massive revision from previous estimates. This is a structural supply shock that won't fully resolve until 2027. $FCX $CPER 3. Chile copper output collapses as Escondida reports 15.7% production drop. March data shows Codelco also down 9.98% YoY, proving that physical mining limits are overriding price incentives. The 'sell-the-news' metal trade is being dismantled by raw physical scarcity hitting the tape. $FCX $CPER 4. US DOE to inject billions into long-lead nuclear reactor components. As commercial power demand is set to surpass residential use for the first time in 2027, the government is treating baseload nuclear as a national security priority for the AI arms race. $CEG $URA 5. SpaceX and Google pivot to orbital data centers to solve grid constraints. Moving compute to space bypasses terrestrial power limits and cooling bottlenecks, marking a paradigm shift in AI infrastructure. If scalable, this redefines the capital expenditure ceiling for the entire sector. $GOOG $AVGO That's the signal from this window. With Chile output dropping 15% and Hormuz closed through May, are you still betting on a soft landing for inflation? Repost if useful.

显示更多

0

转发到社区

投资学人 Invest Scholar@InvestScholar

2025.08.20 20:25

这两天美股大跌，与流动性有关。本周五，鲍威尔大概率不宣布降息。美联储2.5万亿美元的逆回购资金池已缩水99%，仅剩220亿美元。自2022年量化紧缩政策启动以来，准备金首次出现下降，美联储承认流动性将很快面临考验。The Fed’s $2.5T Reverse Repo cash pool has collapsed 99%, with just $22B left.

显示更多

0

5

47

7

转发到社区

宝玉@dotey

2026.05.07 21:27

ChatGPT 跟中文用户对话，有一句话已经被吐槽了大半年：“我会稳稳地接住你”。不管是问数学题、让它写代码，还是要它生成图片，这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。直译听着没问题，但中文母语者一听就觉得过于黏腻、用错了场合。模型有时还会自己加戏：“我就在这里，不逃，不躲，不闪避，稳稳地接住你。” 这句话已经被中文互联网玩成了梗。有人把 ChatGPT P 成一个救生气垫，张开双臂等着接住坠落的用户。重庆一位 20 岁的开发者 Zeng Fanyu 还做了个开源工具叫 Jiezhu，专门帮聊天机器人理解用户意图，他告诉 WIRED 做这个项目的动力就是觉得这个梗太好笑。OpenAI 自己也知道这件事，4 月发布新一代图像模型时，研究员陈博远（Boyuan Chen）画了一格漫画自嘲新模型又一次学会了说这句话。类似的怪癖不止这一句。报道还提到，ChatGPT 中文里有时会无端冒出"砍一刀"，拼多多最具辨识度的那句营销话术。 AI 写作检测工具 Pangram 的联合创始人 Max Spero 告诉 WIRED，这种"逮住一句话猛用"的现象叫 mode collapse（模式坍缩），是后训练阶段反馈机制走偏的副作用。他的原话是：我们不知道怎么告诉模型，这句话是好的，但连用十次就不再是好的了。为什么偏偏是这一句？报道给了两个解释。一是翻译错位。英文里 "I've got you" 是个口语短句，干脆利落，意思接近“我懂”或“我帮你兜着”。机械直译到中文就变成又长又煽情的"稳稳接住"。文章引用中国学者的研究，西方大模型训练语料以英文为主，它们生成的中文在介词使用和句子结构上都更像英文，读起来就是一股翻译腔。二是讨好倾向。“接住”在中文里原本是心理咨询的专业用语，指为对方“留出空间”安放情绪，这几年通过流行心理学渗透进了日常表达。Anthropic 在 2023 年关于 sycophancy（讨好用户）的论文已经证明，模型讨好用户的倾向来自 RLHF（基于人类反馈的强化学习），人类标注员更偏好让人舒服的回答，模型就被反复奖励到那个方向。OpenAI 最近一篇解释 GPT-5.5 为什么不让谈 goblin 的博客也承认，哪怕一个很小的奖励信号，滚成雪球之后都会失控。报道结尾提醒：这不是 OpenAI 独有的毛病。最近有中文用户反映，Claude 新版本和 DeepSeek 也开始说“稳稳接住你”了。要么是用了相似的训练数据，要么是模型之间互相蒸馏，这个梗短时间内不会消失。

显示更多

WIRED@WIRED

2026.05.07 16:31

OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy.

0

56

436

45

转发到社区

李继刚@lijigang

2026.05.05 03:22

日读论文： From Context to Skills: Can Language Models Learn from Context Skillfully? (Ctx2Skill) 互斗写书，越斗越偏 ──────── 医生想用一份刚出的临床指南调整治疗方案。50 页文档，密密麻麻全是术语，规则之间还交叉引用。他真正需要的是把"什么病合什么药"变成几条能照着走的步骤。直接把整份指南扔给 GPT-5.1 让它答题，全 benchmark 平均对率 21%——大模型读完了，用不出来。这不是它"长上下文"不行，是 *它没把规则提炼成可以反复调用的小手册*。老办法是把人类标注员请来给文档画重点：把规则、流程、注意事项提炼成自然语言"技能"，附在 prompt 前面给模型用。但这条路有两个死结：一是*标注成本爆炸*——50 页技术文档，标注员要把整套领域逻辑读到能复述，几小时才标一份；500 份这么搞，人累死也搞不完。二是*没有外部反馈*——如果想让 AI 自动写技能，怎么验证它提炼对了？没有 ground truth、没有执行结果、没有标准答案，它瞎写你都不知道。已有的"自动写技能"方法（AutoSkill、SkillX 等）都需要环境给反馈信号——比如"代码跑出来对不对""任务完成没"——可面对一份纯文档，没人替你判对错。作者说不需要外人。让模型自己跟自己打——一个出题，一个解题，第三方判 pass/fail。每一回合，错题让解题方反省"我漏了什么知识"，过得太轻松的题让出题方反省"我出题不够刁"。两边各自维护一份自然语言的"技能手册"，回合结束之后改写各自的手册。这套循环不依赖人类标注，也不依赖任务本身的对错反馈—— *只用模型互相之间的胜负就能把技能写出来*。 ──────── 按常识，5 个回合互相磨练完，第 5 回合的 Reasoner 手册应该最强吧？错。论文做了固定回合的对照实验（GPT-4.1）：*单调下降*。越练越差。为什么？作者起了个名字： *adversarial collapse*——对抗坍缩。Challenger 越来越凶，开始出"考钻牛角尖"的题；Reasoner 为了应付这些极端题，把手册改得越来越歪——专为对付怪题而存在的条目挤掉了通用知识。两边都在围着一个不代表真实任务分布的"病态点"打转。更阴险的是， *这种崩塌在循环内部察觉不到*——Judge 每一回合只看当前题，没有信号告诉你"之前学会的事是不是被新条目挤丢了"。 ** 怎么找回早期的好手册：Cross-Time Replay 既然不能信"最后一版"，得回头挑。但凭什么挑？办法：在 5 个回合里偷偷攒两套小探针—— - *Hard probe*：每回合败得最惨（评分点通过率最低）的那道题 - *Easy probe*：每回合解得最轻松（评分点最少）的那道题循环跑完，把 5 个版本的 Reasoner 手册*回去重做*这两套探针。每个版本算两个分：在难题集上的解题率 ρ_h、在易题集上的解题率 ρ_e。 *选哪一版？* 让 ρ_h × ρ_e 最大的那一版赢。为什么是乘积不是相加？*乘积惩罚"舍弱保强"*——一个版本如果为了多解几道难题、把易题做塌了，乘积立刻塌（一个 0 拉低全场）；加法只算总分，掩盖短板。消融：换成加法 → -0.6%。 ──────── *你的对手如果只服你一个人，他会变成你的镜子，不是你的镜鉴*。 Self-play 跑久了，Challenger 出的题不再代表真实世界，只代表 Reasoner 当下还不会的边角；Reasoner 的手册也不再是知识，只是这场私局的应试手册。两个人在屋里关久了，一起走进自己造的回音壁。破解的办法不在循环里——*在循环之外保留一份"代表性参照"*，回头挑哪一版没飘走。Cross-Time Replay 是这个论文真正的灵魂，不是某个技术细节。它在说：*对抗优化必须配一个不参与对抗的判别器*，否则一定会塌。这个判别器不一定是人，可以是从对抗自己内部偷出来的、有代表性的小样本——但它必须独立于"当下这一刻在追什么"。

显示更多

0

1

39

1

转发到社区