搜索 Regret 相关的推文

願願yuan@yuan_yuan1126

2026.03.24 09:15

沒看到你會後悔的🤍 You'll regret not seeing it.🤍 - （這是本月P網訂閱的福利） 🔗：

0

1

353

14

转发到社区

lidang 立党（劝人卖房/学CS/买SP500/纳100/OpenAI/Anthrop第一人）@lidangzzz

2026.05.09 14:42

如果让我设计一款中国大学： 1. 只有一个计算机专业； 2. 微积分、线性、概率、复变、大学物理（上下）、基础编程语言、基础数据结构，全部下放到高中，AP修完入读； 3. 大一开学一顶门，直接上算法、操作系统、体系架构、编译器四门课，大二大三大四全部专业课，删掉所有政治课； 4. machine learning、deep learning、LLM、AI Agent这个track的课直接开满，从linear regression、logistic regression、SVM、HMM到古典CNN和back propagation到transformer到AI Agent和SWE Agent，这个路线的课程全部打通，随便选修（非必修）； 5. 大一、大二、大三、大四必须累计3个学期co-op（包括暑假），co-op都去外面实习，写个report就能抵整个学期的学分； 6. 把弱电类专业课开全（非必修），电路数电模电嵌入式电磁场电力电子嵌入式信号控制开全，随便选修，可以从其他各种在线平台直接transfer； 7. 学校地址放在一线城市硬科技互联网核心区域，北京五道口，上海张江科技园，深圳南山科技园，天津北辰天穆镇，校园直接租商用办公楼，楼上楼下都是公司，周围2公里全是科技公司，孩子们平时可以全职实习写代码，有空再来上课，学校只提供正常科研运营上课的场所，不提供宿舍、食堂、体育馆、图书馆，不提供其他一切服务设施，一切衣食住行需要自己解决； 8. 只要做research就可以抵上课学分，只要supervisor导师打分即可，可以发paper也可以跟着导师在外面实习，可以代替任何必修课选修课，最多抵~100学分（本科四年全部做research，不用上课）； 9. 推出5年制本硕，第四年拿到本科学位后，修一年（三个学期）的课程，修够30学分就直接拿硕士学位，如果第一年的课程全部在AP修完waive掉，第三年拿到本科学位，第四年拿到硕士学位，如果四年拿research或者co-op学分抵扣，大一课程拿AP课抵扣，四年不用迈进学校一步，全部在外面工作实习，四年结束后直接拿到本硕学位； 10. PhD program完全工业项目制，本科可以课程直接抵扣PhD credits，剩下的credits纯粹做research，强制校外co-op，不需要qualifying exam，学生可以单向自由换导师，发够paper直接毕业，最快2~3年毕业，期间可以进入休眠状态，随时回来继续读。

显示更多

0

58

203

30

转发到社区

路遥 | Trader@LuYao_Trader

2025.08.08 05:34

比特币现价116800美元，这一轮牛市可以涨到什么价格？什么时候可能截止？能否详细从基本面和技术面来解答后市？ ChatGPT： ✅ 一、基本面分析 1. 宏观经济环境美联储利率周期：当前美联储处于降息预期的初期，这对风险资产（尤其是加密资产）有明显的提振作用。美元流动性：市场资金宽松时，比特币等稀缺资产更具吸引力，尤其在通胀预期上升时。 2. ETF通过效应现货比特币ETF的通过与资金流入（如BlackRock、Fidelity等）是本轮牛市的重要推动力。当前资金仍在持续流入，机构投资者的“增量资金”远未结束。 ETF使得传统资金能以低门槛参与BTC，提升了比特币的估值锚点。 3. 减半周期逻辑比特币在2024年4月经历第四次区块奖励减半，历史上减半后大约12-18个月出现顶峰。 2012年减半 → 2013年末见顶 2016年减半 → 2017年末见顶 2020年减半 → 2021年11月见顶如果历史模式继续，则： 2024年4月减半 → 预计2025年Q4前后（如11月-12月）达到顶点 ✅ 二、技术面分析 1. 历史涨幅对比周期减半前低点牛市顶点涨幅2012-2013$12$1,150~95倍2016-2017$200$19,700~98倍2020-2021$3,800$69,000~18倍2024-2025~$15,500（熊市低点）？目标？如果本轮牛市涨幅只有上轮的 1/3（约6倍），则： $15,500 × 6 = $93,000（已突破）如果涨幅为10倍：目标为**$155,000** 如果保守估计5-7倍范围：目标为**$75,000 - $110,000**（已达上沿）但因为ETF带来的“机构级资金”是历史首次，这可能打破以往模式。因此： 📈 当前市场处于“估值外扩”阶段，技术阻力较少，顶部预测可以用对数增长曲线辅助判断。 2. 对数回归通道模型（Logarithmic Regression）该模型由许多分析师（如Benjamin Cowen）使用，用于长期顶部预测。当前价格正好触及或突破上边界，表示：若继续突破，将进入“超估区域”，但仍可能持续几个月。若维持在通道上轨，仍有上行空间至130,000 - 180,000 美元区间 3. 技术指标（中短期） RSI（日线）：可能已经进入超买区（>75），但周线仍未极端。 200日均线乖离率：当前远高于均线，显示短期泡沫化程度。链上数据（Glassnode等）： HODLer 未开始大量出售 Exchange inflow 低 → 投资者并未大规模兑现实现价格与现价差距仍允许上涨 🎯 三、价格目标与时间窗口总结类型目标价格依据保守目标$130,000技术面+ETF估值扩张激进目标$180,000 - $220,000若大规模FOMO+ETF持续流入顶部时间窗口2025年Q2-Q4（特别是Q4）减半后12-18个月周期 ⚠️ 风险提示宏观突发风险：地缘政治、金融危机、ETF监管新政币安、Tether等系统性风险仍存在市场过热信号：若Altcoin疯狂上涨、媒体热炒、小白涌入 📌 结论本轮比特币牛市由于有ETF资金推动，价格天花板可能被重新定义，中长期内目标在 $130,000-$180,000 区间较为合理，顶部时间可能出现在 2025年末左右。但短期已出现技术超买信号，适当防范回撤风险是必要的。 #BTC#

显示更多

0

21

17

1

转发到社区

AI Dance@AI_Whisper_X

2026.05.09 04:16

翁家翌新 blog：超越梯度的学习昨天看到翁家翌（前 OpenAI 研究员）新写了一篇 blog《Learning Beyond Gradients》，挺有意思的，分享一些我读下来的感受。原文较长且偏技术，下面这版做了不少删减和重组，建议感兴趣的同学直接读原文 · · · 翁家翌：超越梯度的学习持续学习（Continual Learning）之所以一直很难，很大程度上是因为神经网络的顽疾：灾难性遗忘。那如果我们不只盯着权重更新这一条路呢？随着 LLM agent 越来越强，写代码这件事变得又快又好。但翁家翌注意到一个更有趣的现象：agent 可以反复读取失败信息、修改策略代码、添加测试、回放录像，让整套程序在不动任何网络权重的情况下持续变强。 · · · 这个视角让他重新审视了一个老朋友：heuristic，也就是手写规则和程序化策略。之前很多 heuristic 不是没用，而是维护太贵了，而coding agent 改变的正是这条维护曲线。那些曾经用完就扔的一次性补丁，开始变得值得长期拥有。凡是能被持续迭代的东西，都开始变得更可解，这也恰恰是持续学习一直追求的目标。它有没有可能成为继 pretraining → RLHF → 大规模 RL/RLVR 之后的下一个范式？ · · · 翁家翌用 Codex（gpt-5.4）做了实验，纯写规则版本，完全不碰神经网络。结果超出预期： — Atari Breakout 的打砖块分数从 387 一路升到 864，达到理论最高分； — MuJoCo 四足和跑步机器人任务中，纯 Python 策略也跑进了常见 Deep RL 结果的量级，HalfCheetah 五轮均值 11836.7； — 跑完 Atari 全部 57 个游戏后，在相同的环境交互步数下，中位数得分已经远高于 PPO 这类标准算法。这里被更新的对象早就不是单纯的策略函数了，而是一整套带着记忆、反馈入口和回归机制的软件系统。翁家翌把它叫作 Heuristic Learning（HL，启发式学习）。（我自己也做过 evolve，但不训练神经网络，纯靠规则约束，感觉系统怎么都智能不起来。其实不管 RL 还是 HL，能不能跑起来都是看一件事，优化结果的评分能不能清晰定义。） · · · Heuristic Learning（HL）是什么？HL 怎么持续学习？ HL 的核心是用 coding agent 维护一个 Heuristic System（HS）。和 Deep RL 的差异： — 反馈来源：不是 loss 函数，而是测试结果、环境奖励、日志、视频、失败模式分析； — 更新方式：不走反向传播，agent 直接改 policy、状态检测器、测试、配置或记忆结构； — 维护对象：不止一个 trace（黄金轨迹）、环境 wrapper 等。以前怎么没人搞？专家系统 70 年代就有，但人维护起来是噩梦：加一条规则修好 case A，case B 崩了；规则堆到几百条后，除了原作者没人看得懂。而 coding agent 不怕堆规则。它能同时读所有代码、跑全量测试、对比日志，把维护成本打下来。用翁的比喻说，就像纺纱机改变纺线成本曲线一样：手工纺贵得要死，机器一上来就塌掉了。 · · · Heuristic Learning 怎么做 Continual Learning 神经网络把经验压进权重，忘没忘、怎么忘的都是黑箱。HL 的历史则是显式的：版本 diff、回归测试、replay、视频、golden trace 全透明。新增能力前先固化旧能力：跑回归测试、跑固定种子回放。如果新规则破坏旧 case，agent 能直接定位到哪行代码引入的 regression。但规则叠太多、agent 自己都维护不动的时候，就需要"历史压缩"，把一堆 case-specific 的补丁合并成更通用的逻辑，否则系统迟早变成没人敢碰的代码泥球。 · · · 当然，HL 不是万能药。因为 Heuristic Learning 并不能做所有神经网络能做的事情。它的上限卡在代码的表达能力：比如复杂感知和长程泛化。翁家翌也坦率地说，他想不出有哪个 agent 能纯靠 Python、不用网络去搞定 ImageNet。所以真正的问题变成了：怎么把神经网络和 HL 结合起来，同时搞定在线学习和持续学习？最有希望的方向是：用 HL 快速处理在线数据，把在线经验变成可训练、可回归、可筛选的数据，再周期性地更新神经网络。以机器人为例，借用 System 1 / System 2 的说法，一种可能的分工是： — 专用浅层 NN 作为 System 1 的一部分：快、便宜，负责感知、分类、物体状态估计； — HL 也可以当做 System 1 的一部分：负责最新数据处理、规则、测试、回放、memory、安全边界、局部恢复； — LLM agent 作为 System 2：负责给 HL 提供反馈、改进数据，并周期性把 HL 生成的数据拿过来更新自己。 · · · Agentic coding 改变的不仅是写代码的速度，更改变了"哪些代码值得被长期拥有"。过去很多 heuristic 看上去没前途，不是它们太弱，而是维护不起。 coding agent 改变的就是这条维护成本曲线。规则、测试、日志、记忆和补丁，原来只是散落的工程材料，现在开始能组成一个持续进化的 Heuristic System，去解决在线学习和持续学习一直没搞定的事。欢迎来到下一个范式。 · so，skills + instruction following = AGI？

显示更多

0

1

171

41

转发到社区