注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 Regret
Regret 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 Regret 的推特
沒看到你會後悔的🤍 You'll regret not seeing it.🤍 - (這是本月P網訂閱的福利) 🔗:
0
1
353
14
转发到社区
如果让我设计一款中国大学: 1. 只有一个计算机专业; 2. 微积分、线性、概率、复变、大学物理(上下)、基础编程语言、基础数据结构,全部下放到高中,AP修完入读; 3. 大一开学一顶门,直接上算法、操作系统、体系架构、编译器四门课,大二大三大四全部专业课,删掉所有政治课; 4. machine learning、deep learning、LLM、AI Agent这个track的课直接开满,从linear regression、logistic regression、SVM、HMM到古典CNN和back propagation到transformer到AI Agent和SWE Agent,这个路线的课程全部打通,随便选修(非必修); 5. 大一、大二、大三、大四必须累计3个学期co-op(包括暑假),co-op都去外面实习,写个report就能抵整个学期的学分; 6. 把弱电类专业课开全(非必修),电路数电模电嵌入式电磁场电力电子嵌入式信号控制开全,随便选修,可以从其他各种在线平台直接transfer; 7. 学校地址放在一线城市硬科技互联网核心区域,北京五道口,上海张江科技园,深圳南山科技园,天津北辰天穆镇, 校园直接租商用办公楼,楼上楼下都是公司,周围2公里全是科技公司,孩子们平时可以全职实习写代码,有空再来上课, 学校只提供正常科研运营上课的场所,不提供宿舍、食堂、体育馆、图书馆,不提供其他一切服务设施,一切衣食住行需要自己解决; 8. 只要做research就可以抵上课学分,只要supervisor导师打分即可,可以发paper也可以跟着导师在外面实习,可以代替任何必修课选修课,最多抵~100学分(本科四年全部做research,不用上课); 9. 推出5年制本硕,第四年拿到本科学位后,修一年(三个学期)的课程,修够30学分就直接拿硕士学位, 如果第一年的课程全部在AP修完waive掉,第三年拿到本科学位,第四年拿到硕士学位, 如果四年拿research或者co-op学分抵扣,大一课程拿AP课抵扣,四年不用迈进学校一步,全部在外面工作实习,四年结束后直接拿到本硕学位; 10. PhD program完全工业项目制,本科可以课程直接抵扣PhD credits,剩下的credits纯粹做research,强制校外co-op,不需要qualifying exam,学生可以单向自由换导师,发够paper直接毕业,最快2~3年毕业,期间可以进入休眠状态,随时回来继续读。
显示更多
0
58
203
30
转发到社区
比特币现价116800美元,这一轮牛市可以涨到什么价格?什么时候可能截止?能否详细从基本面和技术面来解答后市? ChatGPT: ✅ 一、基本面分析 1. 宏观经济环境 美联储利率周期:当前美联储处于降息预期的初期,这对风险资产(尤其是加密资产)有明显的提振作用。 美元流动性:市场资金宽松时,比特币等稀缺资产更具吸引力,尤其在通胀预期上升时。 2. ETF通过效应 现货比特币ETF的通过与资金流入(如BlackRock、Fidelity等)是本轮牛市的重要推动力。 当前资金仍在持续流入,机构投资者的“增量资金”远未结束。 ETF使得传统资金能以低门槛参与BTC,提升了比特币的估值锚点。 3. 减半周期逻辑 比特币在2024年4月经历第四次区块奖励减半,历史上减半后大约12-18个月出现顶峰。 2012年减半 → 2013年末见顶 2016年减半 → 2017年末见顶 2020年减半 → 2021年11月见顶 如果历史模式继续,则: 2024年4月减半 → 预计2025年Q4前后(如11月-12月)达到顶点 ✅ 二、技术面分析 1. 历史涨幅对比 周期减半前低点牛市顶点涨幅2012-2013$12$1,150~95倍2016-2017$200$19,700~98倍2020-2021$3,800$69,000~18倍2024-2025~$15,500(熊市低点)?目标? 如果本轮牛市涨幅只有上轮的 1/3(约6倍),则: $15,500 × 6 = $93,000(已突破) 如果涨幅为10倍:目标为**$155,000** 如果保守估计5-7倍范围:目标为**$75,000 - $110,000**(已达上沿) 但因为ETF带来的“机构级资金”是历史首次,这可能打破以往模式。 因此: 📈 当前市场处于“估值外扩”阶段,技术阻力较少,顶部预测可以用对数增长曲线辅助判断。 2. 对数回归通道模型(Logarithmic Regression) 该模型由许多分析师(如Benjamin Cowen)使用,用于长期顶部预测。当前价格正好触及或突破上边界,表示: 若继续突破,将进入“超估区域”,但仍可能持续几个月。 若维持在通道上轨,仍有上行空间至130,000 - 180,000 美元区间 3. 技术指标(中短期) RSI(日线):可能已经进入超买区(>75),但周线仍未极端。 200日均线乖离率:当前远高于均线,显示短期泡沫化程度。 链上数据(Glassnode等): HODLer 未开始大量出售 Exchange inflow 低 → 投资者并未大规模兑现 实现价格与现价差距仍允许上涨 🎯 三、价格目标与时间窗口总结 类型目标价格依据保守目标$130,000技术面+ETF估值扩张激进目标$180,000 - $220,000若大规模FOMO+ETF持续流入顶部时间窗口2025年Q2-Q4(特别是Q4)减半后12-18个月周期 ⚠️ 风险提示 宏观突发风险:地缘政治、金融危机、ETF监管新政 币安、Tether等系统性风险仍存在 市场过热信号:若Altcoin疯狂上涨、媒体热炒、小白涌入 📌 结论 本轮比特币牛市由于有ETF资金推动,价格天花板可能被重新定义,中长期内目标在 $130,000-$180,000 区间较为合理,顶部时间可能出现在 2025年末左右。但短期已出现技术超买信号,适当防范回撤风险是必要的。 #BTC#
显示更多
0
21
17
1
转发到社区
翁家翌新 blog:超越梯度的学习 昨天看到翁家翌(前 OpenAI 研究员)新写了一篇 blog《Learning Beyond Gradients》,挺有意思的,分享一些我读下来的感受。 原文较长且偏技术,下面这版做了不少删减和重组,建议感兴趣的同学直接读原文 · · · 翁家翌:超越梯度的学习 持续学习(Continual Learning)之所以一直很难,很大程度上是因为神经网络的顽疾:灾难性遗忘。那如果我们不只盯着权重更新这一条路呢? 随着 LLM agent 越来越强,写代码这件事变得又快又好。但翁家翌注意到一个更有趣的现象:agent 可以反复读取失败信息、修改策略代码、添加测试、回放录像,让整套程序在不动任何网络权重的情况下持续变强。 · · · 这个视角让他重新审视了一个老朋友:heuristic,也就是手写规则和程序化策略。之前很多 heuristic 不是没用,而是维护太贵了,而coding agent 改变的正是这条维护曲线。那些曾经用完就扔的一次性补丁,开始变得值得长期拥有。 凡是能被持续迭代的东西,都开始变得更可解,这也恰恰是持续学习一直追求的目标。 它有没有可能成为继 pretraining → RLHF → 大规模 RL/RLVR 之后的下一个范式? · · · 翁家翌用 Codex(gpt-5.4)做了实验,纯写规则版本,完全不碰神经网络。结果超出预期: — Atari Breakout 的打砖块分数从 387 一路升到 864,达到理论最高分; — MuJoCo 四足和跑步机器人任务中,纯 Python 策略也跑进了常见 Deep RL 结果的量级,HalfCheetah 五轮均值 11836.7; — 跑完 Atari 全部 57 个游戏后,在相同的环境交互步数下,中位数得分已经远高于 PPO 这类标准算法。 这里被更新的对象早就不是单纯的策略函数了,而是一整套带着记忆、反馈入口和回归机制的软件系统。翁家翌把它叫作 Heuristic Learning(HL,启发式学习)。 (我自己也做过 evolve,但不训练神经网络,纯靠规则约束,感觉系统怎么都智能不起来。其实不管 RL 还是 HL,能不能跑起来都是看一件事,优化结果的评分能不能清晰定义。) · · · Heuristic Learning(HL) 是什么?HL 怎么持续学习? HL 的核心是用 coding agent 维护一个 Heuristic System(HS)。 和 Deep RL 的差异: — 反馈来源:不是 loss 函数,而是测试结果、环境奖励、日志、视频、失败模式分析; — 更新方式:不走反向传播,agent 直接改 policy、状态检测器、测试、配置或记忆结构; — 维护对象:不止一个 trace(黄金轨迹)、环境 wrapper 等。 以前怎么没人搞?专家系统 70 年代就有,但人维护起来是噩梦:加一条规则修好 case A,case B 崩了;规则堆到几百条后,除了原作者没人看得懂。 而 coding agent 不怕堆规则。它能同时读所有代码、跑全量测试、对比日志,把维护成本打下来。用翁的比喻说,就像纺纱机改变纺线成本曲线一样:手工纺贵得要死,机器一上来就塌掉了。 · · · Heuristic Learning 怎么做 Continual Learning 神经网络把经验压进权重,忘没忘、怎么忘的都是黑箱。HL 的历史则是显式的:版本 diff、回归测试、replay、视频、golden trace 全透明。新增能力前先固化旧能力:跑回归测试、跑固定种子回放。如果新规则破坏旧 case,agent 能直接定位到哪行代码引入的 regression。 但规则叠太多、agent 自己都维护不动的时候,就需要"历史压缩",把一堆 case-specific 的补丁合并成更通用的逻辑,否则系统迟早变成没人敢碰的代码泥球。 · · · 当然,HL 不是万能药。因为 Heuristic Learning 并不能做所有神经网络能做的事情。它的上限卡在代码的表达能力:比如复杂感知和长程泛化。翁家翌也坦率地说,他想不出有哪个 agent 能纯靠 Python、不用网络去搞定 ImageNet。 所以真正的问题变成了:怎么把神经网络和 HL 结合起来,同时搞定在线学习和持续学习? 最有希望的方向是:用 HL 快速处理在线数据,把在线经验变成可训练、可回归、可筛选的数据,再周期性地更新神经网络。以机器人为例,借用 System 1 / System 2 的说法,一种可能的分工是: — 专用浅层 NN 作为 System 1 的一部分:快、便宜,负责感知、分类、物体状态估计; — HL 也可以当做 System 1 的一部分:负责最新数据处理、规则、测试、回放、memory、安全边界、局部恢复; — LLM agent 作为 System 2:负责给 HL 提供反馈、改进数据,并周期性把 HL 生成的数据拿过来更新自己。 · · · Agentic coding 改变的不仅是写代码的速度,更改变了"哪些代码值得被长期拥有"。过去很多 heuristic 看上去没前途,不是它们太弱,而是维护不起。 coding agent 改变的就是这条维护成本曲线。 规则、测试、日志、记忆和补丁,原来只是散落的工程材料,现在开始能组成一个持续进化的 Heuristic System,去解决在线学习和持续学习一直没搞定的事。 欢迎来到下一个范式。 · so,skills + instruction following = AGI?
显示更多
0
1
171
41
转发到社区