搜索 HS_PARTY 相关的推文

祭祀matsuri@jisi_si

2022.08.18 11:17

#少女前线## HS.50 旗袍

0

352

47

转发到社区

祭祀matsuri@jisi_si

2022.08.18 11:16

#少女前线## HS.50 本体已经完成所有启动流程，随时可以执行任务，长官！

0

4

422

67

转发到社区

九曲-jean@JIUQUCKA

2019.10.11 18:59

我可是太爱深夜搞hs

0

10

388

27

转发到社区

DiscusFish@bitfish

2025.11.07 01:54

④系统性复盘 — 恢复力的重建生理层面 — 数据化监测恢复状态： hs-CRP（高敏C反应蛋白） → 炎症水平 HRV（心率变异性） → 自主神经功能 (手表/手环/戒指可测量)

显示更多

0

1

16

3

转发到社区

Eva 树姐👧🏻@EvaCmore

2026.05.06 14:05

恭喜中奖，请于明日下午15:00之前dm我地址，过期下滑 @xmg215215 @btc_juanmao @jiguangbi 社区 @Btc6666668 @uui__hs 抽奖记录

0

5

3

0

转发到社区

很大很大的橙子@0xVeryBigOrange

2026.05.14 04:32

替尔泊肽有点牛逼啊我现在看的所有研究还没看到报道他有害的 ------------------------------------- FDA 已批准 tirzepatide/Zepbound 用于肥胖成人的中重度阻塞性睡眠呼吸暂停（OSA）。关键依据是 SURMOUNT-OSA 两项 52 周、双盲、随机对照试验，合计 469 名中重度 OSA + 肥胖成人。基线 AHI 约 49.5–51.5 次/小时；tirzepatide 10/15mg 组相对 placebo 的 AHI 额外下降约 20.0 和 23.8 次/小时，同时改善体重、低氧负荷、hs-CRP 和收缩压。

显示更多

0

17

19

3

转发到社区

DiscusFish@bitfish

2025.11.07 01:54

最近的市场起伏，相信大家都收获了财富、经验、困惑和教训。如今市场进入hard模式，这阶段的关键不是追逐行情，而是复盘→内化→重构体系。但重新上场前，别忽视身体的系统性风险！30+交易者容易陷入“表面无事，实则透支”的危险区间，务必关注这4个核心检测点： ① CAC+Lp(a)测心血管 ② 低剂量肺CT查后遗症 ③ CGM监测血糖（血糖波动=决策质量下降) ④ hs-CRP//HRV量化恢复

显示更多

0

59

547

135

转发到社区

AI Dance@AI_Whisper_X

2026.05.09 04:16

翁家翌新 blog：超越梯度的学习昨天看到翁家翌（前 OpenAI 研究员）新写了一篇 blog《Learning Beyond Gradients》，挺有意思的，分享一些我读下来的感受。原文较长且偏技术，下面这版做了不少删减和重组，建议感兴趣的同学直接读原文 · · · 翁家翌：超越梯度的学习持续学习（Continual Learning）之所以一直很难，很大程度上是因为神经网络的顽疾：灾难性遗忘。那如果我们不只盯着权重更新这一条路呢？随着 LLM agent 越来越强，写代码这件事变得又快又好。但翁家翌注意到一个更有趣的现象：agent 可以反复读取失败信息、修改策略代码、添加测试、回放录像，让整套程序在不动任何网络权重的情况下持续变强。 · · · 这个视角让他重新审视了一个老朋友：heuristic，也就是手写规则和程序化策略。之前很多 heuristic 不是没用，而是维护太贵了，而coding agent 改变的正是这条维护曲线。那些曾经用完就扔的一次性补丁，开始变得值得长期拥有。凡是能被持续迭代的东西，都开始变得更可解，这也恰恰是持续学习一直追求的目标。它有没有可能成为继 pretraining → RLHF → 大规模 RL/RLVR 之后的下一个范式？ · · · 翁家翌用 Codex（gpt-5.4）做了实验，纯写规则版本，完全不碰神经网络。结果超出预期： — Atari Breakout 的打砖块分数从 387 一路升到 864，达到理论最高分； — MuJoCo 四足和跑步机器人任务中，纯 Python 策略也跑进了常见 Deep RL 结果的量级，HalfCheetah 五轮均值 11836.7； — 跑完 Atari 全部 57 个游戏后，在相同的环境交互步数下，中位数得分已经远高于 PPO 这类标准算法。这里被更新的对象早就不是单纯的策略函数了，而是一整套带着记忆、反馈入口和回归机制的软件系统。翁家翌把它叫作 Heuristic Learning（HL，启发式学习）。（我自己也做过 evolve，但不训练神经网络，纯靠规则约束，感觉系统怎么都智能不起来。其实不管 RL 还是 HL，能不能跑起来都是看一件事，优化结果的评分能不能清晰定义。） · · · Heuristic Learning（HL）是什么？HL 怎么持续学习？ HL 的核心是用 coding agent 维护一个 Heuristic System（HS）。和 Deep RL 的差异： — 反馈来源：不是 loss 函数，而是测试结果、环境奖励、日志、视频、失败模式分析； — 更新方式：不走反向传播，agent 直接改 policy、状态检测器、测试、配置或记忆结构； — 维护对象：不止一个 trace（黄金轨迹）、环境 wrapper 等。以前怎么没人搞？专家系统 70 年代就有，但人维护起来是噩梦：加一条规则修好 case A，case B 崩了；规则堆到几百条后，除了原作者没人看得懂。而 coding agent 不怕堆规则。它能同时读所有代码、跑全量测试、对比日志，把维护成本打下来。用翁的比喻说，就像纺纱机改变纺线成本曲线一样：手工纺贵得要死，机器一上来就塌掉了。 · · · Heuristic Learning 怎么做 Continual Learning 神经网络把经验压进权重，忘没忘、怎么忘的都是黑箱。HL 的历史则是显式的：版本 diff、回归测试、replay、视频、golden trace 全透明。新增能力前先固化旧能力：跑回归测试、跑固定种子回放。如果新规则破坏旧 case，agent 能直接定位到哪行代码引入的 regression。但规则叠太多、agent 自己都维护不动的时候，就需要"历史压缩"，把一堆 case-specific 的补丁合并成更通用的逻辑，否则系统迟早变成没人敢碰的代码泥球。 · · · 当然，HL 不是万能药。因为 Heuristic Learning 并不能做所有神经网络能做的事情。它的上限卡在代码的表达能力：比如复杂感知和长程泛化。翁家翌也坦率地说，他想不出有哪个 agent 能纯靠 Python、不用网络去搞定 ImageNet。所以真正的问题变成了：怎么把神经网络和 HL 结合起来，同时搞定在线学习和持续学习？最有希望的方向是：用 HL 快速处理在线数据，把在线经验变成可训练、可回归、可筛选的数据，再周期性地更新神经网络。以机器人为例，借用 System 1 / System 2 的说法，一种可能的分工是： — 专用浅层 NN 作为 System 1 的一部分：快、便宜，负责感知、分类、物体状态估计； — HL 也可以当做 System 1 的一部分：负责最新数据处理、规则、测试、回放、memory、安全边界、局部恢复； — LLM agent 作为 System 2：负责给 HL 提供反馈、改进数据，并周期性把 HL 生成的数据拿过来更新自己。 · · · Agentic coding 改变的不仅是写代码的速度，更改变了"哪些代码值得被长期拥有"。过去很多 heuristic 看上去没前途，不是它们太弱，而是维护不起。 coding agent 改变的就是这条维护成本曲线。规则、测试、日志、记忆和补丁，原来只是散落的工程材料，现在开始能组成一个持续进化的 Heuristic System，去解决在线学习和持续学习一直没搞定的事。欢迎来到下一个范式。 · so，skills + instruction following = AGI？

显示更多

0

1

171

41

转发到社区

無名先生@Wuming_Mr_

2026.05.06 04:15

Bitcoin 正坐在一把上膛的枪口上仔细看： $80K 心理阻力位上方存在头肩顶（H&S）形态恐惧与贪婪指数在 50 三个信号——指向同一个方向这个形态不在乎大家都在看 $90K+ $70K 的假跌破已经发生——那是警告我的判断没有改变：先下跌，再上涨下一步：回测 $70K，然后再做方向选择关注 + 打开通知！

显示更多

0

17

34

7

转发到社区

無名先生@Wuming_Mr_

2026.05.07 15:47

🚨 很多人以为真正的上涨已经开始了。但市场最喜欢做的事：就是在启动前，再狠狠干掉最后一批多头 👀 现在： ❌ $80K 强压制 ❌ H&S 结构形成中 ❌ 市场重新开始 FOMO 而我认为： $70K 的最后一跌，才是真正关键的位置。因为：聪明资金不是在追高时买入。而是在所有人再次恐慌时，悄悄接货。 #BTC#

显示更多

0

22

11

5

转发到社区