TwiScan
热门
社区
账号集合
登录
注册
English
日本語
한국의
简体中文
繁体中文
注册并分享邀请链接,可获得视频播放与邀请奖励。
立即注册
搜索结果
HS_PARTY
HS_PARTY 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含
HS_PARTY
的推特
祭祀matsuri
@jisi_si
2022.08.18 11:17
#
少女前线
## HS.50 旗袍
0
0
0
352
47
转发到社区
祭祀matsuri
@jisi_si
2022.08.18 11:16
#
少女前线
## HS.50 本体已经完成所有启动流程,随时可以执行任务,长官!
0
0
4
422
67
转发到社区
九曲-jean
@JIUQUCKA
2019.10.11 18:59
我可是太爱深夜搞hs
0
0
10
388
27
转发到社区
DiscusFish
@bitfish
2025.11.07 01:54
④系统性复盘 — 恢复力的重建 生理层面 — 数据化监测恢复状态: hs-CRP(高敏C反应蛋白) → 炎症水平 HRV(心率变异性) → 自主神经功能 (手表/手环/戒指可测量)
显示更多
0
0
1
16
3
转发到社区
Eva 树姐👧🏻
@EvaCmore
2026.05.06 14:05
恭喜中奖,请于明日下午15:00之前dm我地址,过期下滑
@xmg215215
@btc_juanmao
@jiguangbi
社区
@Btc6666668
@uui__hs
抽奖记录
0
0
5
3
0
转发到社区
很大很大的橙子
@0xVeryBigOrange
2026.05.14 04:32
替尔泊肽有点牛逼啊 我现在看的所有研究还没看到报道他有害的 ------------------------------------- FDA 已批准 tirzepatide/Zepbound 用于肥胖成人的中重度阻塞性睡眠呼吸暂停(OSA)。关键依据是 SURMOUNT-OSA 两项 52 周、双盲、随机对照试验,合计 469 名中重度 OSA + 肥胖成人。基线 AHI 约 49.5–51.5 次/小时;tirzepatide 10/15mg 组相对 placebo 的 AHI 额外下降约 20.0 和 23.8 次/小时,同时改善体重、低氧负荷、hs-CRP 和收缩压。
显示更多
0
0
17
19
3
转发到社区
DiscusFish
@bitfish
2025.11.07 01:54
最近的市场起伏,相信大家都收获了财富、经验、困惑和教训。如今市场进入hard模式,这阶段的关键不是追逐行情,而是复盘→内化→重构体系。但重新上场前,别忽视身体的系统性风险!30+交易者容易陷入“表面无事,实则透支”的危险区间,务必关注这4个核心检测点: ① CAC+Lp(a)测心血管 ② 低剂量肺CT查后遗症 ③ CGM监测血糖(血糖波动=决策质量下降) ④ hs-CRP//HRV量化恢复
显示更多
0
0
59
547
135
转发到社区
AI Dance
@AI_Whisper_X
2026.05.09 04:16
翁家翌新 blog:超越梯度的学习 昨天看到翁家翌(前 OpenAI 研究员)新写了一篇 blog《Learning Beyond Gradients》,挺有意思的,分享一些我读下来的感受。 原文较长且偏技术,下面这版做了不少删减和重组,建议感兴趣的同学直接读原文 · · · 翁家翌:超越梯度的学习 持续学习(Continual Learning)之所以一直很难,很大程度上是因为神经网络的顽疾:灾难性遗忘。那如果我们不只盯着权重更新这一条路呢? 随着 LLM agent 越来越强,写代码这件事变得又快又好。但翁家翌注意到一个更有趣的现象:agent 可以反复读取失败信息、修改策略代码、添加测试、回放录像,让整套程序在不动任何网络权重的情况下持续变强。 · · · 这个视角让他重新审视了一个老朋友:heuristic,也就是手写规则和程序化策略。之前很多 heuristic 不是没用,而是维护太贵了,而coding agent 改变的正是这条维护曲线。那些曾经用完就扔的一次性补丁,开始变得值得长期拥有。 凡是能被持续迭代的东西,都开始变得更可解,这也恰恰是持续学习一直追求的目标。 它有没有可能成为继 pretraining → RLHF → 大规模 RL/RLVR 之后的下一个范式? · · · 翁家翌用 Codex(gpt-5.4)做了实验,纯写规则版本,完全不碰神经网络。结果超出预期: — Atari Breakout 的打砖块分数从 387 一路升到 864,达到理论最高分; — MuJoCo 四足和跑步机器人任务中,纯 Python 策略也跑进了常见 Deep RL 结果的量级,HalfCheetah 五轮均值 11836.7; — 跑完 Atari 全部 57 个游戏后,在相同的环境交互步数下,中位数得分已经远高于 PPO 这类标准算法。 这里被更新的对象早就不是单纯的策略函数了,而是一整套带着记忆、反馈入口和回归机制的软件系统。翁家翌把它叫作 Heuristic Learning(HL,启发式学习)。 (我自己也做过 evolve,但不训练神经网络,纯靠规则约束,感觉系统怎么都智能不起来。其实不管 RL 还是 HL,能不能跑起来都是看一件事,优化结果的评分能不能清晰定义。) · · · Heuristic Learning(HL) 是什么?HL 怎么持续学习? HL 的核心是用 coding agent 维护一个 Heuristic System(HS)。 和 Deep RL 的差异: — 反馈来源:不是 loss 函数,而是测试结果、环境奖励、日志、视频、失败模式分析; — 更新方式:不走反向传播,agent 直接改 policy、状态检测器、测试、配置或记忆结构; — 维护对象:不止一个 trace(黄金轨迹)、环境 wrapper 等。 以前怎么没人搞?专家系统 70 年代就有,但人维护起来是噩梦:加一条规则修好 case A,case B 崩了;规则堆到几百条后,除了原作者没人看得懂。 而 coding agent 不怕堆规则。它能同时读所有代码、跑全量测试、对比日志,把维护成本打下来。用翁的比喻说,就像纺纱机改变纺线成本曲线一样:手工纺贵得要死,机器一上来就塌掉了。 · · · Heuristic Learning 怎么做 Continual Learning 神经网络把经验压进权重,忘没忘、怎么忘的都是黑箱。HL 的历史则是显式的:版本 diff、回归测试、replay、视频、golden trace 全透明。新增能力前先固化旧能力:跑回归测试、跑固定种子回放。如果新规则破坏旧 case,agent 能直接定位到哪行代码引入的 regression。 但规则叠太多、agent 自己都维护不动的时候,就需要"历史压缩",把一堆 case-specific 的补丁合并成更通用的逻辑,否则系统迟早变成没人敢碰的代码泥球。 · · · 当然,HL 不是万能药。因为 Heuristic Learning 并不能做所有神经网络能做的事情。它的上限卡在代码的表达能力:比如复杂感知和长程泛化。翁家翌也坦率地说,他想不出有哪个 agent 能纯靠 Python、不用网络去搞定 ImageNet。 所以真正的问题变成了:怎么把神经网络和 HL 结合起来,同时搞定在线学习和持续学习? 最有希望的方向是:用 HL 快速处理在线数据,把在线经验变成可训练、可回归、可筛选的数据,再周期性地更新神经网络。以机器人为例,借用 System 1 / System 2 的说法,一种可能的分工是: — 专用浅层 NN 作为 System 1 的一部分:快、便宜,负责感知、分类、物体状态估计; — HL 也可以当做 System 1 的一部分:负责最新数据处理、规则、测试、回放、memory、安全边界、局部恢复; — LLM agent 作为 System 2:负责给 HL 提供反馈、改进数据,并周期性把 HL 生成的数据拿过来更新自己。 · · · Agentic coding 改变的不仅是写代码的速度,更改变了"哪些代码值得被长期拥有"。过去很多 heuristic 看上去没前途,不是它们太弱,而是维护不起。 coding agent 改变的就是这条维护成本曲线。 规则、测试、日志、记忆和补丁,原来只是散落的工程材料,现在开始能组成一个持续进化的 Heuristic System,去解决在线学习和持续学习一直没搞定的事。 欢迎来到下一个范式。 · so,skills + instruction following = AGI?
显示更多
0
0
1
171
41
转发到社区
無名先生
@Wuming_Mr_
2026.05.06 04:15
Bitcoin 正坐在一把上膛的枪口上 仔细看: $80K 心理阻力位 上方存在头肩顶(H&S)形态 恐惧与贪婪指数在 50 三个信号——指向同一个方向 这个形态不在乎大家都在看 $90K+ $70K 的假跌破已经发生——那是警告 我的判断没有改变: 先下跌,再上涨 下一步:回测 $70K,然后再做方向选择 关注 + 打开通知!
显示更多
0
0
17
34
7
转发到社区
無名先生
@Wuming_Mr_
2026.05.07 15:47
🚨 很多人以为真正的上涨已经开始了。 但市场最喜欢做的事: 就是在启动前, 再狠狠干掉最后一批多头 👀 现在: ❌ $80K 强压制 ❌ H&S 结构形成中 ❌ 市场重新开始 FOMO 而我认为: $70K 的最后一跌, 才是真正关键的位置。 因为: 聪明资金不是在追高时买入。 而是在所有人再次恐慌时, 悄悄接货。 #
BTC
#
显示更多
0
0
22
11
5
转发到社区
加载中...