搜尋 Beyond 相關推文 — 推特瀏覽器

2026.05.29 08:24

澳门 BEYOND Expo @beyondtechexpo 现场直击⚡️⚡️ 🎙️HTX DAO 建设大使Molly @HTX_Molly 亮相分享：当投机潮水退去，行业会从流量竞争，走向信任竞争；从短期热闹，走向长期建设。这也是 $HTX 的长期价值逻辑正在被看见的地方：不只是一枚代币，而是和 HTX 生态、用户信任、长期建设一起往前走。小编来给大家划一下重点：潮水会退，建设不退！Keep building 💪💪 #HTXDAO# #HTX#

0

6

8

1

轉發到社區

一阁@yegle

2026.06.06 21:47

后知后觉Beyond的光辉岁月是祝贺南非曼德拉释放写的，所以歌词里写 “黑色肌肤给他的意义，是一生奉献肤色斗争中”。国语版歌词完全无关原版了

0

1

轉發到社區

Gracy Chen @Bitget@GracyBitget

2026.05.28 15:11

明天的@beyondtechexpo，除了10:35am的keynote，2:30pm我还会参加一场关于AI的panel。 Bitget今年最重点押注的几个方向，UEX、AI、RWA，全部都会聊到。会场见啦 👋 （需要门票可以用两张海报右下角的邀请码换领～）

0

11

34

1

轉發到社區

Chris Lee@ViewsOfChris

2026.05.08 09:57

最爱Beyond、张国荣，那经典的回忆听的音乐，由英文歌、粤语歌，现在更喜欢国语歌… 更喜欢半吨兄弟、烟嗓陈叔这类的演绎，也尝试听刘宇宁… 是改变，也是意味着中年的自己，be myself … 这几年，越来越爱中国文化，根和底子还是挺中国的，虽然由小到大的教育都是英式，在澳大利亚和新加坡都待了不短时间，毕业后就是MNC，2011年正式觉得要赶上中国经济的腾飞… 最爱的歌曲还是Beyond、张国荣，那是青春的回忆… 自己飞逝的时间，再多的钱，也买不回来。短暂的停留也是奢侈…

0

24

21

0

轉發到社區

冰凌紫萱@binglingzixuan

2026.04.18 03:15

葬送的芙莉莲精灵cos(Frieren: Beyond Journey's End cosplay) VS 法国黑人@madbrosxxx 本公主360部视频已在台湾fansone平台上架永久电报群也已经更新400+完整视频欢迎入🚪只要520RMB自助机器人两者都支持Alipay/WeChat/USDT/visa等各种支付方式🙏

0

50

9K

1.3K

轉發到社區

rick awsb ($people, $people)@rickawsb

2026.05.17 19:09

Scaling Law正在被重新Scaling ---openai核心研究员最新论文《Learning Beyond Gradients》解读过去几年，AI行业几乎默认更大的参数、更多的数据、更长的训练、更强的GPU，就是更强的模型，就是scaling law。过去几个月，行业开始认为，更多的推理，更多的agent，就能完成更长时、更高价值的任务，就是更强的智能。这构成了行业对scaling law的理解，而只要Scaling Law继续成立，模型就会不断逼近AGI。最近的openai核心研究员翁家翌的一篇论文《Learning Beyond Gradients》，提出了一个全新的scaling维度：AI不一定只能通过梯度下降学习，也可以通过heuristic、policy、workflow、strategy、code generation不断修改自己的行为系统。这是继agentic和harness之后，AI行业可能正在从“Scaling Model”，进入“Scaling System”的阶段一个最新的重要进展。过去AI的能力飞轮，本质上是：更多数据→更大模型→更强能力→更多用户→更多数据。但现在，论文要告诉我们的是，新的能力飞轮：更强模型→更强heuristic generation→更强runtime system→更强Agent能力→更多真实世界反馈→更强runtime evolution→反过来增强模型表现。行业正在加速的从：智能 = weights。过度到：智能 = weights + runtime system。 LLM本质上是输入→Transformer→输出。模型训练结束之后，能力基本冻结。学习主要发生在梯度下降、反向传播和weight update里。也就是说，learning = 修改参数。 LLM就像人类的大脑，参数就像脑细胞。但现实世界的大量复杂能力，其实并不完全来自参数。就像人类文明真正强大的地方，也不仅仅是大脑本身。真正让文明爆炸的，是语言、文字、工具、数学、workflow、软件系统、组织结构、科学方法。这些本质上都是“外部heuristic system”。《Learning Beyond Gradients》，的创新，在于它开始尝试把“学习”从参数空间里解放出来。过去是：reward → gradient → weights。现在开始变成：feedback → heuristic modification → runtime evolution。学习开始发生在program space，而不是parameter space。 heuristic，还有点像专家系统，但极大的增强了其能力：过去的专家系统，规则由人类写；现在，规则开始由LLM自动生成。这是在效率上的从量变到质化。传统专家系统失败，并不完全因为“规则”方向错了，而是因为人类无法维护超大规模动态规则系统。过去写规则太慢、修改规则太贵、规则之间容易冲突、长尾case会爆炸、系统复杂度会失控，所以专家系统最终被深度学习取代。但LLM的出现改变了这个约束。现在规则生成成本接近于0。模型不仅能生成规则、修改规则、删除规则、调试规则，还开始能自动生成workflow、tool graph、planner、memory strategy，甚至修复agent行为。这意味着，AI开始能够修改自己的运行时系统。于是，越来越多能力开始从“模型本身”外溢到memory、planner、search、tool use、verifier、runtime orchestration这些系统结构里。更大的模型 = 更强的AI，变成：更强的模型 × 更强的runtime system = 更强的AI。这会形成一个新的能力飞轮。过去AI只有“模型scaling”。未来AI会开始出现：Model Scaling × System Scaling × Runtime Self-Improvement。我们很可能正在从去年底的scaling law，迈入到现在的heuristic驱动的，结合agent和harness的scaling law的平方。更重要的是，runtime system的增长现在其实才刚开始。今天很多Agent系统仍然非常早期。memory很弱、planner很弱、workflow persistence很弱、long-horizon task能力很弱，本质上还处于“DOS时代”。但接下来，同一个基础模型，在不同Harness之下，实际能力可能相差几十倍。因为很多复杂任务的瓶颈，已经不是“模型会不会”，而是“系统能不能持续组织行为”。这也是为什么，未来最重要的竞争，可能不再只是“谁的参数最多”，而是“谁最先形成：模型 + memory + tool ecosystem + heuristic runtime + self-improving harness”的闭环。某种意义上，Transformer越来越像“认知内核”。真正的AGI，可能是围绕Transformer构建出来的runtime civilization、heuristic ecosystem、agent society、memory graph、self-improvement loop的组合体。《Learning Beyond Gradients》最让我兴奋的地方，其实并不是“超越梯度”。而是它开始尝试：把Scaling Law本身，也变成一个可以被继续Scaling的系统。

0

12

83

15

轉發到社區

AI Dance@AI_Whisper_X

2026.05.09 04:16

翁家翌新 blog：超越梯度的学习昨天看到翁家翌（前 OpenAI 研究员）新写了一篇 blog《Learning Beyond Gradients》，挺有意思的，分享一些我读下来的感受。原文较长且偏技术，下面这版做了不少删减和重组，建议感兴趣的同学直接读原文 · · · 翁家翌：超越梯度的学习持续学习（Continual Learning）之所以一直很难，很大程度上是因为神经网络的顽疾：灾难性遗忘。那如果我们不只盯着权重更新这一条路呢？随着 LLM agent 越来越强，写代码这件事变得又快又好。但翁家翌注意到一个更有趣的现象：agent 可以反复读取失败信息、修改策略代码、添加测试、回放录像，让整套程序在不动任何网络权重的情况下持续变强。 · · · 这个视角让他重新审视了一个老朋友：heuristic，也就是手写规则和程序化策略。之前很多 heuristic 不是没用，而是维护太贵了，而coding agent 改变的正是这条维护曲线。那些曾经用完就扔的一次性补丁，开始变得值得长期拥有。凡是能被持续迭代的东西，都开始变得更可解，这也恰恰是持续学习一直追求的目标。它有没有可能成为继 pretraining → RLHF → 大规模 RL/RLVR 之后的下一个范式？ · · · 翁家翌用 Codex（gpt-5.4）做了实验，纯写规则版本，完全不碰神经网络。结果超出预期： — Atari Breakout 的打砖块分数从 387 一路升到 864，达到理论最高分； — MuJoCo 四足和跑步机器人任务中，纯 Python 策略也跑进了常见 Deep RL 结果的量级，HalfCheetah 五轮均值 11836.7； — 跑完 Atari 全部 57 个游戏后，在相同的环境交互步数下，中位数得分已经远高于 PPO 这类标准算法。这里被更新的对象早就不是单纯的策略函数了，而是一整套带着记忆、反馈入口和回归机制的软件系统。翁家翌把它叫作 Heuristic Learning（HL，启发式学习）。（我自己也做过 evolve，但不训练神经网络，纯靠规则约束，感觉系统怎么都智能不起来。其实不管 RL 还是 HL，能不能跑起来都是看一件事，优化结果的评分能不能清晰定义。） · · · Heuristic Learning（HL）是什么？HL 怎么持续学习？ HL 的核心是用 coding agent 维护一个 Heuristic System（HS）。和 Deep RL 的差异： — 反馈来源：不是 loss 函数，而是测试结果、环境奖励、日志、视频、失败模式分析； — 更新方式：不走反向传播，agent 直接改 policy、状态检测器、测试、配置或记忆结构； — 维护对象：不止一个 trace（黄金轨迹）、环境 wrapper 等。以前怎么没人搞？专家系统 70 年代就有，但人维护起来是噩梦：加一条规则修好 case A，case B 崩了；规则堆到几百条后，除了原作者没人看得懂。而 coding agent 不怕堆规则。它能同时读所有代码、跑全量测试、对比日志，把维护成本打下来。用翁的比喻说，就像纺纱机改变纺线成本曲线一样：手工纺贵得要死，机器一上来就塌掉了。 · · · Heuristic Learning 怎么做 Continual Learning 神经网络把经验压进权重，忘没忘、怎么忘的都是黑箱。HL 的历史则是显式的：版本 diff、回归测试、replay、视频、golden trace 全透明。新增能力前先固化旧能力：跑回归测试、跑固定种子回放。如果新规则破坏旧 case，agent 能直接定位到哪行代码引入的 regression。但规则叠太多、agent 自己都维护不动的时候，就需要"历史压缩"，把一堆 case-specific 的补丁合并成更通用的逻辑，否则系统迟早变成没人敢碰的代码泥球。 · · · 当然，HL 不是万能药。因为 Heuristic Learning 并不能做所有神经网络能做的事情。它的上限卡在代码的表达能力：比如复杂感知和长程泛化。翁家翌也坦率地说，他想不出有哪个 agent 能纯靠 Python、不用网络去搞定 ImageNet。所以真正的问题变成了：怎么把神经网络和 HL 结合起来，同时搞定在线学习和持续学习？最有希望的方向是：用 HL 快速处理在线数据，把在线经验变成可训练、可回归、可筛选的数据，再周期性地更新神经网络。以机器人为例，借用 System 1 / System 2 的说法，一种可能的分工是： — 专用浅层 NN 作为 System 1 的一部分：快、便宜，负责感知、分类、物体状态估计； — HL 也可以当做 System 1 的一部分：负责最新数据处理、规则、测试、回放、memory、安全边界、局部恢复； — LLM agent 作为 System 2：负责给 HL 提供反馈、改进数据，并周期性把 HL 生成的数据拿过来更新自己。 · · · Agentic coding 改变的不仅是写代码的速度，更改变了"哪些代码值得被长期拥有"。过去很多 heuristic 看上去没前途，不是它们太弱，而是维护不起。 coding agent 改变的就是这条维护成本曲线。规则、测试、日志、记忆和补丁，原来只是散落的工程材料，现在开始能组成一个持续进化的 Heuristic System，去解决在线学习和持续学习一直没搞定的事。欢迎来到下一个范式。 · so，skills + instruction following = AGI？

0

1

171

41

轉發到社區

memory@The_Wooo

2026.03.09 12:46

最近市场整体不太好，资金都比较谨慎，但比特币生态反而开始慢慢有新东西冒出来。一个挺有意思的项目是@beyond__tech。它做的事情很简单，就是想把比特币变成真正能和其他链互通的网络。现在 BTC、BRC20、Runes 这些资产基本都在自己的体系里转，但 Beyond 想把它们和 ETH、Solana 等 70 多条链打通，让资产可以更自由地流动。项目主网预计 2026 年 4 月上线，现在测试网已经准备好了，正好处在叙事刚开始发酵的阶段。代币 $BYD 的启动估值只有 500 万美金，在基础设施赛道里算是非常低的。分配也比较偏社区，10% 给 NFT 持有者，30%会通过排行榜和空投给早期用户，团队初始没有代币。如果想更早参与，可以关注 Echoports NFT。总量 5555 枚，3 月 12 日铸造，价格 0.000999 BTC。不同等级会给 1.2 倍到 3 倍积分加成，未来会直接影响 $BYD 的空投数量。让比特币真正和整个多链世界连接起来。没有投资建议，拿了合作的 WL 感兴趣的也可以在推文留bc1p地址，有3个WL

0

114

122

3

轉發到社區

湿润兔UrumiBunny@UrumiBunny

2026.02.02 17:15

“老師，這種心率波動，超出了計算範圍~” ——『碧藍檔案-調月莉音』 "Teacher, this heart rate fluctuation is beyond the calculation range~" ——『Blue Archive-Tsukatsuki Rio』

0

13

5.2K

239

轉發到社區