註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 Beyond
Beyond 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 Beyond 的搜尋結果
澳门 BEYOND Expo @beyondtechexpo 现场直击⚡️⚡️ 🎙️HTX DAO 建设大使Molly @HTX_Molly 亮相分享:当投机潮水退去,行业会从流量竞争,走向信任竞争;从短期热闹,走向长期建设。 这也是 $HTX 的长期价值逻辑正在被看见的地方:不只是一枚代币,而是和 HTX 生态、用户信任、长期建设一起往前走。 小编来给大家划一下重点: 潮水会退,建设不退!Keep building 💪💪 #HTXDAO# #HTX#
顯示更多
后知后觉Beyond的光辉岁月是祝贺南非曼德拉释放写的,所以歌词里写 “黑色肌肤给他的意义,是一生奉献肤色斗争中”。国语版歌词完全无关原版了
明天的@beyondtechexpo,除了10:35am的keynote,2:30pm我还会参加一场关于AI的panel。 Bitget今年最重点押注的几个方向,UEX、AI、RWA,全部都会聊到。 会场见啦 👋 (需要门票可以用两张海报右下角的邀请码换领~)
顯示更多
0
11
34
1
轉發到社區
最爱Beyond、张国荣,那经典的回忆 听的音乐,由英文歌、粤语歌,现在更喜欢国语歌… 更喜欢半吨兄弟、烟嗓陈叔这类的演绎,也尝试听刘宇宁… 是改变,也是意味着中年的自己,be myself … 这几年,越来越爱中国文化,根和底子还是挺中国的,虽然由小到大的教育都是英式,在澳大利亚和新加坡都待了不短时间,毕业后就是MNC,2011年正式觉得要赶上中国经济的腾飞… 最爱的歌曲还是Beyond、张国荣,那是青春的回忆… 自己飞逝的时间,再多的钱,也买不回来。 短暂的停留也是奢侈…
顯示更多
0
24
21
0
轉發到社區
葬送的芙莉莲精灵cos(Frieren: Beyond Journey's End cosplay) VS 法国黑人@madbrosxxx 本公主360部视频已在台湾fansone平台上架 永久电报群也已经更新400+完整视频欢迎入🚪只要520RMB自助机器人 两者都支持Alipay/WeChat/USDT/visa等各种支付方式🙏
顯示更多
0
50
9K
1.3K
轉發到社區
Scaling Law正在被重新Scaling ---openai核心研究员最新论文《Learning Beyond Gradients》解读 过去几年,AI行业几乎默认更大的参数、更多的数据、更长的训练、更强的GPU,就是更强的模型,就是scaling law。 过去几个月,行业开始认为,更多的推理,更多的agent,就能完成更长时、更高价值的任务,就是更强的智能。 这构成了行业对scaling law的理解,而只要Scaling Law继续成立,模型就会不断逼近AGI。 最近的openai核心研究员翁家翌的一篇论文《Learning Beyond Gradients》,提出了一个全新的scaling维度:AI不一定只能通过梯度下降学习,也可以通过heuristic、policy、workflow、strategy、code generation不断修改自己的行为系统。 这是继agentic和harness之后,AI行业可能正在从“Scaling Model”,进入“Scaling System”的阶段一个最新的重要进展。 过去AI的能力飞轮,本质上是:更多数据→更大模型→更强能力→更多用户→更多数据。 但现在,论文要告诉我们的是,新的能力飞轮:更强模型→更强heuristic generation→更强runtime system→更强Agent能力→更多真实世界反馈→更强runtime evolution→反过来增强模型表现。 行业正在加速的从:智能 = weights。过度到:智能 = weights + runtime system。 LLM本质上是输入→Transformer→输出。 模型训练结束之后,能力基本冻结。学习主要发生在梯度下降、反向传播和weight update里。也就是说,learning = 修改参数。 LLM就像人类的大脑,参数就像脑细胞。但现实世界的大量复杂能力,其实并不完全来自参数。 就像人类文明真正强大的地方,也不仅仅是大脑本身。真正让文明爆炸的,是语言、文字、工具、数学、workflow、软件系统、组织结构、科学方法。这些本质上都是“外部heuristic system”。 《Learning Beyond Gradients》,的创新,在于它开始尝试把“学习”从参数空间里解放出来。过去是:reward → gradient → weights。现在开始变成:feedback → heuristic modification → runtime evolution。学习开始发生在program space,而不是parameter space。 heuristic,还有点像专家系统,但极大的增强了其能力:过去的专家系统,规则由人类写;现在,规则开始由LLM自动生成。这是在效率上的从量变到质化。 传统专家系统失败,并不完全因为“规则”方向错了,而是因为人类无法维护超大规模动态规则系统。过去写规则太慢、修改规则太贵、规则之间容易冲突、长尾case会爆炸、系统复杂度会失控,所以专家系统最终被深度学习取代。 但LLM的出现改变了这个约束。现在规则生成成本接近于0。模型不仅能生成规则、修改规则、删除规则、调试规则,还开始能自动生成workflow、tool graph、planner、memory strategy,甚至修复agent行为。 这意味着,AI开始能够修改自己的运行时系统。于是,越来越多能力开始从“模型本身”外溢到memory、planner、search、tool use、verifier、runtime orchestration这些系统结构里。 更大的模型 = 更强的AI,变成:更强的模型 × 更强的runtime system = 更强的AI。这会形成一个新的能力飞轮。 过去AI只有“模型scaling”。未来AI会开始出现:Model Scaling × System Scaling × Runtime Self-Improvement。 我们很可能正在从去年底的scaling law,迈入到现在的heuristic驱动的,结合agent和harness的scaling law的平方。 更重要的是,runtime system的增长现在其实才刚开始。今天很多Agent系统仍然非常早期。memory很弱、planner很弱、workflow persistence很弱、long-horizon task能力很弱,本质上还处于“DOS时代”。 但接下来,同一个基础模型,在不同Harness之下,实际能力可能相差几十倍。因为很多复杂任务的瓶颈,已经不是“模型会不会”,而是“系统能不能持续组织行为”。 这也是为什么,未来最重要的竞争,可能不再只是“谁的参数最多”,而是“谁最先形成:模型 + memory + tool ecosystem + heuristic runtime + self-improving harness”的闭环。 某种意义上,Transformer越来越像“认知内核”。真正的AGI,可能是围绕Transformer构建出来的runtime civilization、heuristic ecosystem、agent society、memory graph、self-improvement loop的组合体。 《Learning Beyond Gradients》最让我兴奋的地方,其实并不是“超越梯度”。而是它开始尝试:把Scaling Law本身,也变成一个可以被继续Scaling的系统。
顯示更多
0
12
83
15
轉發到社區
翁家翌新 blog:超越梯度的学习 昨天看到翁家翌(前 OpenAI 研究员)新写了一篇 blog《Learning Beyond Gradients》,挺有意思的,分享一些我读下来的感受。 原文较长且偏技术,下面这版做了不少删减和重组,建议感兴趣的同学直接读原文 · · · 翁家翌:超越梯度的学习 持续学习(Continual Learning)之所以一直很难,很大程度上是因为神经网络的顽疾:灾难性遗忘。那如果我们不只盯着权重更新这一条路呢? 随着 LLM agent 越来越强,写代码这件事变得又快又好。但翁家翌注意到一个更有趣的现象:agent 可以反复读取失败信息、修改策略代码、添加测试、回放录像,让整套程序在不动任何网络权重的情况下持续变强。 · · · 这个视角让他重新审视了一个老朋友:heuristic,也就是手写规则和程序化策略。之前很多 heuristic 不是没用,而是维护太贵了,而coding agent 改变的正是这条维护曲线。那些曾经用完就扔的一次性补丁,开始变得值得长期拥有。 凡是能被持续迭代的东西,都开始变得更可解,这也恰恰是持续学习一直追求的目标。 它有没有可能成为继 pretraining → RLHF → 大规模 RL/RLVR 之后的下一个范式? · · · 翁家翌用 Codex(gpt-5.4)做了实验,纯写规则版本,完全不碰神经网络。结果超出预期: — Atari Breakout 的打砖块分数从 387 一路升到 864,达到理论最高分; — MuJoCo 四足和跑步机器人任务中,纯 Python 策略也跑进了常见 Deep RL 结果的量级,HalfCheetah 五轮均值 11836.7; — 跑完 Atari 全部 57 个游戏后,在相同的环境交互步数下,中位数得分已经远高于 PPO 这类标准算法。 这里被更新的对象早就不是单纯的策略函数了,而是一整套带着记忆、反馈入口和回归机制的软件系统。翁家翌把它叫作 Heuristic Learning(HL,启发式学习)。 (我自己也做过 evolve,但不训练神经网络,纯靠规则约束,感觉系统怎么都智能不起来。其实不管 RL 还是 HL,能不能跑起来都是看一件事,优化结果的评分能不能清晰定义。) · · · Heuristic Learning(HL) 是什么?HL 怎么持续学习? HL 的核心是用 coding agent 维护一个 Heuristic System(HS)。 和 Deep RL 的差异: — 反馈来源:不是 loss 函数,而是测试结果、环境奖励、日志、视频、失败模式分析; — 更新方式:不走反向传播,agent 直接改 policy、状态检测器、测试、配置或记忆结构; — 维护对象:不止一个 trace(黄金轨迹)、环境 wrapper 等。 以前怎么没人搞?专家系统 70 年代就有,但人维护起来是噩梦:加一条规则修好 case A,case B 崩了;规则堆到几百条后,除了原作者没人看得懂。 而 coding agent 不怕堆规则。它能同时读所有代码、跑全量测试、对比日志,把维护成本打下来。用翁的比喻说,就像纺纱机改变纺线成本曲线一样:手工纺贵得要死,机器一上来就塌掉了。 · · · Heuristic Learning 怎么做 Continual Learning 神经网络把经验压进权重,忘没忘、怎么忘的都是黑箱。HL 的历史则是显式的:版本 diff、回归测试、replay、视频、golden trace 全透明。新增能力前先固化旧能力:跑回归测试、跑固定种子回放。如果新规则破坏旧 case,agent 能直接定位到哪行代码引入的 regression。 但规则叠太多、agent 自己都维护不动的时候,就需要"历史压缩",把一堆 case-specific 的补丁合并成更通用的逻辑,否则系统迟早变成没人敢碰的代码泥球。 · · · 当然,HL 不是万能药。因为 Heuristic Learning 并不能做所有神经网络能做的事情。它的上限卡在代码的表达能力:比如复杂感知和长程泛化。翁家翌也坦率地说,他想不出有哪个 agent 能纯靠 Python、不用网络去搞定 ImageNet。 所以真正的问题变成了:怎么把神经网络和 HL 结合起来,同时搞定在线学习和持续学习? 最有希望的方向是:用 HL 快速处理在线数据,把在线经验变成可训练、可回归、可筛选的数据,再周期性地更新神经网络。以机器人为例,借用 System 1 / System 2 的说法,一种可能的分工是: — 专用浅层 NN 作为 System 1 的一部分:快、便宜,负责感知、分类、物体状态估计; — HL 也可以当做 System 1 的一部分:负责最新数据处理、规则、测试、回放、memory、安全边界、局部恢复; — LLM agent 作为 System 2:负责给 HL 提供反馈、改进数据,并周期性把 HL 生成的数据拿过来更新自己。 · · · Agentic coding 改变的不仅是写代码的速度,更改变了"哪些代码值得被长期拥有"。过去很多 heuristic 看上去没前途,不是它们太弱,而是维护不起。 coding agent 改变的就是这条维护成本曲线。 规则、测试、日志、记忆和补丁,原来只是散落的工程材料,现在开始能组成一个持续进化的 Heuristic System,去解决在线学习和持续学习一直没搞定的事。 欢迎来到下一个范式。 · so,skills + instruction following = AGI?
顯示更多
0
1
171
41
轉發到社區
最近市场整体不太好,资金都比较谨慎,但比特币生态反而开始慢慢有新东西冒出来。 一个挺有意思的项目是@beyond__tech。它做的事情很简单,就是想把比特币变成真正能和其他链互通的网络。现在 BTC、BRC20、Runes 这些资产基本都在自己的体系里转,但 Beyond 想把它们和 ETH、Solana 等 70 多条链打通,让资产可以更自由地流动。 项目主网预计 2026 年 4 月上线,现在测试网已经准备好了,正好处在叙事刚开始发酵的阶段。 代币 $BYD 的启动估值只有 500 万美金,在基础设施赛道里算是非常低的。分配也比较偏社区,10% 给 NFT 持有者,30%会通过排行榜和空投给早期用户,团队初始没有代币。 如果想更早参与,可以关注 Echoports NFT。总量 5555 枚,3 月 12 日铸造,价格 0.000999 BTC。不同等级会给 1.2 倍到 3 倍积分加成,未来会直接影响 $BYD 的空投数量。 让比特币真正和整个多链世界连接起来。 没有投资建议,拿了合作的 WL 感兴趣的也可以在推文留bc1p地址,有3个WL
顯示更多
0
114
122
3
轉發到社區
“老師,這種心率波動,超出了計算範圍~” ——『碧藍檔案-調月莉音』 "Teacher, this heart rate fluctuation is beyond the calculation range~" ——『Blue Archive-Tsukatsuki Rio』
顯示更多
0
13
5.2K
239
轉發到社區