註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

rick awsb ($people, $people)
@rickawsb
瞎读书,乱解释,买啥亏啥,宏观小学生,政经评论外卖员,正在ai中慢慢迷失自我,crypto holder, defi farmer, not financial advice 非投资建议
加入 November 2017
12.3K 正在關注    145.1K 粉絲
马斯克今天宣布收购cursor,openai发布codex新版向开发者倾斜,加上之前的anthropic focus企业用户大科技,GLM变相涨价限制普通用户倾向开发者。。。 这些种种行为说明通过代码生成能力不断提升而实现模型领先甚至agi已经成为了更广泛的市场玩家的共识 这是目前最优训练路径的选择。 相比自然语言,代码具备三个关键优势: 一是强可验证性,能否运行、是否通过测试,都提供了极高质量的反馈信号; 二是天然结构化,语法、逻辑、模块化组合,本质上是对人类思维过程的压缩表达; 三是任务复杂度高,天然包含多步推理、状态管理和调试迭代。这使得模型可以在“写代码—运行—报错—修复”的闭环中持续自我强化,这一点极其接近真正的智能系统。 因此,行业并不是在押注“写代码”这个应用本身,而是在利用代码这个环境,训练模型的推理能力、问题分解能力以及迭代能力。代码只是载体,目标是让模型具备工程师级别的解决问题能力。这也是为什么在传统 scaling law 边际递减的背景下,代码成为新的增长引擎:它提供了更密集、更可靠、更可自动化的训练信号,同时也具备清晰的商业化路径。 但代码并不是终点。它的局限同样明显:完全规则化、缺乏物理约束、偏符号系统。这意味着,仅靠代码路径,很难解决现实世界中的不确定性、噪声和复杂环境问题。 于是杨立坤的第二条路径也收获了不少市场关注:把模型放入“有反馈的现实系统”中。核心不是机器人本身,而是构建一个类似代码环境的闭环——决策、执行、反馈、修正。 这条路径同样具备闭环能力,但在可规模化上受限于物理世界,无法像代码那样高速扩张。但它的价值在于,它更接近真实世界,也更接近AGI所需要的“行动能力”。如果说代码路径训练的是“如何思考”,那么现实闭环路径训练的是“如何行动”。 最终的形态,很可能是两条路径的融合:代码能力提供“思考”,现实闭环提供“行动”,共同构成真正的 agent 系统。这也是当前从“模型”向“系统”的转变核心。AGI的路径很可能会是:先在代码中学会思考,再在现实中学会行动。
顯示更多
0
7
45
11
轉發到社區