注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 holoEN
holoEN 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 holoEN 的推特
在Holo en café 跟等身Ame立牌拍拍✨ #ameliaRT#
0
9
517
55
转发到社区
Agent 需要什么样的基础工具集合 看到大家在聊 Agent 工具集的问题——是不是提供一个 shell 就都搞定了?做了 holon 之后发现,其实没有那么简单。 读:为什么放弃了 Read/Glob,全走 shell holon 的工具集改了几个版本,最后废弃了类似 Claude Code 提供的 Read(读文件)、Glob(模式搜索)这类专用工具,读取和查找全部通过 shell 来完成。这和 Codex 的路线一致——Codex 的 ExecCommand 一把梭,读文件就是 cat,搜代码就是 rg,不再单独给每种"读"操作定义一个工具。 这样做的理由很朴素:shell 是 LLM 最熟悉的"编程语言"。与其让模型去学你定义的 Read 工具的参数语义,不如直接让它写已经训练了几十亿次的 shell 命令。每多一个专用工具,模型的认知负担就加一层;而 shell 这个界面,模型已经足够熟练了。 但全走 shell 有一个代价:输出截断。框架为了避免 shell 返回值太长撑爆上下文,会给每个命令设输出上限。Agent 用 cat 读一个大文件,可能只拿到前半截,剩下的在 artifact 文件里,还得再 cat 一次甚至多次才能读完。Claude Code 的 Read 工具压缩阈值比通用 shell 高很多,读大文件一步到位,少了好几个来回。本质上是取舍:少定义工具降低认知负担,但专用工具在边界场景效率更高。 写:从 sed 到 ApplyPatch,以及 free grammar tool 的难题 但写操作就无法完全用 shell 搞定。 如果让 Agent 全用 sed 做编辑,就会发现遇到复杂的多行匹配很难处理——换行、转义、缩进,任何一层出了问题都会导致编辑失败。所以很多系统会提供 Replace String 这样的编辑工具,让 Agent 传一大段 old_string 来精确匹配并替换成 new_string。虽然笨拙,但比 sed 稳得多。 Codex 则走得更远,发明了自己的 ApplyPatch 工具,让 Agent 直接生成 patch,一次搞定批量编辑。holon 就借鉴了这个思路。 但落地的时候踩到一个坑:Codex 用的是一套 OpenAI 自己定义的简化 patch 格式,并且搭配了一种叫做 free grammar tool 的特殊工具机制来解决格式传递问题。 为什么要专门搞一种新机制?因为 LLM 的标准工具定义都是 tool(args) 这种 JSON 参数格式。如果把 patch 作为 JSON 字符串参数传递,会牵扯到大量的转义——换行要变 \n,引号要加反斜杠,缩进也得小心处理。Agent 写 patch 时本身就容易出错,再叠一层 JSON 转义,出错概率翻倍。free grammar tool 的思路是把 patch 的原始文本直接作为 tool 的输入体,不经过 JSON 参数编码,模型写什么就是什么。这大幅降低了模型生成 patch 时的出错率。 而这套机制目前只有 OpenAI 的 Codex 接口支持。holon 是要兼容多模型提供方的,没法只靠这一条路。 于是 holon 的做法是:根据模型注入不同的 ApplyPatch 定义。对支持 free grammar 的模型,直接走原始 patch 格式;对其他模型,就接收标准的 git diff 格式。我觉得 LLM 经过 GitHub 上几十亿次 diff 的训练,对 git diff 格式应该相当熟练。实践下来效果还可以——虽然也常出错,但多数时候能改对,而且随着训练数据积累,这个能力只会越来越好。不过我还是建议各家模型厂商都支持一下 free grammar tool,这对 Agent 写代码的场景确实是刚需。 调度:长时间命令和 task 抽象 第三个问题是 Agent 执行的 shell 命令不一定会很快结束——启动 dev server、跑测试、构建项目,都可能跑很久,甚至根本不退出。早期的 Agent 框架处理得很粗暴:要么同步阻塞把自己卡死,要么所有命令一律丢后台,结果 Agent 把同一个命令反复执行很多遍。 现在业界逐渐收敛到一个基本共识:不给 Agent 暴露"前台/后台"的选择——这件事 Agent 自己判断不准。更好的方式是设置一个时间阈值,命令超时自动转后台,对 Agent 完全透明。Agent 不需要预判这个命令该不该放后台,runtime 自己处理就行。 但自动转后台只是第一步。转后台之后,真正的工程问题才浮出来——而这些问题,目前业界还没有标准答案。 首先是输出怎么读。后台任务可能还在跑也可能已经结束,输出可能很大。但各家 API 的语义并不统一——有的走轮询,有的走事件推送。 其次是任务怎么停。各家都有取消机制,但取消是即时 kill 还是优雅退出、已产生的部分输出要不要保留? 最后是谁来叫醒 Agent。Agent 把任务丢后台以后休眠了,任务结束那一刻谁来叫醒它?这要求 runtime 和 Agent 调度深度绑定,不是独立工具层能解决的。 这三件事——读输出、停任务、叫醒 Agent——合在一起,就是后台任务完整的生命周期管理。各家都实现了"能后台跑",但管理面还没有标准化方案,这可能是下一阶段 Agent 工具链演进的关键节点。 还没到无脑用一个现成模式的时候 所以回到开头的问题:shell 能解决 80%,但剩下 20%——编辑的精确性、patch 格式与模型能力的匹配、长任务的调度抽象——恰恰决定了 Agent 能不能从 demo 走向真正可用的系统。 工具集的选择远不止"封装一个 shell"那么简单,也远没到大家可以无脑套用一个现成模式的时候。这也是为什么 Codex 和 Claude Code 在这些基础问题上给出了不同的答案,而 holon 又根据自己的场景做了不同的取舍,这中间可以探索和改进的点,还很多。
显示更多
@brucexu_eth 阶段性校对是我和 Agent 交互实现的,或者是我明确给扫描目标。比如现在 holon 仓库里的这批 issue,就是 Agent 基于 rfc/spec 和代码实现比较发现的 gap
显示更多
从一间合租屋开始 SBF 用偷来的 $5 亿投了 Anthropic B 轮。 按今天 $3800 亿估值,这笔钱值 $300 亿。 但最有意思的不是回报率。是——他们为什么会认识? 答案是一个叫 EA(有效利他主义)的圈子。 ─── EA 是什么 EA 说的是:慈善不该凭感觉,该凭计算。 每一美元都该流向数学上「最大化善果」的方向。 三个分支: • 全球健康派:算出每美元能救多少命,疟疾蚊帐 > 捐母校 • 长期主义派:AI 失控是人类头号存在性风险 • 赚钱捐钱派:先赚到极限,再捐到极限 最后这条是 SBF 走的路。 ─── Daniela 与 Wendy Rhoades 2010 年代中期,旧金山有一群人住同类合租屋,参加同类聚会,读同类论文。 Dario Amodei 就泡在这里面。 他和 GiveWell 联创 Holden Karnofsky 住同一栋楼。Karnofsky 后来娶了 Dario 的姐姐 Daniela——Anthropic 联创兼总裁。 Daniela 让我想起《Billions》里的 Wendy Rhoades。 Wendy 表面是 Axe Capital 的心理医生,实际上是整个基金的精神锚点——她管的不是交易,是人,是信念,是压力下的判断力。 Daniela 在 Anthropic 扮演的是类似角色。八位联创,全部还在。这在 AI 赛道几乎是奇迹。这个行业 cofounder 分裂是常态,不是例外。 Anthropic 极低的核心团队离职率背后,是有人在管那件最难管的事:让一群极度聪明、极度自我的人,在同一个信念下持续协作。 妹夫 Karnofsky 2025 年 1 月悄悄加入负责安全策略,Fortune 记者发现前公司甚至没有对外宣布。 ─── 死亡诗社 vs EA 合租屋 这个场景让我想起死亡诗社。 同样是一小群极度聪明的人,密室聚会,信念互相强化,思想茧房。 但内核完全不同: 死亡诗社是浪漫主义的小圈子悲剧——反建制、反功利,产出是诗歌和自我觉醒,风险是个体悲剧(Neil 自杀)。 EA 合租屋是理性主义的小圈子帝国——用最功利的方式做最理想主义的事,产出是基金会、对冲基金、AI 公司,风险是系统性的(FTX 爆雷波及数百万人)。 社交结构一样,价值内核相反。 ─── 圈子内部的资金循环 SBF 为什么能找到 Anthropic? 不是什么天才投资眼光。是圈子内部的资金循环。 EA 历史上最大三个金主——Moskovitz、Jaan Tallinn、SBF——全是 Anthropic 早期投资者。Anthropic 最高治理机构「长期利益信托」四位成员里三位来自 EA 系统。 Dario 看到了足够多的红旗,所以给 SBF 的是无投票权股份,把他排在董事会外面。 这个决定后来被证明极其聪明。但也留下一个尖锐的问题: 红旗已经多到要做治理隔离了,为什么还是拿了? ─── EA 最深的 bug 它提供了一套看起来无懈可击的框架,来合理化极端行为。 SBF 的「赚钱捐钱」和 Anthropic 的「安全发展 AI」,其实共享同一个底层逻辑——为了足够大的善果,可以承受不寻常的手段和风险。 区别只在于 Anthropic 在犯罪线的安全一侧,SBF 越过去了。 但「必须自己建造最强大的 AI 才能确保 AI 安全」和「必须先赚到极限才能捐到极限」,逻辑结构上是同构的。 ─── True believer vs 生意人 从这个角度看 Anthropic vs OpenAI 的长期竞争—— Dario 是 true believer。使命是信仰,不是品牌叙事,也是他整个 social graph 的地基。 Sam 是生意人。OpenAI 从非盈利到 PBC,从 $29B 融资到 Microsoft 入股,每一步都是极其灵活的资本运作。拿下 Softbank、签白宫安全承诺——转身继续加速。 两个人在玩不同的游戏。 Dario 的风险:信仰系统一旦被质疑,整个叙事会动摇。 Sam 的风险:没有信仰系统,市场叙事转向时没有东西锚定。 ─── Sam 的打法:不是对抗,是收编 据传 OpenAI 开出约 $10 亿把 OpenClaw 创始人招入麾下,Meta 也在竞价,最终 Sam 拿下——保留开源特性,但核心创始人归队。 不管细节如何,这个模式是真实的。 Dario 在国会山说「AI 可能杀死很多人」——真诚,是 EA 思维的直接输出。 Sam 去白宫签安全承诺,同时把 GPT-4o 做成最好用的消费品——同时服务监管者和市场。 生意人的优势就是这个:他知道什么时候该出手,出多少,用什么结构谈。 ─── AI 的入口会是谁 但 Claude 这边也在加速。 去年拒绝签美国政府 AI 安全协议,让 Anthropic 的「安全」叙事有了真正的可信度。Opus 4.6 带来更强的正反馈系统,能力在持续复利。 但 Claude 最近推出的一系列功能,不少人说是在学 OpenClaw 的路子,生态也越来越封闭。 OpenAI 的平台生态?Anthropic 的安全叙事?还是我们还没看清的第三条路? SBF 不是「好人做了坏事」,是「聪明人用好人的叙事做了坏事」。 Anthropic 和 OpenAI 都是这场游戏的参与者,只是各自的赌注不同。 我们站在场外。但这个游戏的结果,会决定接下来十年所有人的上下文。
显示更多
0
11
55
7
转发到社区