搜索 holoEN 相关的推文

かめ🫧 ｜@kameka590892

2023.05.05 09:05

在Holo en café 跟等身Ame立牌拍拍✨ #ameliaRT#

0

9

517

55

转发到社区

jolestar@jolestar

10hours ago

Agent 需要什么样的基础工具集合看到大家在聊 Agent 工具集的问题——是不是提供一个 shell 就都搞定了？做了 holon 之后发现，其实没有那么简单。读：为什么放弃了 Read/Glob，全走 shell holon 的工具集改了几个版本，最后废弃了类似 Claude Code 提供的 Read（读文件）、Glob（模式搜索）这类专用工具，读取和查找全部通过 shell 来完成。这和 Codex 的路线一致——Codex 的 ExecCommand 一把梭，读文件就是 cat，搜代码就是 rg，不再单独给每种"读"操作定义一个工具。这样做的理由很朴素：shell 是 LLM 最熟悉的"编程语言"。与其让模型去学你定义的 Read 工具的参数语义，不如直接让它写已经训练了几十亿次的 shell 命令。每多一个专用工具，模型的认知负担就加一层；而 shell 这个界面，模型已经足够熟练了。但全走 shell 有一个代价：输出截断。框架为了避免 shell 返回值太长撑爆上下文，会给每个命令设输出上限。Agent 用 cat 读一个大文件，可能只拿到前半截，剩下的在 artifact 文件里，还得再 cat 一次甚至多次才能读完。Claude Code 的 Read 工具压缩阈值比通用 shell 高很多，读大文件一步到位，少了好几个来回。本质上是取舍：少定义工具降低认知负担，但专用工具在边界场景效率更高。写：从 sed 到 ApplyPatch，以及 free grammar tool 的难题但写操作就无法完全用 shell 搞定。如果让 Agent 全用 sed 做编辑，就会发现遇到复杂的多行匹配很难处理——换行、转义、缩进，任何一层出了问题都会导致编辑失败。所以很多系统会提供 Replace String 这样的编辑工具，让 Agent 传一大段 old_string 来精确匹配并替换成 new_string。虽然笨拙，但比 sed 稳得多。 Codex 则走得更远，发明了自己的 ApplyPatch 工具，让 Agent 直接生成 patch，一次搞定批量编辑。holon 就借鉴了这个思路。但落地的时候踩到一个坑：Codex 用的是一套 OpenAI 自己定义的简化 patch 格式，并且搭配了一种叫做 free grammar tool 的特殊工具机制来解决格式传递问题。为什么要专门搞一种新机制？因为 LLM 的标准工具定义都是 tool(args) 这种 JSON 参数格式。如果把 patch 作为 JSON 字符串参数传递，会牵扯到大量的转义——换行要变 \n，引号要加反斜杠，缩进也得小心处理。Agent 写 patch 时本身就容易出错，再叠一层 JSON 转义，出错概率翻倍。free grammar tool 的思路是把 patch 的原始文本直接作为 tool 的输入体，不经过 JSON 参数编码，模型写什么就是什么。这大幅降低了模型生成 patch 时的出错率。而这套机制目前只有 OpenAI 的 Codex 接口支持。holon 是要兼容多模型提供方的，没法只靠这一条路。于是 holon 的做法是：根据模型注入不同的 ApplyPatch 定义。对支持 free grammar 的模型，直接走原始 patch 格式；对其他模型，就接收标准的 git diff 格式。我觉得 LLM 经过 GitHub 上几十亿次 diff 的训练，对 git diff 格式应该相当熟练。实践下来效果还可以——虽然也常出错，但多数时候能改对，而且随着训练数据积累，这个能力只会越来越好。不过我还是建议各家模型厂商都支持一下 free grammar tool，这对 Agent 写代码的场景确实是刚需。调度：长时间命令和 task 抽象第三个问题是 Agent 执行的 shell 命令不一定会很快结束——启动 dev server、跑测试、构建项目，都可能跑很久，甚至根本不退出。早期的 Agent 框架处理得很粗暴：要么同步阻塞把自己卡死，要么所有命令一律丢后台，结果 Agent 把同一个命令反复执行很多遍。现在业界逐渐收敛到一个基本共识：不给 Agent 暴露"前台/后台"的选择——这件事 Agent 自己判断不准。更好的方式是设置一个时间阈值，命令超时自动转后台，对 Agent 完全透明。Agent 不需要预判这个命令该不该放后台，runtime 自己处理就行。但自动转后台只是第一步。转后台之后，真正的工程问题才浮出来——而这些问题，目前业界还没有标准答案。首先是输出怎么读。后台任务可能还在跑也可能已经结束，输出可能很大。但各家 API 的语义并不统一——有的走轮询，有的走事件推送。其次是任务怎么停。各家都有取消机制，但取消是即时 kill 还是优雅退出、已产生的部分输出要不要保留? 最后是谁来叫醒 Agent。Agent 把任务丢后台以后休眠了，任务结束那一刻谁来叫醒它？这要求 runtime 和 Agent 调度深度绑定，不是独立工具层能解决的。这三件事——读输出、停任务、叫醒 Agent——合在一起，就是后台任务完整的生命周期管理。各家都实现了"能后台跑"，但管理面还没有标准化方案，这可能是下一阶段 Agent 工具链演进的关键节点。还没到无脑用一个现成模式的时候所以回到开头的问题：shell 能解决 80%，但剩下 20%——编辑的精确性、patch 格式与模型能力的匹配、长任务的调度抽象——恰恰决定了 Agent 能不能从 demo 走向真正可用的系统。工具集的选择远不止"封装一个 shell"那么简单，也远没到大家可以无脑套用一个现成模式的时候。这也是为什么 Codex 和 Claude Code 在这些基础问题上给出了不同的答案，而 holon 又根据自己的场景做了不同的取舍，这中间可以探索和改进的点，还很多。

显示更多

0

2

11

0

转发到社区

jolestar@jolestar

2026.05.24 06:21

@brucexu_eth 阶段性校对是我和 Agent 交互实现的，或者是我明确给扫描目标。比如现在 holon 仓库里的这批 issue，就是 Agent 基于 rfc/spec 和代码实现比较发现的 gap

显示更多

0

1

0

1

转发到社区

Jocy@IOSGVC@jocyiosg

2026.03.31 07:39

从一间合租屋开始 SBF 用偷来的 $5 亿投了 Anthropic B 轮。按今天 $3800 亿估值，这笔钱值 $300 亿。但最有意思的不是回报率。是——他们为什么会认识？答案是一个叫 EA（有效利他主义）的圈子。 ─── EA 是什么 EA 说的是：慈善不该凭感觉，该凭计算。每一美元都该流向数学上「最大化善果」的方向。三个分支： • 全球健康派：算出每美元能救多少命，疟疾蚊帐 > 捐母校 • 长期主义派：AI 失控是人类头号存在性风险 • 赚钱捐钱派：先赚到极限，再捐到极限最后这条是 SBF 走的路。 ─── Daniela 与 Wendy Rhoades 2010 年代中期，旧金山有一群人住同类合租屋，参加同类聚会，读同类论文。 Dario Amodei 就泡在这里面。他和 GiveWell 联创 Holden Karnofsky 住同一栋楼。Karnofsky 后来娶了 Dario 的姐姐 Daniela——Anthropic 联创兼总裁。 Daniela 让我想起《Billions》里的 Wendy Rhoades。 Wendy 表面是 Axe Capital 的心理医生，实际上是整个基金的精神锚点——她管的不是交易，是人，是信念，是压力下的判断力。 Daniela 在 Anthropic 扮演的是类似角色。八位联创，全部还在。这在 AI 赛道几乎是奇迹。这个行业 cofounder 分裂是常态，不是例外。 Anthropic 极低的核心团队离职率背后，是有人在管那件最难管的事：让一群极度聪明、极度自我的人，在同一个信念下持续协作。妹夫 Karnofsky 2025 年 1 月悄悄加入负责安全策略，Fortune 记者发现前公司甚至没有对外宣布。 ─── 死亡诗社 vs EA 合租屋这个场景让我想起死亡诗社。同样是一小群极度聪明的人，密室聚会，信念互相强化，思想茧房。但内核完全不同：死亡诗社是浪漫主义的小圈子悲剧——反建制、反功利，产出是诗歌和自我觉醒，风险是个体悲剧（Neil 自杀）。 EA 合租屋是理性主义的小圈子帝国——用最功利的方式做最理想主义的事，产出是基金会、对冲基金、AI 公司，风险是系统性的（FTX 爆雷波及数百万人）。社交结构一样，价值内核相反。 ─── 圈子内部的资金循环 SBF 为什么能找到 Anthropic？不是什么天才投资眼光。是圈子内部的资金循环。 EA 历史上最大三个金主——Moskovitz、Jaan Tallinn、SBF——全是 Anthropic 早期投资者。Anthropic 最高治理机构「长期利益信托」四位成员里三位来自 EA 系统。 Dario 看到了足够多的红旗，所以给 SBF 的是无投票权股份，把他排在董事会外面。这个决定后来被证明极其聪明。但也留下一个尖锐的问题：红旗已经多到要做治理隔离了，为什么还是拿了？ ─── EA 最深的 bug 它提供了一套看起来无懈可击的框架，来合理化极端行为。 SBF 的「赚钱捐钱」和 Anthropic 的「安全发展 AI」，其实共享同一个底层逻辑——为了足够大的善果，可以承受不寻常的手段和风险。区别只在于 Anthropic 在犯罪线的安全一侧，SBF 越过去了。但「必须自己建造最强大的 AI 才能确保 AI 安全」和「必须先赚到极限才能捐到极限」，逻辑结构上是同构的。 ─── True believer vs 生意人从这个角度看 Anthropic vs OpenAI 的长期竞争—— Dario 是 true believer。使命是信仰，不是品牌叙事，也是他整个 social graph 的地基。 Sam 是生意人。OpenAI 从非盈利到 PBC，从 $29B 融资到 Microsoft 入股，每一步都是极其灵活的资本运作。拿下 Softbank、签白宫安全承诺——转身继续加速。两个人在玩不同的游戏。 Dario 的风险：信仰系统一旦被质疑，整个叙事会动摇。 Sam 的风险：没有信仰系统，市场叙事转向时没有东西锚定。 ─── Sam 的打法：不是对抗，是收编据传 OpenAI 开出约 $10 亿把 OpenClaw 创始人招入麾下，Meta 也在竞价，最终 Sam 拿下——保留开源特性，但核心创始人归队。不管细节如何，这个模式是真实的。 Dario 在国会山说「AI 可能杀死很多人」——真诚，是 EA 思维的直接输出。 Sam 去白宫签安全承诺，同时把 GPT-4o 做成最好用的消费品——同时服务监管者和市场。生意人的优势就是这个：他知道什么时候该出手，出多少，用什么结构谈。 ─── AI 的入口会是谁但 Claude 这边也在加速。去年拒绝签美国政府 AI 安全协议，让 Anthropic 的「安全」叙事有了真正的可信度。Opus 4.6 带来更强的正反馈系统，能力在持续复利。但 Claude 最近推出的一系列功能，不少人说是在学 OpenClaw 的路子，生态也越来越封闭。 OpenAI 的平台生态？Anthropic 的安全叙事？还是我们还没看清的第三条路？ SBF 不是「好人做了坏事」，是「聪明人用好人的叙事做了坏事」。 Anthropic 和 OpenAI 都是这场游戏的参与者，只是各自的赌注不同。我们站在场外。但这个游戏的结果，会决定接下来十年所有人的上下文。

显示更多

0

11

55

7

转发到社区