註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 engineering
engineering 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 engineering 的搜尋結果
Harness Engineering 的基本逻辑:   Agent 每次犯错,不是换模型,而是工程化一个永久性解决方案,让它永远不再犯同样的错误。 这层脚手架包括:   CLAUDE.md / AGENTS.md — 行为约束文件 工具调用规范 — 什么时候用什么工具 验证回路 — 每个输出都有检查机制 错误处理 — 失败怎么恢复,不是靠重试   你的 Agent 有 Harness 吗?
顯示更多
🎉Harness Engineering 入门视频! 2026 最值钱的 AI 编程能力。 完整版 50 分钟实战课程见我的 AI 编程课程主页 👇
0
45
78
5
轉發到社區
地表最强的harness engineering(执行框架)学习网站,没有之一
Cursor 的 Agents Window 是针对 agentic engineering 场景的 agent-first Zen mode 交互界面。 和 Claude Code / Codex / Conductor 这种把 agents 当一等公民对待的 desktop GUI 对齐。 搞笑的是目前这个界面的配色和 Cursor IDE 用的无法统一,看起来非常难受。
顯示更多
🎉家人们,新课更新了:《Harness Engineering 入门实战课:如何让 AI 稳定开发项目?》。 AI 编程正在从“写好 Prompt”进入“让 Agent 稳定干活”的阶段,真正重要的不只是怎么提问,而是如何给 Agent 准备好产品说明、架构边界、工作规则和交接记录。 这节课会带大家用 4 个基础 Markdown 文件搭建一个最小 Harness,并让开发 Agent 基于这些文档,一次性完成一个本地项目看板应用,支持项目卡片拖拽、IndexedDB 本地保存,以及通过右侧 Agent 面板用自然语言新增、删除和修改项目。 课程地址:
顯示更多
0
22
178
31
轉發到社區
【先导片】别学AI编程了,先学 Harness Engineering!
0
2
119
9
轉發到社區
这个思路做下来效果怎样还是有待评估的,不管是什么 harness engineering,离开前沿模型的 cli(不是前沿模型本身)效果都会打折。harness engineering 和 codex/cc 的界限正在变得模糊,我认为如何基于后者极速演化的基础上做 harness 才能可持续地发展。
顯示更多
Vercel 开源了 Open Agents,一个用来搭建企业自有编程 Agent 平台的参考实现。 CEO Guillermo Rauch 说:现成的编程 Agent 在大型代码仓库上表现不行,也不了解你公司的知识体系和内部流程,所以 Stripe、Spotify、Block 这些公司都在造自己的 AI 软件工厂。 Open Agents 绑定了 Vercel 自家的 Fluid、Workflow、Sandbox 和 AI Gateway 这套底座。但不管怎么说,Open Agents 给了一个可以直接 fork 的起点。 架构分三层:前端负责会话和认证,Agent 作为持久化工作流运行在 Vercel 上,沙箱提供隔离的代码执行环境。一个关键设计是 Agent 不跑在沙箱里面,而是从外部通过工具调用(文件读写、Shell 命令、搜索等)操作沙箱。这样 Agent 的生命周期、沙箱的生命周期、模型的选择,三件事互不绑定,各自演进。 功能上已经比较完整:支持对话驱动的编程 Agent、沙箱快照恢复、仓库克隆和分支操作、自动提交和发 PR、会话分享,甚至还有语音输入。 对于正在考虑自建编程 Agent 的技术团队,这省了从零搭架子的功夫。对于没有这个需求的开发者,这个项目的架构设计本身也值得看看,尤其是 Agent 和执行环境分离这个思路,几乎是当前所有 Agent 框架都在趋同的方向。 对比下 Anthropic 的 Managed Agents。 Vercel 的 Open Agents 是开源参考实现,给你一套可以 fork 的代码,自己部署、自己改。Anthropic 的 Managed Agents 是全托管服务,你通过 API 定义 Agent 的行为,基础设施全部由 Anthropic 运行,连沙箱、状态管理、错误恢复都不用操心。 有意思的是,两者在架构核心上达成了同一个共识:Agent 和执行环境必须分离。Vercel 的文档里专门强调"the agent is not the sandbox",Agent 从外部通过工具调用操作沙箱。Anthropic 的工程博客用了一个更形象的说法,把 Agent 拆成"大脑"和"手",大脑(模型和调度循环)不住在容器里,通过接口远程操控沙箱。 Anthropic 的工程博客还解释了为什么要这么做:早期他们把所有东西塞进一个容器,结果容器变成了"宠物"(Pet),挂了就什么都丢了,调试还得钻进去看,而容器里又有用户数据,安全上也过不去。拆开之后,容器变成了"牲口"(Cattle),坏了就换一个,会话日志(Session)独立存储在外面,随时可以恢复。 除了架构哲学,两者的差异很明显: 模型锁定方面,Open Agents 不绑定模型,你可以接任何 LLM。Managed Agents 只能用 Claude 系列模型,但换来的是 Anthropic 在 harness 层面做的 prompt caching、上下文压缩、自动恢复这些优化,这些东西自己搭很难做好。 成本结构方面,Open Agents 的成本是你自己的基础设施费用加上模型 API 调用费。Managed Agents 是三层计费:模型 token 费 + 每小时 0.08 美元的运行时费(按毫秒计,空闲不收费)+ 网页搜索每千次 10 美元。 控制权方面,Open Agents 给你完整源码,怎么改都行,但搭建和维护是你的事。Managed Agents 上手快(有人说 30 分钟就能跑起来),但你被限制在 Anthropic 提供的 API 能力范围内。
顯示更多
你的项目结构,决定了 AI 能帮你多少。 用了 Monorepo + Harness Engineering 半年,最大的感受是: AI 不是越聪明越好用,是看得越全越好用。 Monorepo 解决的是"看得见"的问题: · 改一个接口,AI 能同时看到所有调用方 · 重构一个模块,AI 能追踪到所有依赖 · 不用反复解释"这个函数在哪" Harness 解决的是"做得对"的问题: · 规则写进 CLAUDE.md,AI 每次都遵守 · 验证回路兜底,错误在合并前被拦截 · 推理三明治(规划高推理→执行低推理→验证高推理),成本砍半 两者叠加的效果: 同一个模型,加了 Harness 之后 Terminal Bench 得分从 52.8% 涨到 66.5%。不换模型,只换系统。 人设计系统,AI 在系统内可靠执行。 这才是 2026 年 AI 工程的正确姿势——不是更好的提示词,是更好的结构
顯示更多
Stripe 今天新发布了一个功能 Treasury,我觉得这会是集成在 harness engineering 中的一个重要产品,让 wanman 这类工具不仅可以做出初创公司的方案,还能直接开设银行账户,并授权 agent 使用这些账户进行付款。有意思的是,它还默认支持 crypto
顯示更多
0
6
187
13
轉發到社區
可想而知,在 sandbox 并发的问题解决后,OpenAI 也会支持 codex 的云端化。harness engineering 和继续它的产品比我想象更快地被模型外侧的第一层产品所吞噬,验证了「wanman 三月不发布就不用发布」的悲观设想
顯示更多