搜尋 engineering 相關推文

2026.05.17 04:50

Harness Engineering 的基本逻辑： Agent 每次犯错，不是换模型，而是工程化一个永久性解决方案，让它永远不再犯同样的错误。这层脚手架包括： CLAUDE.md / AGENTS.md — 行为约束文件工具调用规范 — 什么时候用什么工具验证回路 — 每个输出都有检查机制错误处理 — 失败怎么恢复，不是靠重试你的 Agent 有 Harness 吗？

0

10

1

轉發到社區

Yihui@yihui_indie

2026.05.12 08:23

🎉Harness Engineering 入门视频！ 2026 最值钱的 AI 编程能力。完整版 50 分钟实战课程见我的 AI 编程课程主页 👇

0

45

78

5

轉發到社區

nini@nini_incrypto_

2026.05.18 05:23

地表最强的harness engineering（执行框架）学习网站，没有之一

0

2

1

0

轉發到社區

terrific@terrywang

2026.05.10 23:50

Cursor 的 Agents Window 是针对 agentic engineering 场景的 agent-first Zen mode 交互界面。和 Claude Code / Codex / Conductor 这种把 agents 当一等公民对待的 desktop GUI 对齐。搞笑的是目前这个界面的配色和 Cursor IDE 用的无法统一，看起来非常难受。

0

1

0

轉發到社區

Yihui@yihui_indie

2026.04.28 07:44

🎉家人们，新课更新了：《Harness Engineering 入门实战课：如何让 AI 稳定开发项目？》。 AI 编程正在从“写好 Prompt”进入“让 Agent 稳定干活”的阶段，真正重要的不只是怎么提问，而是如何给 Agent 准备好产品说明、架构边界、工作规则和交接记录。这节课会带大家用 4 个基础 Markdown 文件搭建一个最小 Harness，并让开发 Agent 基于这些文档，一次性完成一个本地项目看板应用，支持项目卡片拖拽、IndexedDB 本地保存，以及通过右侧 Agent 面板用自然语言新增、删除和修改项目。课程地址：

0

22

178

31

轉發到社區

Yihui@yihui_indie

2026.04.27 08:33

【先导片】别学AI编程了，先学 Harness Engineering！

0

2

119

9

轉發到社區

郭宇 guoyu.eth@turingou

2026.04.14 07:07

这个思路做下来效果怎样还是有待评估的，不管是什么 harness engineering，离开前沿模型的 cli（不是前沿模型本身）效果都会打折。harness engineering 和 codex/cc 的界限正在变得模糊，我认为如何基于后者极速演化的基础上做 harness 才能可持续地发展。

宝玉@dotey

2026.04.14 04:11

Vercel 开源了 Open Agents，一个用来搭建企业自有编程 Agent 平台的参考实现。 CEO Guillermo Rauch 说：现成的编程 Agent 在大型代码仓库上表现不行，也不了解你公司的知识体系和内部流程，所以 Stripe、Spotify、Block 这些公司都在造自己的 AI 软件工厂。 Open Agents 绑定了 Vercel 自家的 Fluid、Workflow、Sandbox 和 AI Gateway 这套底座。但不管怎么说，Open Agents 给了一个可以直接 fork 的起点。架构分三层：前端负责会话和认证，Agent 作为持久化工作流运行在 Vercel 上，沙箱提供隔离的代码执行环境。一个关键设计是 Agent 不跑在沙箱里面，而是从外部通过工具调用（文件读写、Shell 命令、搜索等）操作沙箱。这样 Agent 的生命周期、沙箱的生命周期、模型的选择，三件事互不绑定，各自演进。功能上已经比较完整：支持对话驱动的编程 Agent、沙箱快照恢复、仓库克隆和分支操作、自动提交和发 PR、会话分享，甚至还有语音输入。对于正在考虑自建编程 Agent 的技术团队，这省了从零搭架子的功夫。对于没有这个需求的开发者，这个项目的架构设计本身也值得看看，尤其是 Agent 和执行环境分离这个思路，几乎是当前所有 Agent 框架都在趋同的方向。对比下 Anthropic 的 Managed Agents。 Vercel 的 Open Agents 是开源参考实现，给你一套可以 fork 的代码，自己部署、自己改。Anthropic 的 Managed Agents 是全托管服务，你通过 API 定义 Agent 的行为，基础设施全部由 Anthropic 运行，连沙箱、状态管理、错误恢复都不用操心。有意思的是，两者在架构核心上达成了同一个共识：Agent 和执行环境必须分离。Vercel 的文档里专门强调"the agent is not the sandbox"，Agent 从外部通过工具调用操作沙箱。Anthropic 的工程博客用了一个更形象的说法，把 Agent 拆成"大脑"和"手"，大脑（模型和调度循环）不住在容器里，通过接口远程操控沙箱。 Anthropic 的工程博客还解释了为什么要这么做：早期他们把所有东西塞进一个容器，结果容器变成了"宠物"（Pet），挂了就什么都丢了，调试还得钻进去看，而容器里又有用户数据，安全上也过不去。拆开之后，容器变成了"牲口"（Cattle），坏了就换一个，会话日志（Session）独立存储在外面，随时可以恢复。除了架构哲学，两者的差异很明显：模型锁定方面，Open Agents 不绑定模型，你可以接任何 LLM。Managed Agents 只能用 Claude 系列模型，但换来的是 Anthropic 在 harness 层面做的 prompt caching、上下文压缩、自动恢复这些优化，这些东西自己搭很难做好。成本结构方面，Open Agents 的成本是你自己的基础设施费用加上模型 API 调用费。Managed Agents 是三层计费：模型 token 费 + 每小时 0.08 美元的运行时费（按毫秒计，空闲不收费）+ 网页搜索每千次 10 美元。控制权方面，Open Agents 给你完整源码，怎么改都行，但搭建和维护是你的事。Managed Agents 上手快（有人说 30 分钟就能跑起来），但你被限制在 Anthropic 提供的 API 能力范围内。

0

3

70

6

轉發到社區

老金@freeman1266

2026.05.15 00:56

你的项目结构，决定了 AI 能帮你多少。用了 Monorepo + Harness Engineering 半年，最大的感受是： AI 不是越聪明越好用，是看得越全越好用。 Monorepo 解决的是"看得见"的问题： · 改一个接口，AI 能同时看到所有调用方 · 重构一个模块，AI 能追踪到所有依赖 · 不用反复解释"这个函数在哪" Harness 解决的是"做得对"的问题： · 规则写进 CLAUDE.md，AI 每次都遵守 · 验证回路兜底，错误在合并前被拦截 · 推理三明治（规划高推理→执行低推理→验证高推理），成本砍半两者叠加的效果：同一个模型，加了 Harness 之后 Terminal Bench 得分从 52.8% 涨到 66.5%。不换模型，只换系统。人设计系统，AI 在系统内可靠执行。这才是 2026 年 AI 工程的正确姿势——不是更好的提示词，是更好的结构

0

2

3

0

轉發到社區

郭宇 guoyu.eth@turingou

2026.04.29 20:35

Stripe 今天新发布了一个功能 Treasury，我觉得这会是集成在 harness engineering 中的一个重要产品，让 wanman 这类工具不仅可以做出初创公司的方案，还能直接开设银行账户，并授权 agent 使用这些账户进行付款。有意思的是，它还默认支持 crypto