註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

Vince 聊开发
@vincemask
AI · Building in public 🔧 分享真实用得上的工具和工作流 Honest notes from one builder 🔖
加入 February 2020
521 正在關注    1.1K 粉絲
/goal 的 prompt 拆解很有价值。两个设计特别见 harness 工程功底: 一是「停 ≠ 完成」的双层防御,continuation.md 和 budget_limit.md 不是简单重复,而是覆盖不同触发场景——正常收官 vs 预算耗尽; 二是 untrusted_objective 的三层防护,本质上是把对抗样本思路用在了 prompt 上。Outcomes 独立 grader 再往前一步,把评估者和执行者上下文完全隔离,从根上切断 self-evaluation bias。
顯示更多