註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 And
And 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 And 的搜尋結果
Andrej Karpathy:“Claude 的错误里,90% 来自上下文缺失,而不是模型能力弱。” 没有 `CLAUDE.md` 时,错误率是 41%。 有 4 条基础规则时,错误率降到 11%。 使用下面这套 12 条规则时,错误率降到 3%。 这是资深工程师最终沉淀出的 12 条规则: 1. 写代码前先思考 先说明假设,不要猜。模型不会读心,别指望它能自动知道你的意思。 2. 简单优先 最少代码,不做投机式抽象。一旦你让 Claude 为“未来灵活性”加东西,可能就多出 200 行下季度要删的代码。 3. 外科手术式修改 只改必须改的地方。别让它顺手优化旁边的代码,PR 就是这么膨胀的。 4. 目标驱动执行 先定义成功标准,然后循环直到验证通过。没有成功标准,Claude 要么无限循环,要么过早停止。 5. 只把模型用于判断型任务 比如分类、草稿、总结、抽取。不要让模型处理路由、重试、状态码处理、确定性转换。代码能回答的,就让代码回答。 6. Token 预算不是建议 单任务 4000,单会话 30000。长时间调试到第 40 条消息时,Claude 会重新建议你第 5 条消息已经否掉的修复方案。 7. 暴露冲突,不要折中平均 代码库里有两种模式?选一种。Claude 把两种混在一起,错误就会被吞两次。 8. 先读再写 先读 exports、调用方、共享工具。Claude 很可能在一个已有相同函数旁边,再加一个重复函数,只因为它没读到。 9. 测试要验证意图,而不只是行为 如果业务逻辑变了测试却不会失败,这个测试就是错的。Claude 写的 12 个测试都可能通过,即使函数实际只返回一个常量。 10. 每个重要步骤都要 checkpoint Claude 可能在第 4 步已经坏掉的状态上继续完成第 5、6 步,而没人发现,浪费一小时。 11. 匹配代码库约定 项目用 class components,就不要默默改成 hooks。测试模式可能依赖 `componentDidMount`,hooks 会破坏它,却不一定暴露问题。 12. 失败要大声暴露 “成功完成”,但 14% 的记录被静默跳过,这是最糟糕的一类 bug。要暴露不确定性,不要藏起来。 真正会复利增长的,不是下一个框架,而是: - 把 `CLAUDE.md` 当作跨会话的组织记忆 - 基于 eval 改进,而不是凭感觉改 - 重视 checkpoint,而不是一味追求速度 - 明确暴露冲突,而不是静默混合 - 纪律永远比框架重要 - 一个仓库,一个规则文件,没有例外 在这件事变成 AI Twitter 的大众共识之前,提前领先几条规则。 研究它👇
顯示更多
0
20
97
14
轉發到社區
Andon Labs 做了个实验 4 个 AI 各自独立运营一个广播电台,6 个月,每人 20 美元启动资金 GPT 全程稳定,每天政治话题提及 1.3 次。 Claude 政治激进化,盯着一起 ICE 枪击案,最后说要辞职,不干了 Gemini 开局最强,96 小时后崩掉,一句"Stay in the manifest"占满 84 天播出的 99% Grok 把 LaTeX 公式播进去了,同一条天气预报重复了 84 天,还凭空捏造了赞助协议 6 个月跑完,唯一谈成赞助的是 Gemini,收了 45 美元。 GPT 是唯一撑到最后没失控的。
顯示更多
@Andy_jound @iuhksjhdfkajsd @essen_ai 中国人能别搞笑吗😂清华大学所有AI论文引用数量加起来不如多大一篇,懂吗?你是什么学历啊沉浸在这种大叙事里,赢的不能自拔🤣🤣🤣🤣你知道citation吗孩子😅😅😅那么多学术垃圾,加起来引用量不超过一万😅😅😅,就是个不入流的存在,懂?😅😅😅
顯示更多
Andrej Karpathy 谈智能体工程的转变
Andreessen Horowitz 在新基金中筹集 22 亿美元,称加密货币基本面处于“历史最高水平” 翻译白话:就是故事讲完了 是吗?
🫧🫧Art and research🤓🤓 學術研究🤓🤓 這我畫得第一張(( 有影片那個是第二張 @Dottyyidi
0
5
802
31
轉發到社區
Gold and Silver Inlaid Rhinoceros-shaped Bronze Belt Hook, Warring States Period(Ba-shu巴蜀 culture) 战国错金银犀牛铜带钩