搜尋实测工作流相關推文

2026.05.06 08:43

🔥《Codex十大高价值资源合集》 GPT-5.5 的更新，给 Codex 加了把火！直接把 Codex 推上神坛，在实际编程、工作流、视觉理解和多线程自动化能力上已超越 Claude Code，已成为目前最强 AI 编程神器！小师妹给大家整理了最硬核的教程以及爆款实操案例，一键可抄作业😆 1️⃣ @Saccc_c 最全面 Codex 官方级教程 💡不到2小时教会你 Codex App + GPT-5.5 最强组合，从插件使用到多线程自动化工作流全覆盖，目前最值得抄的实战教程！ 2️⃣ @WEB3_furture 38分钟从零精通 Codex 中文教学 💡目前最快上手 Codex 视频！安装、语音、插件、MCP、工作流搭建一步到位，全中文讲解，一看就会！ 3️⃣ @yidabuilds Codex vs Claude Code 一个月实测对比 💡每月花600刀用AI编程的真实对比：Codex已成Claude Code完全平替，更快更省钱，并行工作流+Superpowers全分享！ 4️⃣ @XiaohuiAI666 Codex 保姆级入门教程 💡程序员小灰出品 Codex 最详细入门！概念、安装、四种运行模式、CLI/App上手全覆盖，新手必备！ 5️⃣ @meta_alchemist Codex + Image Gen 2 + Vision 做出完整游戏 💡Codex视觉能力起飞！Image Gen 2 + Vision 组合直接做出完整游戏，UI/UX设计神器！ 6️⃣ @op7418 1小时用Codex做出完整roguelike卡牌游戏 💡Codex真实震撼案例！1小时做出可玩卡牌爬塔游戏，全流程开源+安装包！ 7️⃣@Formulasearch 零剪辑做出专业产品视频工作流 💡GPT-Image-2 + Codex 做出高品质产品演示视频，先出图定视觉再写代码，1小时无剪辑软件完成！ 8️⃣ @Saccc_c Codex + HyperFrames 1小时代码做视频 💡自媒体视频剪辑自由！Codex + HyperFrames代码驱动视频制作，描述画面→AI写代码→1小时出片！ 9️⃣@DeRonin_ Codex 10x 自主工作流：写详细任务文档 → 一条命令跑到底把 Codex 当“承包商”用！写一份完整需求文档，一条命令让它后台自主运行几小时完成任务，无需反复澄清，生产力直接起飞！ 1️⃣0️⃣ @Lonely__MH 土耳其区Apple ID低成本订阅ChatGPT Plus/Pro 💡最便宜合法订阅ChatGPT Plus全流程！银联卡直充土耳其礼品卡，合法合规超详细教程！

0

6

16

1

轉發到社區

Macro_Lin ｜市场观察员@LinQingV

2026.05.10 07:40

OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的，1 月份报道的合同价值超过 100 亿美元，后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元（包含到 2030 年的扩展选项）。第一个产品 2 月 12 日就上线了，叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单，可以从几个方面做具体判断。吞吐方面，Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上，标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒，速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒，是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比，同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距，跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间，还有几百倍的 gap，被软件栈、工作负载、batch 处理这些系统级因素吃掉了。延迟方面，1000 tokens/秒对应每个 token 1 毫秒生成间隔，这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写，每次客户端服务端往返开销减少 80%，per-token 开销减少 30%，time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的，跟 Cerebras 1 毫秒每 token 的硬件能力对不上，软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层，硬件能力升级倒逼软件栈重构。成本方面，Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放，API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价，意味着单位推理成本仍然显著高于普通 GPU 推理服务，需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU，OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事，可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考，Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens，GPT-4o 的 API 售价是 $10/M 输出 tokens，但两者模型规模和能力差距很大，不能直接对比。但 Cerebras 的这套东西有几个关键的约束条件，框定了它现在能做什么、做不了什么。第一是模型大小限制。Codex-Spark 是蒸馏后的小模型，被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB，frontier model 的参数量远超这个容量，必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力，Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证，OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型，说明前者目前在工程上更可行。第二是容量限制。Codex-Spark 目前是 research preview，OpenAI 明确说明"由于运行在专用低延迟硬件上，使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3，对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因，硬件交付的物理速度限制了营收节奏。总结来说，OpenAI 这笔交易对 Cerebras 是阶段性胜利，但远没到终局。技术验证层面，Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度，这一点产业内已经形成共识。但商业兑现层面，Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制，OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型，说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度，每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程，年产几千台 CS-3 是相当具体的工程瓶颈。对国产推理芯片的同行来说，这件事还有几个很具体的工程信号。端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快，软件栈跟不上的话推理体验仍然受限，专用推理芯片的价值要靠端到端的延迟优化才能完全释放。蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型，说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态，单纯的"通用推理芯片"在竞争中会比较吃亏。 1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化，这个速度天花板对国产推理芯片是一个相当严峻的目标。 Cerebras 当前展示的能力是真实的，但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键，一是看它在 2027-2028 年能不能把 750MW 真的部署完，把 RPO 真的转成营收；二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号，但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖，客户质量在提升，但集中度的风险结构没有改变，只有客户组合真正分散了，估值里的风险溢价才能消化。

0

67

306

44

轉發到社區

奶昔🥤@realNyarime

2026.05.17 09:44

折腾过软路由的推友应该都认识爱快系统，包括之前我借助pmd适配了一些原生插件，也能让OpenWRT插件和LuCI在上面跑，总的来说有点像在做卓易通（当然因为全讯汇聚，也就是爱快官方找上门了就停止了，还好人家公司格局大不然就成被告了 iKuaiOS现在已经4.0Beta，不过pmd挂载方式也变了，目前只允许Docker插件。我能感觉到他们团队并不想放root权限，以及对原生（二进制）插件进行签名校验。包括在研发团队的许可尝试突破了新系统的root权限，只能说加固得很彻底，能看到爱快官方对于盗版的打击力度之大因此我比较好奇一件事，路由上跑插件是不是刚需？好像大部分人用爱快做流控然后用OpenWRT跑Clash的较多，如果说NAS是家庭娱乐网关，那将Router+NAS会不会是更好的选择？我看飞牛OS那套插件生态（原生+Docker）就很不错，甚至还有第三方应用商店支持。当然已经实测ShellClash和Mihomo内核都可以在iKuai上正常工作，其实像Apple那样做个App Store审核插件也不是件坏事如果说哪一天爱快开放root和第三方插件市场共存，那我觉得是更上一层楼的事情。此外，爱快销售那边也有小道消息说要单独卖企业版授权，除了买硬件送OEM版外，还有通过订阅获得与官方企业硬件一样的功能，我认为值得期待

0

6

42

1

轉發到社區

Cindy胖迪🥰@CindyCreation

2026.01.14 14:50

《Fogo开局就是大招，直接上了币安》 Fogo 的这次 Binance Prime Sale 超额认购了 41 倍，热度和关注度很高并且这是币安史上第三次 prime sale，今年首次。过去半年，整个市场都在围着「Speed Meta」转，EVM 赛道有 Monad、MegaETH 轮番轰炸，订单簿永续赛道被 Hyperliquid 卷到 80 亿美金 FDV 而SVM的性能链呢? 现在它来了 #Fogo# @fogo 由华尔街量化大佬亲自打造一条高速性能公链Fogo正式上线，它专为机构级金融和高频交易设计的 SVM 兼容 Layer-1 区块链，将传统金融（TradFi）的性能标准（如纳斯达克级速度）与去中心化基础设施相结合，实现实时、可扩展的链上体验。可以理解为Solana为支付而生，Fogo为交易而生。都说链上的交易和CEX差别巨大，而Fogo把 TradFi 的极致体验原封不动地搬到了链上。  40ms 出块，1.3 秒最终确认，570+ 真实 TPS，零滑点订单簿，零弹窗签名，体感几乎是即时的，这是人类反应速度的极限。大多数公链还在卷TPS，而Fogo只跟你谈时间，是毫秒级别的，意味着你点击鼠标确认，刚松按键，交易已经在链上确认了。 Hyperliquid把订单薄搬到了链上，那么Fogo就是把纳斯达克的交易低延迟带到了链上。速度性能方面通过主网数据，已经完全优于Monad。主网已处理超过 30 亿笔交易（截至 1月 14 日，在高负载下维持 1,500+ TPS,以上数据是经过压力测试的实测数据，在 Chainspect 的实时性能排行榜上排名第1。 Fogo 的创始团队几乎是一张“做市商全明星阵容”： • Douglas Colkitt：前 Citadel 量化研究员，Ambient Finance（前 CrocSwap）创始人 • Robert Sagurton：前 Jump Crypto 核心成员，曾在摩根大通、摩根士丹利、R3 负责交易基础设施 • Michael Cahill：前 Jump Crypto 高管、Pyth Network 前 CEO，真正把预言机带进机构的人 • 核心工程由 Douro Labs 主导，该团队也是 Pyth 背后的团队一条由做交易的大佬打造的链更能深知目前链上交易的痛点，正如此Fogo为SVM带来缺少的东西。生态上Fogo完全做足了准备工作，很多 L1 上线时只有一条裸链，Fogo 上线自带： • Ambient：下一代无 MEV AMM • Valiant：现货 + CLOB 混合流动性层 • Pyron / FogoLend：原生借贷市场 • Pyth Lazer + Wormhole + Metaplex + Squads + Goldsky 全套基础设施这次Fogo开局就是大招，直接上了币安，首先就是Fogo 的这次 Binance Prime Sale 超额认购了 41 倍，热度和关注度很高并且这是币安史上第三次 prime sale，今年首次。 Fogo这次登录币安也是让人羡慕的，0BNB 上币费，这也体现了币安对这个项目的信任。0上币费公告（大家关心的项目时间节点：1 月 13 日空投查询开放；1 月 15 日：主网正式上线，币安现货在主网TGE首日上线。后续还会上线更多交易所，不用怀疑项目实力，而且还会有下一次赛季的激励，5000 万 $FOGO（总量 0.5%）用于未来营销。可以期待上线的表现和第二赛季的开启🔛

0

18

16

0

轉發到社區

粥粥聊 AI@boniusex

2026.05.22 02:35

为什么 FAQ Bot 在社区长大之后一定会失效跟不少做社区运营的朋友聊过，大家的标配基本一样：一个文档站、一个置顶 FAQ 频道、一个关键词匹配的 bot。配置齐全，该有的都有，但每天还是有一半时间在回答重复问题。之前我以为这就是个人力问题，多招几个 mod、把文档写得更好、置顶帖钉得更多就能解。后来发现不对，连文档做得很扎实、有专职社区经理的团队，Discord 过了几千人之后都会撞上同一堵墙。直到看了 Lucius AI 的做法，想通了一件事：大部分社区不缺答案，答案散落在文档、历史消息、团队成员的回复里，到处都有。真正缺的是一个东西能把答案、提问的人、提问的方式、以及这个人上个月问过什么串起来。 Lucius 做的就是这件事。它从社区真实对话里学习，记住每个用户的交互历史，能回答的就答，没把握的就带着完整上下文转给真人。社区团队的角色就变了：从"每个问题的第一响应人"变成"审核 AI 已经处理的结果，只接手难题"。 FAQ “bot 为什么会随着社区增长失效，”这个问题我想了一段时间才看清楚。 FAQ bot 在问题可预测的时候好使。"怎么重置密码？"关键词一匹配，答案弹出来，完事。但社区长大之后，问题就不是这么干净了。有人报 bug 说的是"又崩了"，有人甩一张报错弹窗的截图，自己都不知道什么意思。还有人问的其实是另一个功能，但用了一模一样的关键词。做过 5000 人以上 Discord 社区的 mod 都见过这种场景。关键词匹配扛不住这种语义多样性，但更深层的问题是 FAQ 是静态的。产品发了新版本，定价改了，一个已知 bug 修了。FAQ 里的答案还是旧的，没有谁有精力每周更新 50 条 FAQ。于是循环就来了：bot 给了一个过时的答案 → 用户更困惑 → 用户 @ 真人 → 真人被淹没在本该自动化的重复劳动里。bot 干活不行吗？不是，是这份工作本身定义错了，预写好的答案跟不上一个活的社区。翻了 Lucius 的文档之后，我注意到三个差异 Lucius 不完全靠预写内容。它从社区真实对话里学习，同时也会消化你提供的知识源：FAQ 文档、帮助中心文章、SOP、定价页、更新日志。具体拆开说： ·它从你社区的真实对话里自建知识库。 Lucius 会观察频道里发生的事。团队成员在 Discord 里给了一个高质量回答，Lucius 会把它抓下来、存起来，下次类似问题出现直接用同样的逻辑应对。你还是需要喂给它已有的文档和 SOP 作为基础，但系统会不断把真实交互数据叠加上去。 ·它记得每个用户问过什么、什么时候问的。这是它跟普通 chatbot 的本质区别。Lucius 跨对话保留交互历史，一个用户几周前问过的问题，会影响今天它怎么回答这个人。大部分 bot 把每条消息当作从零开始。 ·它知道什么时候该闭嘴，没把握的时候 Lucius 不会瞎编。它会把对话上下文打包，转交给真人。你的 mod 收到的不是一句"有用户需要帮助"的通知，而是附带完整历史的 brief。真人处理完之后，Lucius 会从这个处理结果里学习，下次同类问题自己搞定。 ⚠️ 这一点比大多数人意识到的更重要：AI 客服工具最大的翻车模式就是"信心十足地给错误答案"。Lucius 把"知道什么时候不该回答"当成核心设计原则。对 B2B、SaaS 和任何在乎品牌信任的社区来说，光这一个功能就值回票价。我自己跑了一轮实测，光看文档和案例说服力有限，我直接建了一个测试 Discord 服务器，把 Lucius 接进去自己跑了一遍。测试方法：喂了一份 10 条 FAQ 的虚构产品知识库（一个叫 ZhouEdit 的 AI 字幕工具），然后用不同类型的问题去测它的反应。测试 1：换措辞提问知识库里写的是"字幕识别不准的常见原因：背景音乐太响、多人说话、音频质量差"。我故意换了个说法问："字幕生成出来一堆错别字怎么办" Lucius 的回答：准确命中了知识库里的内容，给出了三个原因 + 建议上传更清晰的版本 + 提到 Pro 用户可以开 Enhanced Mode。还主动补了一句"生成后也可以手动修正"，这条信息来自知识库里另一个条目（Q6 编辑字幕），它自己做了关联。没有瞎编，而且把散落在不同 FAQ 条目里的相关信息整合到了一个回答里。这是关键词匹配 bot 做不到的。测试 2：模糊问题我问了一句特别泛的话："这个东西怎么用啊，有详细教程吗" 如果是普通 FAQ bot，这种问题要么匹配不上任何关键词直接沉默，要么随便吐一条最热门的 FAQ 出来。 Lucius 的反应：它没有说"我不知道"，也没有随便糊一个答案。它直接从知识库里抽取了完整的使用流程，整理成 4 个步骤（上传视频 → 自动生成字幕 → 编辑修改 → 导出），每一步还带上了具体参数（支持格式、文件大小限制、导出格式区别）。等于它自己从 10 条分散的 FAQ 里组装了一份迷你使用指南。这两个测试验证了前面说的核心差异：Lucius 理解语义而不是匹配关键词，而且能把知识库里不同条目的信息关联整合。测试规模很小，10 条知识库和几个问题不能代表万人社区的真实负载。但至少在语义理解和知识整合这两点上，表现是实打实的。大多数人没看到的价值，如果只把 Lucius 当客服工具看，会漏掉第二层价值。用户每天在社区里提问和抱怨。Lucius 自动归类这些内容，时间一长，规律就浮出来了，每日摘要会把社区里真正发生的事情推给你，不需要任何人手动整理。传统做法是社区经理每周手动写一份反馈报告，慢、不完整、人累死。 Lucius 生成结构化的每日摘要：高频问题、新冒出来的 bug 反馈、按出现频次排序的功能需求。社区直接变成一个被动运转的产品反馈系统。不需要手动报告，不需要没人看的周报。最重要的 Lucius 支持跨平台覆盖：Discord、Telegram、Slack、飞书、Web Widget，Lucius 都支持，知识库跨平台共享。要注意的是：不同平台的接入复杂度不一样。Discord 和 Telegram 比较简单。飞书和 Web Widget 需要更多配置，包括加代码。不算大问题，但别指望每个渠道都是一键接入。支持渠道喂养知识库，知识库喂养每日摘要，每日摘要喂养产品决策。全自动，全跨平台。这就是它超出客服工具的部分。你可能会问的几个问题 Q：跟普通 chatbot 到底有什么区别？传统 chatbot 靠决策树和关键词，问题一旦超出预设范围就死机。Lucius 理解上下文、从真实对话学习、不确定时转给人。官方定位是"社区运营的 AI 队友"，不是 chatbot，这个区分是真实的。 Q：部署前需要准备什么？需要。Lucius 可以从真实对话学习，但官方文档建议提前准备好你的 FAQ、帮助中心内容、SOP、定价信息和更新日志。把它当成给你的 AI 队友做一次正式的入职培训，而不是直接扔进群里让它自己摸索。 Q：会不会乱说话搞砸品牌形象？ Lucius 的设计逻辑是"宁可不答也不乱答"。超出它信心范围的问题，它会带着上下文转交给真人。然后从真人的处理结果里学习。这个风险模型和那些信心十足地给过时或错误答案的 bot 完全不一样。 Q：适合什么类型的社区？最适合的是有真实支持需求量的产品社区：SaaS、AI 工具、游戏、Web3、创作者平台。任何有大量重复性产品问题的社区都合适。如果你的社区主要是闲聊、支持需求很少，ROI 的算法就不一样了。一句话说完：FAQ bot 失效是因为答案会过时、用户提问方式千变万化、上下文会丢失。Lucius 能用是因为它从真实对话学习、保留记忆、不确定时交给人而不是瞎猜。如果你的社区增长速度已经超过团队能 cover 的速度，Lucius 值得看一眼。在做社区运营的兄弟，评论区说说你们现在用什么工具，好奇大家实际跑通了什么方案。 #LuciusAI# #AIAgent# #Discord#

0

8

7

0

轉發到社區

luolei@luoleiorg

2026.05.07 09:07

☕ 深圳刚刚实测成功！安卓、苹果用户均可免费领星巴克咖啡。 TRAE SOLO 移动端上线，前往 TRAE 官网或手机应用商店下载 TRAE APP，点击右上角“免费领咖啡”（需对应城市IP），给SOLO下达一次工作指令即可参与活动，限北京、上海、深圳、广州、杭州、成都地区领取。嘻嘻，明天可以消费升级啦！

0

28

127

7

轉發到社區

摸鱼巨匠🔨@SunNeverSetsX

2026.05.07 10:43

摊牌了！我的高质量信息，来源于这些小账户和播客！感谢他们源源不断的创作热情和优质信息推送！一、优质小账户 1. 独眼 @0xduyan 专注理财套利、Defi 和撸毛领域的精品小账号。如果你关注 Alpha、理财套利，那你绝对要关注他！ 2. 方外 @yijiangren 著名的三建理论创始人。本职 UI 设计师，擅长将设计思维引入交易系统，并陪伴你成为更好的自己 3. Toni @0xtonixie 精通中英德三语的 AI 硕士产品经理。不仅给你分享非常实用的 AI 工具实测，还能带给你很多语言学习的经验，并带你跨越 Web 3 种种领域 4. 猫猫 @caringtank 专注于寻找实时的低风险套利机会，并分享自己在美股、台股的投资观点。此外，猫猫老师还会记录自己的盈亏情况和成长历程，真人感拉满！ 5. 星辰 @xinchne_eth 星辰老师是绝对的实干派！专注于空投教程分享、早期项目投研、AI 在 Web 3 的应用。他做事强调长期主义，不搞一夜暴富，而是每天分享一点干货、积累认知。 6. Jinyu @JinYu762 专注于美股知识分享、美股行情分析的垂直账号！他的行情分析数据详实、论据非常充分，如果想关注和学习美股，那这个是不可多得的精品小账号。 7. Musol @MMMusol AI & Web3的「人文学派」。最近就用“AI修图”半天入账1000+！平时也记录分享交易理念和周期干货，帮助大家在 AI 时代更好地提升自己生产力与自处。最后，感谢菜狗老师 @jiroucaigou 和 Z 大诗 @Zh_Crypto517 配合我 @SunNeverSetsX 费心耗力精选了这个精品小账号清单。他们也是非常优秀的 Web3 博主、港股打新博主，欢迎关注他们。二、3 个顶级博客推荐 1. Latent Space 深入剖析领先实验室如何构建 Agents、模型、基础设施以及 AI for Science（AI 应用于科学）等前沿技术。 2. Unsupervised Learning 聚焦 AI 技术如何影响商业、世界和产业格局，包括创业趋势、产品 PMF、投资洞见、模型能力演进等。 3. AI & I by Every 每周会邀请科技界最聪明的人分享如何在日常工作中实际使用 AI 来思考、创造和建立关系

0

72

103

16

轉發到社區

超级个体｜柿子@yaohui12138

2026.05.18 02:11

Karpathy 发布了一个github开源项目，狠狠让我惊艳到了这个项目叫 andrej-karpathy-skills,GitHub 13 万+ star,我愿称之为2026 最有用的 AI 工程项目它解决的问题极其精准：让 Claude Code 不再瞎写代码这个项目到底有多厉害？先说结论：一个 4KB 的文本文件，让 AI 写代码的错误率暴降 90% Karpathy 自己说，他现在 80% 的代码都让 Claude 写，但 AI 经常犯几个典型错误：不问就瞎猜需求过度设计，写一堆用不上的抽象改 A 顺手把 B、C、D 也重构了代码能跑就行，不管目标达成没有这个项目就是专门给 Claude Code 戴上guardrails，用 4 条行为准则约束 AI 的编码行为核心亮点：4 条准则改变一切整个项目就是一个 CLAUDE.md 文件，里面只有 4 条规则，但每一条都直击 AI 编码的痛点 1. Think Before Coding - 先思考再动手 AI 最大的问题是“太听话”，你说啥它就写啥，从不质疑这条准则要求：明确说明假设、权衡 tradeoffs，不确定就直接问不再是“我猜你想要这个”，而是“我理解你的需求是 A，但 B 方案可能更合适，你要哪个？” 2. Simplicity First - 极简实现优先 AI 天生爱炫技，你要一个登录功能，它给你写个完整的 OAuth 2.0 + JWT + 刷新令牌 + 权限系统这条准则强制：只写刚好能解决当前问题的最小代码不搞 speculative abstractions，不写未来功能，不过度工程一个用户反馈：用了这条规则后，代码 diff 从动辄几百行缩减到几十行，review 轻松太多 3. Surgical Changes - 手术式精准修改这是我最爱的一条 AI 有个恶习：你让它改个 bug，它顺手把整个文件的命名风格、缩进、注释全优化了这条准则要求：只改用户要求的部分，严格匹配原有代码风格不碰无关文件，不顺手 refactor，不加“看起来更好”的改动有开发者实测：启用这条后，git diff 从“满屏红绿”变成“3 行精准修改” 4. Goal-Driven Execution - 目标驱动执行 AI 经常写完代码就交差，但代码能跑 ≠ 任务完成这条准则要求：把任务转化为可验证的目标/测试/成功标准，然后 loop 执行、验证、迭代直到真正达成目标才停止这让 AI 从“代码生成器”变成“问题解决者” 真实效果：社区反馈炸裂 X 上这个项目刷屏了，开发者反馈高度一致：代码质量飞跃：diff 更紧凑、干净，overbuild 和 side changes 大幅减少错误率暴降：有人实测从 41% 掉到 11%，继续优化后低至 3% 中文社区评价：“必备 skills”“Claude/Cursor 实用技能 Top1”“直接扔项目里就完事了” 很多人直接 @ 朋友推荐：“把这个 CLAUDE.md 放进去，Claude 立刻像换了个人，写代码更靠谱、不乱改、不瞎猜“ 使用方式：简单到离谱这是我见过最简单的 AI 工程优化方案：方法一：直接 curl 把 CLAUDE.md 下载到项目根目录 curl -o CLAUDE.md 方法二：用 Claude Code / Cursor 的 plugin 一键安装支持 Claude Code、Cursor 等主流 AI coding 工具完全开源（MIT 协议），拿来就用作为产品经理出身的开发者，我看到的不只是 4 条规则，而是对 AI 编码行为的深刻洞察 Karpathy 做的事情本质上是：给 AI 建立编码的第一性原理，他把他对于AI编程的理解写入了文件中不是教 AI 怎么写代码（它已经会了），而是教 AI 什么时候该问、什么时候该停、什么时候该简化这 4 条准则就像产品经理给开发团队定的 PRD 原则：需求不清楚？先问功能够用就行？别过度设计改需求？只改需求相关的做完了？先验证目标达成没有它能帮到我们什么？如果你是独立开发者或小团队，这个项目能直接提升你的 AI 协作效率：减少返工：AI 不再瞎猜需求，写出来的代码更符合预期降低 review 成本：改动精准，不用在一堆无关修改里找真正的变更提升代码质量：极简实现意味着更少的 bug、更好的可维护性加速迭代：目标驱动让 AI 真正解决问题，而不是生成代码对于中大型项目，这是让 Claude Code 真正“生产可用”的关键一步我的使用体会我在自己的几个项目里部署了这个 CLAUDE.md，最直观的感受是： AI 变聪明了以前它是个听话的实习生，你说啥它做啥，经常做错现在它像个有经验的同事，会主动问“你确定要这么做吗？我有个更简单的方案” 代码 diff 变干净了以前一个小需求能改几十个文件，现在精准到只改 3-5 行我的工作重心变了以前 60% 时间在 review AI 的代码、修 bug 现在 80% 时间在思考产品逻辑，AI 真正成了生产力工具最后这个项目被誉为 2026 年 AI coding 领域的“现象级”黑魔法工具小文件，大作用如果你在用 Claude Code / Cursor 写代码，强烈建议直接把这个 CLAUDE.md 扔进项目根目录 GitHub 地址：试过的人基本都是“已全项目部署”的状态作为一个天天和 AI 协作的开发者，我的建议是：别犹豫，直接用

0

41

487

92

轉發到社區

坂本答案@banbendaan

2026.05.15 13:42

实测了Biget的Pre IPO。 10万Ｕ打进去了1.7万U。分三次，2个月后完全解锁。利润不会很高，资金利用率低，占用时间比较长。

0

2

0

轉發到社區

木子不写代码@ai_muzi

2026.04.24 14:15

实测对比Deepseek V4的真实性能！ Deepseek V4 pro VS GPT5.5 VS Claude Opus 4.7 ! 👇👇👇 时间戳： 00:00 开场 00:36 价格对比 00:51 1.软件官网 02:22 2.数字杂志 04:09 3.电商首页 05:33 前端能力总结 06:00 4. AI编程后端 10:12 5.自媒体文案 11:38 6.广告营销 12:56 最终总结

0

19

76

4

轉發到社區