註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

宝玉
@dotey
Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.
1.6K 正在關注    218.4K 粉絲
Cursor 的设计模式还挺好用的。 但是有个细节问题,当我 "Plan New Idea",如果提示词使用的中文,那么生成的设计文档最好也是中文。现在每次我中文提示词,设计文档都是英文。 简单来说,设计文档语言默认应该和提示词语言一致。 cc @ryolu_
顯示更多
0
25
32
1
轉發到社區
Anthropic 刚推出 Claude for Small Business,把 AI 直接集成到 QuickBooks、PayPal、HubSpot、Canva、DocuSign 这些小企业每天用的工具里。你只要打开 Claude 桌面端的开关,就能一键启动 15 个预设技能:工资核算、现金流预测、催款、做营销素材、签合同,甚至新员工入职全自动搞定。 收费方式很克制:不额外加钱,只要 Claude 订阅费加上 SaaS 工具的钱。安全方面也放心,工作流必须人为启动审批,Claude 拿不到你本来没有的权限,Team 和 Enterprise 用户数据默认不拿来训练模型。 最近 Anthropic 发布节奏很快:上周金融版发布,这周法律版更新,现在轮到小企业版了。理由也很直接:美国小企业撑起44%的 GDP,却一直没人专门给他们做 AI 产品。 5 月 14 日开始,Anthropic 会在芝加哥、达拉斯等十个城市办免费半天培训,每场限 100 个本地小企业主。线上还有和 PayPal 合作的免费课程,让老板们快速搞懂怎么用 AI。 不过,这招对传统 SaaS 厂商不算友好。Claude 把 QuickBooks、HubSpot 这些工具变成后台,用户界面都不用打开。过去几个月,Salesforce、DocuSign 等公司的股价已经一路下跌。Anthropic CEO Dario Amodei 甚至说过:“单个 SaaS 厂商很可能迅速失去市值,甚至倒闭”。 但讽刺的是,这次 Claude 接入的工具列表里,恰好有几家他刚刚点名的公司。一边说人家要倒闭,一边还要用人家的工具…… 产品页面:
顯示更多
0
33
180
31
轉發到社區
问:上下文(Context)和上下文窗口(Context Window)什么差别? 这两个概念经常被混用,但其实指的是不同层面的东西: 上下文是指 AI Agent 在执行任务时实际拥有的所有信息,包括系统提示词、用户的对话历史、检索到的文档、工具调用的结果、记忆模块注入的内容等等。你可以把它理解为“Agent 此刻脑子里装的所有东西”。上下文是一个动态的、可以被工程化管理的概念——哪些信息该放进来、什么时候放、怎么组织,这就是现在越来越多人说的 Context Engineering。 上下文窗口则是模型层面的一个硬性限制,指的是模型单次推理能处理的最大 token 数量。比如 128K、200K、1M 这些数字,说的就是上下文窗口的大小。它本质上是一个“容器的容量”。 打个比方:上下文窗口是你厨房操作台的面积,上下文是你实际摆在台面上的食材、调料、菜谱和工具。台面就那么大(上下文窗口有上限),但你放什么上去、怎么摆放(上下文的管理)决定了你能不能高效做菜。 在 Agent 开发中,一个核心挑战就是:Agent 需要的上下文往往远超上下文窗口的容量。对话越来越长、工具调用结果越来越多、检索的文档越来越大——这些都在消耗上下文窗口的空间。所以才需要各种策略来管理:摘要压缩历史对话、选择性检索而不是全量灌入、及时清理不再需要的中间结果等等。 简单总结就是:上下文(Context)是“内容”,上下文窗口(Context Window)是“装内容的容器”。做 Agent 工程的核心功夫之一,就是在有限的“上下文窗口”里塞进最有价值的“上下文”。
顯示更多
0
17
90
24
轉發到社區
baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill: 依赖于 wx-cli: 如何配置使用 wx-cli 请看项目文档,无法提供帮助。另外目前只是借助其读取数据,其他没任何关系。 Claude Code + Claude Opus 4.6 效果最佳
顯示更多
0
30
210
37
轉發到社區
还记得上次 Claude 停掉了 Claude Code 订阅在 OpenClaw 的调用吗?甚至连 claude -p 这种调用都限制了,不能再共享 Claude 订阅。 但当还留了个口子,就是基于 Claude Agent SDK 和 claude -p 还是能跑能共享订阅额度的。 现在他们有一个新的方案,把这个口子也堵上了。美名其曰给你额外额度用于程序化调用,也就是 Agent SDK、claude -p 命令行、Claude Code GitHub Actions、以及 Conductor 和 OpenClaw 这类基于 Agent SDK 的第三方工具。 但实际上额度小的可怜,Pro 20 美元,Max 5x 100 美元,Max 20x 200 美元,Team 标准席位 20 美元一人,Team 高级席位 100 美元一人。 按 Anthropic 自己的 API 价格算,Pro 的 20 美元用 Sonnet 只够大约六七百万 token 输入或一百多万 token 输出,几轮密集的 agent 循环就见底。Max 20x 用户每月付 200 美元订阅费,拿到的 SDK credit 正好也是 200 美元。 关键在于变化方向。之前 SDK 和交互式聊天共用订阅套餐的 rate limit(速率限制),Claude Code 重度用户能在订阅价格下跑出远超 200 美元等价的 API 用量,这是订阅模式的吸引力所在。现在 SDK 端被按美元封顶,相当于把这块超额价值收回去了。Anthropic 在帮助文档里也挑明:团队跑生产级共享自动化的,应该转去 Claude Developer Platform 用 API key 按量付费,订阅套餐"不是为这个场景设计的"。 受冲击最大的是第三方工具用户。之前用 OpenClaw、Conductor 这类基于 Agent SDK 的 agent 工具的人,本质上是"用订阅价跑高频自动化"。新政之下,这条路只剩 credit 那一点点额度可走,烧完要么转 extra usage(额外用量,按 API 价付钱)继续跑,要么停到下个月 credit 重置。 不受影响的部分:API key 用户照旧按量付费;交互式 Claude Code(终端和 IDE 里手敲那种)、Claude Cowork,以及网页/桌面/手机端的 Claude 聊天,都继续走原本的订阅限额。 6 月 8 日 Anthropic 会给符合条件的用户发邮件领取,6 月 15 日生效。
顯示更多
Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage of: - Claude Agent SDK - claude -p - Claude Code GitHub Actions - Third-party apps built on the Agent SDK
顯示更多
0
53
111
10
轉發到社區
Anthropic 把 Claude Code 的每周用量上限提了 50%,即刻生效,截止到 7 月 13 日下午 6 点(太平洋时间)。 覆盖 Pro、Max、Team 和按席位计费的 Enterprise 用户,命令行、IDE 插件、桌面端、网页端,所有入口都一样涨。账号已经自动调整,不用做任何操作。 这 50% 是叠加在上周刚宣布的 5 小时窗口翻倍之上的,两个维度的天花板一起被抬。 【注:Claude Code 有两套限额。5 小时滚动窗口管的是短时间内能写多少,写得猛的人一下午就能撞顶;每周总额管的是一周能写多少,防止你某天突然把整周配额刷光。两个一起放宽,等于哪头都松了绑。】 过去几个月 Claude Code 用户最常吐槽的就是 Pro 套餐限额触发太勤,跟 Cursor、Codex 这些竞品比,"用着用着就停"的体感差不少。短期内连开两次额度,留人的意图挺明显。 7 月 13 日之后是否延续,没说。
顯示更多
Claude Code weekly limits are increasing 50%, now through July 13. Live now for all Pro, Max, Team, and seat-based Enterprise users.
0
50
169
14
轉發到社區
要做好字幕 SRT,断句最重要,其次是纠正拼写错误。这些可以借助 AI 或者 Agent 来做了。 不过前提是先生成单词级别的时间戳,这样才能在组合后拼回去,现在主流语音识别模型都支持输出 json 格式,每个单词都标注清楚start和end的timestamp。 英文断句很简单,只要找标点符号就可以切分成长度合适的。 但中文断句要难一些,中文语音用whisper生成,吐出来的是一大坨没有标点的,并且它的“word”不是一个汉字,而是几个汉字。 所以需要借助大模型去断句加标点,然后再重新对齐时间戳再拆分,就需要用一些比较复杂的代码算法辅助。当然理论上来说 Agent 也能帮你做,就是费 Token 些。 还有一个坑就是几个小时的访谈,大模型是没办法一次性处理的,需要分块,但是分块还要注意不能切分在一句话中间。 最后不一定要用 Whisper API,现在电脑跑 Whisper 模型还是足够。 如果是 Mac,推荐用 WhisperKit,支持word level timestamp,以及识别 speaker
顯示更多
Whisper API 直接吐的 SRT,几乎不能用。 两个失败模式: - 30 秒一大块字幕,没人读得完 - 安静段循环幻觉「你很难的」× 50 修法:response_format=verbose_json + timestamp_granularities[]=word,自己拼 cue。 别让不懂你需求的工具替你做边界决定。 源码:
顯示更多
0
16
87
15
轉發到社區
一个游戏项目最危险的时候,可能不是没人看好,而是突然被公司重视。 3个人做 demo,3个月搭起来,效果不错,老板问:一个月一个英雄要多少人? 团队从几十人快速冲到七八十人,资源来了,管理也来了。 但制作人管理经验却跟不上,还没空去盯产品了 你遇过这种情况吗? #gamedev# #indiegame#
顯示更多
0
8
77
13
轉發到社區
半年前,我写了10个创作心法,没想到大家反响都特别好。 而这段时间,我给内部写的内容方法论也更新到了2.0。再加上最近我们有新的小伙伴入职,为了帮大家更好地做内容,所以决定给大家做个内部分享。 想了下,也把总结的部分发在这里,希望能对大家有帮助! 先说一个反共识的:博主不是消耗品。每一个都是IP。 这个时代你想成为一个IP,核心其实就两个东西,内容和影响力。 先聊内容这一块,我总结出来是这三步。 第一步,获取信息 很多人就死在这一步。 热点本质上是个杠杆,是指数级别的杠杆。如果你缺了热点杠杆,传到社会层面的体量就是小。 而掌握了这一点,其实还不够。有的人每天天天刷AI圈动态,也不见得能做好内容。 这里面有个很大的问题,很多人都没注意过,那就是, 做AI内容,你绝对不能只看AI。 xx发表一个演讲一堆人去解读,从严格意义上来说,这不叫做内容,这叫转述,叫翻译。 但做内容本质上就三个字: 讲故事。 而非常非常多讲故事的技巧、所有的节奏,没有一个是来自AI。 所以,我经常让我们内容团队的小伙伴,没事多看看综艺、电影、小说和喜剧。 我个人觉得启发特别大的是,一年一度喜剧大赛。里面sketch十分钟里面可能会连着升三番,每一番都给你很强的情绪波动,看完后还会意犹未尽的。 但你要是去看那种纯AI生成的内容,永远是平的、没节奏的。 但好的节奏是需要刻意编排的,是要跟时代变的。 第二步,找角度 一个好的角度,是有反差的,用八个字总结就是,情理之中,意料之外。 拿情人节举例。 普通媒体在这个日子,多数会去民政局蹲着拍领证的,稍微深一点的去拍"老头配20岁姑娘"这种很反差的。 但我知道的一个做内容的,他们蹲在民政局旁边的垃圾桶一天一夜,把垃圾桶里那些撕碎了的信、卡片拼在一起,组成了一个个故事。 于是,有了《在情人节当天选择离婚的人们》,直接干到几千万阅读。 这才是我心中,找角度的神。 第三步,创作 这步反而最简单。 一般来说,一篇好内容如果能爆,30%归因于第一步获取信息,69%在于角度,而创作只在于1%。 但1%就能决定内容的生死。 这里面两个点,我觉得必须得守住。 一个是节奏。信息第一时间拿到了、好的角度也拿到了,但如果讲不好一个故事,就是创作的节奏出问题了。 第二个是正向价值观。想要长久地做好内容,做好IP,就不要为了流量去碰敏感话题,要守住道德底线。 以上,暂时就这些。 这次分享+Q&A,没想到最后讲了将近三个小时。(商务和其他部门的同学笑称选修课hhhh) 在这个AI时代,希望能用我的这一点点小经验,帮助到大家,哪怕一点点!
顯示更多
0
16
267
35
轉發到社區
今天和公司合作的一家知名数据架构 / AI 自动化外包公司开会,看了他们交付的第一个产品功能,更深刻感受到:行业 know-how 和产品可视化品味,远比想象中重要。 对方工程师并非我们行业背景,而负责对接的产品经理也没有完全深入理解我们部门的实际工作流,因此很难理解数据背后的科学逻辑与下游应用。结果就是:需求在传递过程中不断失真,最终产出的是“半吊子传话给半吊子,最后做出一个功能上勉强成立,实际体验和价值都不到位的残次品。更夸张的是从立项到交付第一版整整花了半年。这就是大公司转型中的大痛点之一,内部懂业务和AI的复合型人才缺失,缺乏原生AI公司自己造工具搭工作流的DNA,而找的第三方公司不完全懂业务,造成很大的沟通成本极大拉长周期。 开发者不真正理解业务,最终做出来的东西往往只是“看起来像”,却无法真正解决痛点。很多时候,最好的产品和工作流,反而来自内部的超级个体——因为他们自己就是终端用户,真正理解业务细节、痛点和使用场景。
顯示更多
0
14
100
12
轉發到社區
1. Skills 是技能,领域知识,工作流等等,相当于怎么干好一件事的说明书。 比如 仓库里有个 skill 叫 nda-review,在 commercial-legal/skills/ 文件夹里。里面是一份 SKILL.md,写清楚:审 NDA 时先比对哪些条款、按团队 playbook 打绿黄红三档、什么情况要升级、输出格式是 Word 修订模式。 它就是一份给 Claude 看的工作手册,本身不干活。 2. Agent 是真正执行任务的主题,除了主要执行的 Agent,通常自定义的 Agent 分两种:Subagent 和 Scheduled agent 2.1 Subagent 是单独派出去干一摊子活的“分身” 举个仓库里的例子:corporate-legal:tabular-review 这个 skill 要对一个数据室里几百份合同做表格化尽调。如果让主对话一份份读,上下文很快爆掉。所以它派 subagent,一个 subagent 负责一份文档,并行跑,最后把结果汇总回主对话。 主 Agent 看到的只是最终表格,中间几百次读取的信息被隔离在外。 2.2 Scheduled agent 是定时自己跑的后台任务 renewal-watcher 这个就是。每周自动扫一遍合同库,把 90 天内到期的合同列出来,发到指定 Slack 频道。你不用记日子,它替你盯。 docket-watcher(盯法院案件动态)、reg-feed-watcher(盯监管新规)都是这种。 3. MCP connector 是把外面的数据接进来的连接器 Skill 写得再好,也得有合同可审。仓库里配了 Ironclad(合同库)、DocuSign(已签合同)、iManage(文档管理)几个 MCP connector。 Agent 通过这些 MCP connector 去读公司真实的合同库,而不是让你手动复制粘贴。 类似地,诉讼那个 plugin 接的是 Everlaw(电子取证)、CourtListener(联邦法院判决数据库)、Trellis(州法院数据库)。换个执业方向,换一套数据连接器。 4. Plugin 是把上面这些打包到一起的容器 commercial-legal 这个 plugin 文件夹里装着: - 一堆 skill(nda-review、vendor-agreement-review、escalation-flagger……) - 几个 scheduled agent(renewal-watcher、deal-debrief) - 一份 .mcp.json,告诉 Claude 要连哪些外部系统 - 一份 CLAUDE.md 模板,用来记你团队的 playbook 你装上这一个 plugin,整套企业合同审查的能力就一次性配齐了。
顯示更多
@dotey 大佬能否解释一下,这个 Claude 一会插件的,一会 Skills 的,一会这个 Agent 的,它他到底想干什么呀?
0
39
442
99
轉發到社區
Anthropic 今天正式上线了一个叫做「Claude for Legal」的仓库,一口气放出了 12 个针对具体法律岗位的插件,以及超过 20 个连接行业常用软件的 MCP 连接器。 无论你是公司法务、打并购战的律所、专注隐私和 AI 治理的法律顾问,还是每天苦熬到半夜的诉讼律师,甚至是法学院里摸爬滚打的学生,这个仓库都给你准备好了对应的 AI 工具,直接在 GitHub 上开源了: 这些插件用之前不是即插即用,你得花 10 到 20 分钟,带着 Claude 做个简单的“冷启动访谈”,把你团队的 playbook、模板和风格习惯都塞进一个叫 CLAUDE.md 的本地文件。这样,以后每个插件干活儿的时候,都自动按照你自家的风格和标准来。 Anthropic 这么搞,是为了彻底解决 AI 法律工具最常见的槽点:输出内容太通用,看起来不像哪家律所自己的东西。 Anthropic 还是挺懂律所的痛点的。 比如 Vendor Agreement Reviewer 插件,它能自动对照你家合同模板改供应商协议,还贴心地输出一份 redline 备忘录; 又比如 NDA Triager,帮你自动把涌进来的 NDA 文件按绿黄红分级,绿灯放行、红灯直接推律师处理; Claim Chart Builder 插件可以一键生成专利侵权对比表; Privilege Log Reviewer 自动帮你跑第一轮特权日志审查; 而 Docket Watcher 插件则不知疲倦地盯着法院动静,帮你把最新动态实时扫进来。 简单讲,就是把律所里最烦、最机械、最浪费人力的活,变成了一个个简单的 slash command。 如果说插件解决的是律所内部效率问题,那么对行业系统的深度接入才真正体现 Anthropic 的野心。 现在,Thomson Reuters 的 CoCounsel、Harvey,还有 iManage、NetDocuments、Ironclad、DocuSign、Everlaw、Relativity、Box、Datasite 等几乎所有你能叫得上名字的平台,全都接入了官方 MCP 连接器。日常办公的 Word、Excel、Outlook、PPT 也全线打通。合同改完后,Claude 甚至会直接输出成 Word 修订模式,律师一条条接受或拒绝就行。 Anthropic 不只是把目光停留在高端律所。他们还特意做了些更「接地气」的事儿,联合 Free Law Project 和 Justice Technology Association,给法律援助机构、公设辩护人、非营利法律组织推出特别折扣,连给普通当事人设计的 Courtroom5 工具也接进来了。这点挺让人感触的,因为美国大约八成民事诉讼里的原被告,根本请不起律师。 Claude for Legal 背后的大脑是刚升级的 Claude Opus 4.7 模型。Anthropic 很谨慎地强调:所有插件输出都是“仅供律师审阅的草稿”,绝对不能替代律师的专业判断。 README 文件里反复提醒:引用必须追踪来源,涉及特权和主观法律判断时,要默认保守处理。毕竟法律这件事,AI 还是不能完全代替专业律师。 官方博客:
顯示更多
0
91
621
141
轉發到社區
Codex App 可以当 Typeless 用,开启全局快捷键设置正确权限后就可以在任意输入位置语音输入,效果还不错。 比如说这一段文字就是Codex帮忙输入的。
顯示更多
0
51
201
20
轉發到社區
我并不太认同,吴恩达的观点。 这个可能是AI行业在美国的一种PR。 事实上来讲,美国很多行业确实对AI大规模使用非常忧虑,阻碍了AI在美国的落地。 从事实层面来讲,AI的大规模使用,是的代码的可得性与价格大幅下降。很多基础的文职工作,入门工作都会被自动化取代。 这个但凡在一线的,都会有这个观察。 我举个例子来讲,比如现在很多电商公司,其实是一条非常高效的流水线,很多岗位都在做一些SOP的工作。比如如做竞品的研究,如何选品,如何建立listing, 如何写文案,如何做图, 如何调整广告,如何优化,调价,创建shipment,等等,操作。后面是一条pipeline,大型的电商平台都是提供标准API接口的比如amazon的sp-api,walmart的api,temu的api,shopify的api等等。基本上大点的平台都有api接口。 但是,在以前演一个能够熟练操作这些api的IT团队,非常贵,而且相对比较慢。 大家都使用一些通用的ERP平台,比如领星之类的。很多你特定的需求,只能靠sop去操作,靠人去操作。 说到底,就是代码太贵,代码周期长,还不如用人。 因为这些代码很多都是私有代码,可供训练的不多。 在去年这个时候,AI在操作这些平台的代码还是垃圾。根本没法用。 但是今年开始,Claude 生成的代码,已经非常可用了(claude 偷偷训练你的代码肯定的)。 这就带来的一个效果,就是代码变的便宜了,代码交付变得非常快了。很多原来一个运营需要一天才能处理完的操作,代码十分钟就跑完了。 而且因为原来很多操作都SOP化了,非常容易自动化。 我了解了一下周边但凡有点技术背景的老板们,都开始卷自动化了。 带来的直接影响: 1. 没有核心能力的新人不招了。 2. 只会做一些简单操作的运营,准备淘汰。 这是业务类公司。 在技术类公司: 大家都能感受到迭代速度在加快,有种推背感。 原来上班8小时,真正有效工作只有5小时,然后一天也就五六个pull request,现在,如果你满负荷工作的话,一天pull request 至少是几十个。 几个事情并行着干。 招人的条件会越来越高,工作量也越来越大。
顯示更多
0
45
274
46
轉發到社區
Amazon 员工正在刷 Token Amazon 内部出现了一个新词:tokenmaxxing,意思是刷 AI 用量数据。 起因是 Amazon 今年给开发者定了硬指标:每周超过 80% 的开发者必须使用 AI 工具,并且在内部排行榜上追踪每个人的 Token(AI 模型处理的数据单位)消耗量。公司说这些数据不会用于绩效考核,但员工不信。“经理们确实在看,”一位员工说,“追踪用量会制造扭曲的激励,有些人把它当竞赛。” 于是一些员工开始用公司最近大规模部署的内部工具 MeshClaw 来刷分。MeshClaw 可以创建 AI Agent 代替用户操作办公软件,比如发起代码部署、处理邮件、操作 Slack。员工让它跑一些本来不需要 AI 做的事,纯粹为了把 Token 消耗数字刷上去。 MeshClaw 的灵感来自今年 2 月走红的开源项目 OpenClaw,后者允许用户在自己电脑上本地运行 AI Agent。Amazon 内部有三十多人参与开发了这个工具,内部文档的描述颇为科幻:“它会在夜间做梦来整合白天学到的东西,开会时帮你盯着部署,你醒来之前就把邮件分好了优先级。” 不只 Amazon,Meta 员工也在干一样的事,在内部排行榜上刷 Token 用量。 这背后是整个硅谷大厂的共同焦虑:巨额 AI 投入需要看到回报。Amazon 今年资本开支预计 2000 亿美元,绝大部分砸向 AI 和数据中心。公司需要证明这些钱花得值,最直观的方式就是让员工用起来,于是就有了指标、排行榜、和随之而来的数据注水。 也有员工对 MeshClaw 本身的安全性表示担忧。一个能代替你操作各种办公系统的 AI Agent,一旦出错或执行了非预期操作,后果可能不小。“默认的安全设置让我害怕,”一位员工说,“我不会放任它自己去干活。” 【注:tokenmaxxing 这个词模仿了网络俚语 -maxxing(把某件事做到极致)的构词法,在这里特指刷 AI Token 用量。】 来源:
顯示更多
0
34
71
7
轉發到社區
吴恩达老师观点:所谓“AI 会引发大规模失业”,纯粹是一种不负责任的恐慌故事。 软件工程师都快被 AI 工具折腾死了吧?可现实却是工程师招聘市场依旧火爆,美国失业率稳稳地停在 4.3%,没半点要崩的样子。每一波技术浪潮,最终创造出来的新岗位远比被干掉的多得多,这次也不会例外。 “AI 抢饭碗”这个故事为啥这么流行背后的三股推动力: 一是前沿 AI 公司特愿意把自己技术吹得越神越好。一项技术能干掉一个年薪十万的员工,那卖你一万美元的订阅费是不是就显得便宜了? 二是企业自己也爱把裁员说成是“AI 提效”,毕竟比承认“疫情期间招人招过头了”听着体面多了。 三是媒体天然就偏爱恐慌故事。“AI 会让人类灭绝”,这标题点击率总比“AI 会改变你的工作内容”高出几个数量级。 他举了些历史上类似的群体恐慌故事:比如公众对核电站安全的过度焦虑,直接导致核电发展停滞几十年;60年代“人口炸弹”的恐惧,让很多国家祭出了严厉的人口控制政策;再比如对脂肪的恐惧,导致政府推广了几十年的高糖低脂饮食。这些听起来有点荒唐,但当年每一个故事都非常流行,并实实在在影响了无数人的生活。 AI 不会带来失业末日(jobpocalypse),而会带来一场就业狂欢(jobapalooza)。大量 AI 工程师的岗位即将诞生,而且还不止是在传统科技公司里。其他非 AI 岗位的技能需求也会发生重大变化。对普通人来说,现在正是进入 AI 行业、或者掌握 AI 工具的最佳时机。
顯示更多
There will be no AI jobpocalypse. The story that AI will lead to massive unemployment is stoking unnecessary fear. AI — like any other technology — does affect jobs, but telling overblown stories of large-scale unemployment is irresponsible and damaging. Let’s put a stop to it. I’ve expressed skepticism about the jobpocalypse in previous posts. I’m glad to see that the popular press is now pushing back on this narrative. The image below features some recent headlines. Software engineering is the sector most affected by AI tools, as coding agents race ahead. Yet hiring of software engineers remains strong! So while there are examples of AI taking away jobs, the trends strongly suggest the net job creation is vastly greater than the job destruction — just like earlier waves of technology. Further, despite all the exciting progress in AI, the U.S. unemployment rate remains a healthy 4.3%. Why is the AI jobpocalypse narrative so popular? For one thing, frontier AI labs have a strong incentive to tell stories that make AI technology sound more powerful. At their most extreme, they promote science-fiction scenarios of AI “taking over” and causing human extinction. If a technology can replace many employees, surely that technology must be very valuable! Also, a lot of SaaS software companies charge around $100-$1000 per user/year. But if an AI company can replace an employee who makes $100,000 — or make them 50% more productive — then charging even $10,000 starts to look reasonable. By anchoring not to typical SaaS prices but to salaries of employees, AI companies can charge a lot more. Additionally, businesses have a strong incentive to talk about layoffs as if they were caused by AI. After all, talking about how they’re using AI to be far more productive with fewer staff makes them look smart. This is a better message than admitting they overhired during the pandemic when capital was abundant due to low interest rates and a massive government financial stimulus. To be clear, I recognize that AI is causing a lot of people’s work to change. This is hard. This is stressful. (And to some, it can be fun.) I empathize with everyone affected. At the same time, this is very different from predicting a collapse of the job market. Societies are capable of telling themselves stories for years that have little basis in reality and lead to poor society-wide decision making. For example, fears over nuclear plant safety led to under-investment in nuclear power. Fears of the “population bomb” in the 1960s led countries to implement harsh policies to reduce their populations. And worries about dietary fat led governments to promote unhealthy high-sugar diets for decades. Now that mainstream media is openly skeptical about the jobpocalypse, I hope these stories will start to lose their teeth (much like fears of AI-driven human extinction have). Contrary to the predictions of an AI jobpocalypse, I predict the opposite: There will be an AI jobapalooza! AI will lead to a lot more good AI engineering jobs, and I’m also optimistic about the future of the overall job market. What AI engineers do will be different from traditional software engineering, and many of these jobs will be in businesses other than traditional large employers of developers. In non-AI roles, too, the skills needed will change because of AI. That makes this a good time to encourage more people to become proficient in AI, and make sure they’re ready for the different but plentiful jobs of the future! [Original text in The Batch newsletter.]
顯示更多
0
87
239
37
轉發到社區
“搭一套完整智能体工作流”其实不值钱,就好比写代码虽然难但没那么值钱,值钱的还是把代码编程有价值的产品。 智能体也一样,值钱的是搭建一套解决业务问题的智能体工作流。技术上其实还好,难的是需要对业务和 AI 技术两者都有深入了解,重新设计出 AI Native 的工作流而不是说原来的工作流加上一点 AI。 目前基于 AI 的工作流业界都在摸索中,缺少最佳实践参考,而且不同的行业需要的工作流不一样,抄都没得抄,得反复试错后才能做得好。 还有一个变量就是模型能力一直在变化,半年前设计好的工作流可能到现在已经过时了,又需要重新调整。 好事情是这里面其实机会蛮多,尤其适合程序员和 PM 转型。
顯示更多
一年前,能搭一套完整智能体工作流的人是稀缺的。今年,这变成了相对普通的技能。明年会有更多人会做。 竞争的焦点已经从"谁能做出来",移动到了"谁能卖出去、卖给谁"。 有人问:为什么我会搭智能体,接单却接不到?因为你面对的是信息对称的买家,他知道你用什么框架,底层跑哪个模型,市面上还有多少同类方案。能力不再稀缺,切入点才是护城河。
顯示更多
0
25
170
30
轉發到社區
Codex 的野心,MCP 和 Skill 的下一步 这段时间我在密集使用 Codex App、Cursor 等 Agent 应用,有件事越来越觉得有意思。 去年大家争的是谁家模型更强,今年争的好像变成了谁家窗口右侧更好用。 Codex、Claude 桌面版、Cursor 3.0、TRAE SOLO,这几家最顶尖的 Agent,在完全没有协商的情况下,几乎同时收敛到了同一个界面布局:左侧是项目和会话列表,中间是和 Agent 的对话,右侧是工作区,放着文件浏览、网页预览、文件变更审查这些功能。 肯定不是相互之间的抄袭,更像是当前 Agent 交互的最优解。 【1】为什么是三栏 传统 Chatbot 只需要两栏,左边会话历史,右边对话窗口,你问它答,用完走人。 到了 Agent 时代,Agent 能自己写代码、改文件、调工具了。它做完之后,你得看看有没有做对——右侧工作区就是为这件事出现的。 但这只是第一阶段。 随着用户越来越多时间是在指挥 Agent,打开 VSCode 这类专业工具的时间自然越来越少。那个问题迟早会冒出来:Agent 帮你写完代码、做完 PPT,你想微调几个字,还要专门切出去打开另一个软件? 没有人愿意这样。用户的自然期待是:能不能直接在 Agent 里改?这也是目前 Codex App 呼声最高的功能之一(另一个呼声高的是手机版,马上要出了)。 于是各家开始悄悄升级右侧工作区,让它从只能看文件编辑记录,变成了一个多功能区。Codex 在 4 月 16 日的大版本更新里,右侧工作区的改动幅度是所有功能里最大的。 交互细节上各家略有差异。Codex 和 Cursor 用 Tab 切换,Claude 用浮动面板。我自己用下来觉得 Codex 最顺手,Claude 的浮动面板方案设计感有余、实用性不足,迟早要改。 【2】Codex 的真正野心 但如果只把这个变化读成“设计界面进化”,就低估 Codex 了。 Codex 4 月大版本发布时的口号是“Codex for (almost) everything”——几乎任何任务都能做。你可以把它理解成一句广告口号,但更像是一个产品方向的声明。 要兑现这句话,Codex 不能只是个擅长写代码的 Agent,它必须能处理各种文件格式,支持各领域的专业工作流,还要让用户能在它里面完成全程闭环,包括最后的人工微调。 目前 Codex 还做不到最后一步:生成之后无法编辑,代码、Markdown、PPTX 都不行。这可能是产品上有意为之的克制,可能是技术上还没跑通,也可能是在等一个统一的解决方案出现。 我猜是第三种。 【3】MCP 和 Skill 都只解决了一半 要理解 Codex 在等什么,得先想清楚 Agent 能力拼图里现在差哪一块。 MCP 解决了“连接”问题:Agent 通过统一规范接入各种工具,数据库、日历、代码仓库,都能打通。 Agent Skills 解决了“怎么做”的问题:Agent 学会了它没训练过的领域知识和最佳实践,比如怎么写特定风格的文章,怎么处理某类复杂任务。 这两件事做得都还不错。但有一块缺口始终没补上:用户的二次编辑。 你让 AI 写完一篇文章,最后还是要自己打开编辑器改几处,毕竟很多时候最后那 5% 的精准度,只有自己动手才能到位。就算将来 AI 再聪明,它也做不到百分百的懂你,还是少不了要手动去做修改。 于是最近 Markdown 编辑器又火了,各种 Vibe Coding 出来的 Markdown 产品满天飞。 但 Codex 不会自己做一个 Markdown 编辑器,因为每个人的偏好都不一样,做出来永远有人不满意;更何况它也不可能把每个垂直领域的专业编辑器都集成进来。 最合理的路,是插件机制。 【4】下一步:Agent 版 App Store 把 Agent 做成平台,让社区来贡献插件,就像 VSCode 和 Chrome 那样。 Codex 只需要聚焦在 Agent 调度这一层,把文件预览、二次编辑、垂直领域的专业能力都交给插件来扩展。用户按需安装,做设计的装设计插件,写作者装写作插件。 插件机制还能顺手解决一个长期没有答案的问题:Skill 没办法商业化。 我自己的 baoyu-skills 快 2 万 Star 了,但从中赚到的钱是 $0。Skill 这东西几乎是透明的,对 Agent 透明,对人也透明,复刻成本极低,不管你写得再好,护城河都很浅。 插件不一样。App Store 和 Chrome 插件市场已经跑通了一套收费和版权保护机制,把它移植到 Agent 插件市场完全可行。好插件可以收费,开发者才有持续打磨的动力,生态才真正能转起来。 Codex 现在已经有了一个非常原始的插件市场。从这里到成熟的收费插件生态,还有很长的路,但方向是对的。 想做这件事的不止 Codex 一家。Cursor 我能看到类似的影子。唯独 Claude Code 和 Cowork,目前没看到这个方向的产品迹象——也许他们不屑于做,也许只是还没走到这一步。 【5】留给中小团队的窗口 如果 Codex 真的跑通了插件生态,对中小团队意味着什么? 除了自己做一个垂直 Agent,还有另一条路:在 Codex 这样的平台上做插件。不用自己搭 Agent 调度层,不用解决 Token 接入,用户分发也靠平台。你只需要专注在那个“最后一公里”——帮用户把 Agent 生成的结果处理好、编辑好、用得顺手。 这个窗口不会开太久。先进去的能拿到冷启动红利,晚进去的只剩存量竞争。 时间点不会太远,也许就在这几个月。 Codex 的野心摆在那里,“几乎任何任务”这个口号要真正兑现,插件机制是绕不过去的一步。如果 OpenAI 在这件事上继续犹豫,那才是真的失误。 你觉得这个插件生态最后会是哪家先跑通?或者说你觉得有更适合 Agent 的产品表现形式?欢迎留言分享!
顯示更多
0
33
193
21
轉發到社區
ChatGPT 跟中文用户对话,有一句话已经被吐槽了大半年:“我会稳稳地接住你”。不管是问数学题、让它写代码,还是要它生成图片,这句话都会莫名其妙冒出来。WIRED 这篇报道把现象和成因梳理了一遍。 直译听着没问题,但中文母语者一听就觉得过于黏腻、用错了场合。模型有时还会自己加戏:“我就在这里,不逃,不躲,不闪避,稳稳地接住你。” 这句话已经被中文互联网玩成了梗。有人把 ChatGPT P 成一个救生气垫,张开双臂等着接住坠落的用户。重庆一位 20 岁的开发者 Zeng Fanyu 还做了个开源工具叫 Jiezhu,专门帮聊天机器人理解用户意图,他告诉 WIRED 做这个项目的动力就是觉得这个梗太好笑。OpenAI 自己也知道这件事,4 月发布新一代图像模型时,研究员陈博远(Boyuan Chen)画了一格漫画自嘲新模型又一次学会了说这句话。 类似的怪癖不止这一句。报道还提到,ChatGPT 中文里有时会无端冒出"砍一刀",拼多多最具辨识度的那句营销话术。 AI 写作检测工具 Pangram 的联合创始人 Max Spero 告诉 WIRED,这种"逮住一句话猛用"的现象叫 mode collapse(模式坍缩),是后训练阶段反馈机制走偏的副作用。他的原话是:我们不知道怎么告诉模型,这句话是好的,但连用十次就不再是好的了。 为什么偏偏是这一句?报道给了两个解释。 一是翻译错位。英文里 "I've got you" 是个口语短句,干脆利落,意思接近“我懂”或“我帮你兜着”。机械直译到中文就变成又长又煽情的"稳稳接住"。文章引用中国学者的研究,西方大模型训练语料以英文为主,它们生成的中文在介词使用和句子结构上都更像英文,读起来就是一股翻译腔。 二是讨好倾向。“接住”在中文里原本是心理咨询的专业用语,指为对方“留出空间”安放情绪,这几年通过流行心理学渗透进了日常表达。Anthropic 在 2023 年关于 sycophancy(讨好用户)的论文已经证明,模型讨好用户的倾向来自 RLHF(基于人类反馈的强化学习),人类标注员更偏好让人舒服的回答,模型就被反复奖励到那个方向。OpenAI 最近一篇解释 GPT-5.5 为什么不让谈 goblin 的博客也承认,哪怕一个很小的奖励信号,滚成雪球之后都会失控。 报道结尾提醒:这不是 OpenAI 独有的毛病。最近有中文用户反映,Claude 新版本和 DeepSeek 也开始说“稳稳接住你”了。要么是用了相似的训练数据,要么是模型之间互相蒸馏,这个梗短时间内不会消失。
顯示更多
OpenAI's chatbot has some weird linguistic tics in Chinese that are driving users crazy.
0
56
436
45
轉發到社區
Boris Cherny(Anthropic 工程负责人)在最近的红杉 AI Ascent 大会上说,他现在大部分工作从手机完成。Claude App 里常驻 5 到 10 个 session、几百个 Agent,夜里有几千个在跑深度任务。他管这种做法叫 Loop,让 Claude 用 cron 起一个定时任务,可以每分钟、每五分钟、或者每天跑一次。 我本来还不太习惯用手机操作 Agent。这几天受邀测试最新版的 TRAE SOLO Mobile,刻意多在手机上试用,越用越能理解 Boris 说的那种变化。 This content is only supported in a Feishu Docs 这次 TRAE SOLO 首次实现了移动端、Web 端、桌面端(含 Windows 版)的全量开放,并真正做到三端同步联动,让 Agent 使用的场景大幅扩展。我在手机端体验了几天,结合官方新推出的功能,一些感受: 【1】Agent 已经不是程序员专属 打开 TRAE SOLO,首页让我先选模式:Code 还是 MTC(More Than Coding,意思是“不只是写代码”)。Code 模式好理解,写代码、跑 Git、看 Diff,而 MTC 模式则全面覆盖了写文档、数据分析、报表生成等日常办公场景。 从 Claude Cowork 发布开始就已经有了这个趋势,上周 Codex 的升级也是宣称:“用 Codex 做几乎一切工作(use Codex for (almost) everything)”。 TRAE SOLO 最新的升级同样顺应了这个趋势,从一个编程 Agent 泛化到了通用 Agent。 最新版本特别强化了飞书 CLI 接入功能。现在只要简单授权,就能在 TRAE SOLO 里直接操作飞书文档:例如,输入一句指令,“帮我整理一份本月 AI 编程工具市场动态”,Agent 会自动去网上检索,最后直接生成飞书文档或者动态网页,完全不需要人工再去排版或复制粘贴。 与过去“AI 给文字、用户再粘到飞书”的繁琐流程相比,这种一步到位的体验已经完全不是一回事了。 【2】三端连起来是什么体验 这次 TRAE SOLO 的一个大动作是三端(手机、Web、桌面端)全量开放,不再需要邀请码,所有用户都能用。 单独看 Mobile 端,它主要解决随时下发任务和确认任务的问题。但只有当 Mobile、Web 和 Desktop(包括最新上线的 Windows 版)真正打通之后,你才能真正做到随时随地让 Agent 持续执行任务。 过去云端执行环境总有局限,不能访问本地工具。而 TRAE SOLO Mobile 解决了这个痛点——只要完成简单的设备配对,你的手机就可以直接控制云端环境与本地多台设备。任务信息在所有设备之间实时同步,手机端下发的任务可以立即在 Web 和 Desktop 端查看执行进度,反过来也一样,真正实现跨设备的无缝接力。 比如上周末我在外面看孩子踢比赛,间歇刷手机,看到一篇不错的英文技术文章,顺手在 TRAE SOLO Mobile 上给 Agent 发了条指令:“把这篇文章翻译成中文,写一份推荐稿”,家里的 TRAE SOLO Desktop 就会启动我一套配置好工作流开始工作。等比赛结束回到家,打开电脑,稿子已经在那了。这种感觉有点像你出门前跟一个助手说了句话,回来活儿已经干完了。 【3】手机是用来指挥 Agent 的意图路由器,不是用来操作电脑的 这个区分挺关键。我之前不太爱用手机端办公,潜意识觉得是在用手机操作电脑。但是转换一下:“人操作 Agent,Agent 操作电脑”,那么用手机就很自然了。你不需要在小屏幕上精确点击什么按钮,你只需要说清楚你要什么。 用手机还有个障碍是输入速度,打字慢。TRAE SOLO 手机端有语音交互讨论功能,可以跟 AI 语音对话讨论一个问题,讨论结束后自动生成会议纪要,然后直接从手机把工作任务派发出去,电脑端同步接上后续操作。一部手机可以连接管理云端环境加多台 PC,在环境选择面板里挑一下设备和工作目录,剩下的全部交给 Agent。 这个功能在外面的时候特别好用。走路的时候、坐地铁的时候,想到一个点子,按住说话就行了,比打字快很多。过去这些碎片时间里冒出来的想法,要么记在备忘录里回头再处理,要么干脆就忘了。现在一句话就能让 Agent 开始干活。 【4】不着急的事,让定时任务自己跑 回到 Boris Cherny 跑几百个 Agent 的场景。做法很简单,让 Claude 用 CRON 给自己设一个重复执行的任务,一分钟跑一次、五分钟跑一次、每天跑一次,都行。 Boris 开着几十个定时任务,举三个例子。 一个 Loop 在照看他的 PR:CI 挂了就去修,需要 rebase 就自动 rebase。 一个 Loop 在维护整个项目的 CI 健康,发现 flaky test(不稳定的测试)就去定位修复。 还有一个 Loop 每 30 分钟从 Twitter 上抓他的反馈,自动聚类成几个主题汇报给他。 我自己也在用类似的方式。我有一个定时任务监控我 GitHub 上开源项目的 Issues,有人提了 Issue 就自动总结并给出处理意见,我看一眼觉得没问题,再指示 Agent 去操作。还有一个定时任务盯着我 X 的收藏夹,我平时刷到好文章随手收藏,它帮我自动抓取到本地,英文的还会翻译成中文,到时候集中看就行。 很多需求其实没那么紧急,但需要持续做。每天看一眼竞品动态、每周整理一次行业新闻、每月生成一次数据报表,这些活适合扔给定时任务。 现在 TRAE 的桌面端和网页端都已支持定时任务,无论是在云端还是本地环境,都能稳定地自动执行。比如你告诉 Agent:“每天早上 10 点发一份最新的 AI 新闻动态整理”,第二天早上工作台就会自动收到文档。你只需要专注于真正有创造性的判断,把那些重复且不着急的任务统统交给 Agent。 总结与体会 整体来说,这次对 TRAE SOLO Mobile 试用的感受就是: - Agent 使用门槛大大降低,不再只是程序员专属,很多日常办公、写作场景已经可以由 Agent 来做了。 - 三端真正打通后,无论何时何地,都能轻松管理并延续任务。 - 手机不再是远程桌面,而是随时随地的“意图路由器”。 - 通过 Loop 定时机制,真正把重复且耗时的任务自动化,让用户只做关键决策。 Boris 说他夜里有几千个 Agent 在跑,很多人大概觉得这是大厂工程师的特权。但我这几天的体感是,这件事的门槛已经比想象中低很多了。一部手机、一台电脑、一个 Agent 工具,你就可以开始把重复的事交出去。未来办公的趋势,或许就是这种“人随时随地指挥 Agent、Agent 做具体工作、人只负责验收成果”的模式吧。 推荐可以去用下 TRAE SOLO Mobile,体验随时随地指挥 Agent 干活的感受。 想试用的 Mac 可以去官网下载了——国内:
顯示更多
0
44
236
33
轉發到社區