继续分享今天的Manus使用实例。
起因是看到有媒体转载了A16z刚刚更新的Web端AI应用50强,编辑用红圈标出了其中的国产AI应用,用以佐证赢麻了的主题。(图1)
这就是我说小厂千万不要害怕营销风评的原因,在很多时候你连曝光权都不会得到平等对待,编辑只认得大厂出品的图标和名字,但实际上这里图还有一堆中国公司推出的AI产品,就这么被开除国籍了。
那么,如果要核实这里面到底有几家中国公司,怎么办?Claude会用知识库的截止日期来做筛选,Grok 3的Deep Research轮次不够,OpenAI的Operator应该可以但200美金我是真没开,最后用Manus解决回放在这里你们可以自己看:
manus点im/share/AppolsjmuwQW9EevzVrRlN?replay=1
manus点im/share/KJDn3CJL4kVXBXiV0mANeU?replay=1
我的指令词是:「这张图上有50款AI产品,请确定其中哪些产品是由中国公司推出的,不要遗漏也不要偷懒,老老实实的对每一家公司进行核实,最后给我一份报告。」
这是一个纯体力活,如果给人(实习生)来做,就是让他把每一家公司的名字写下来,然后一家家的去查,最后给出一个报告,券商之类的机构把工作拆解到执行端,都是这么干的。
AI Agent至少能够起到等量价值,Manus的todo列得很清晰,先用OCR提取图片文本,列出1-50家公司,接着一家家的去做查询,包括搜索关键词、访问官网、确认总部、了解新闻、甚至阅读LindIn,最终告诉我列表里实际上有12款由中国公司推出的产品。(图2)
这个交付成果我是认的,有些带争议的判断,比如它没有把PixAI算进去,是因为PixAI本身总部就设在新加坡,实控团队在国内的消息比较隐蔽,按Manus给自己定的验证标准来看不算遗漏。
这么说吧,如果你要解决类似的需求,你是自己机械性的操作几个小时,不停的开关窗口更新文档,还是把活儿丢给AI Agent牛马去干,只负责验收结果?
另外,从实测体感出发,「不要遗漏也不要偷懒,老老实实的对每一家公司进行核实」这句话也是必加的,原因和我前几天说的模型偷懒本能有关,不刻意强调的话很容易被AI偷工减料。
就像以前的提示词技巧会有情绪勒索的偏方,比如说你要是不认真回答这个世界就会有一个无辜的人死去,然后立竿见影的AI就会用心多了,后来几次训练迭代之后AI已经变聪明了,情绪勒索不再管用,但「请调用你的单次Token消耗上限」这样的明确命令还是偶尔能有奇效。
这次任务也超出了Manus的单任务算力上限,所以拆成了2次完成的,还是那句话,AI Agent发展路上的最大拦路虎,永远是计算资源的分配,芯片会是个好生意,而且不应该只是英伟达的好生意。
顯示更多
Boris Cherny(Anthropic 工程负责人)在最近的红杉 AI Ascent 大会上说,他现在大部分工作从手机完成。Claude App 里常驻 5 到 10 个 session、几百个 Agent,夜里有几千个在跑深度任务。他管这种做法叫 Loop,让 Claude 用 cron 起一个定时任务,可以每分钟、每五分钟、或者每天跑一次。
我本来还不太习惯用手机操作 Agent。这几天受邀测试最新版的 TRAE SOLO Mobile,刻意多在手机上试用,越用越能理解 Boris 说的那种变化。
This content is only supported in a Feishu Docs
这次 TRAE SOLO 首次实现了移动端、Web 端、桌面端(含 Windows 版)的全量开放,并真正做到三端同步联动,让 Agent 使用的场景大幅扩展。我在手机端体验了几天,结合官方新推出的功能,一些感受:
【1】Agent 已经不是程序员专属
打开 TRAE SOLO,首页让我先选模式:Code 还是 MTC(More Than Coding,意思是“不只是写代码”)。Code 模式好理解,写代码、跑 Git、看 Diff,而 MTC 模式则全面覆盖了写文档、数据分析、报表生成等日常办公场景。
从 Claude Cowork 发布开始就已经有了这个趋势,上周 Codex 的升级也是宣称:“用 Codex 做几乎一切工作(use Codex for (almost) everything)”。
TRAE SOLO 最新的升级同样顺应了这个趋势,从一个编程 Agent 泛化到了通用 Agent。
最新版本特别强化了飞书 CLI 接入功能。现在只要简单授权,就能在 TRAE SOLO 里直接操作飞书文档:例如,输入一句指令,“帮我整理一份本月 AI 编程工具市场动态”,Agent 会自动去网上检索,最后直接生成飞书文档或者动态网页,完全不需要人工再去排版或复制粘贴。
与过去“AI 给文字、用户再粘到飞书”的繁琐流程相比,这种一步到位的体验已经完全不是一回事了。
【2】三端连起来是什么体验
这次 TRAE SOLO 的一个大动作是三端(手机、Web、桌面端)全量开放,不再需要邀请码,所有用户都能用。
单独看 Mobile 端,它主要解决随时下发任务和确认任务的问题。但只有当 Mobile、Web 和 Desktop(包括最新上线的 Windows 版)真正打通之后,你才能真正做到随时随地让 Agent 持续执行任务。
过去云端执行环境总有局限,不能访问本地工具。而 TRAE SOLO Mobile 解决了这个痛点——只要完成简单的设备配对,你的手机就可以直接控制云端环境与本地多台设备。任务信息在所有设备之间实时同步,手机端下发的任务可以立即在 Web 和 Desktop 端查看执行进度,反过来也一样,真正实现跨设备的无缝接力。
比如上周末我在外面看孩子踢比赛,间歇刷手机,看到一篇不错的英文技术文章,顺手在 TRAE SOLO Mobile 上给 Agent 发了条指令:“把这篇文章翻译成中文,写一份推荐稿”,家里的 TRAE SOLO Desktop 就会启动我一套配置好工作流开始工作。等比赛结束回到家,打开电脑,稿子已经在那了。这种感觉有点像你出门前跟一个助手说了句话,回来活儿已经干完了。
【3】手机是用来指挥 Agent 的意图路由器,不是用来操作电脑的
这个区分挺关键。我之前不太爱用手机端办公,潜意识觉得是在用手机操作电脑。但是转换一下:“人操作 Agent,Agent 操作电脑”,那么用手机就很自然了。你不需要在小屏幕上精确点击什么按钮,你只需要说清楚你要什么。
用手机还有个障碍是输入速度,打字慢。TRAE SOLO 手机端有语音交互讨论功能,可以跟 AI 语音对话讨论一个问题,讨论结束后自动生成会议纪要,然后直接从手机把工作任务派发出去,电脑端同步接上后续操作。一部手机可以连接管理云端环境加多台 PC,在环境选择面板里挑一下设备和工作目录,剩下的全部交给 Agent。
这个功能在外面的时候特别好用。走路的时候、坐地铁的时候,想到一个点子,按住说话就行了,比打字快很多。过去这些碎片时间里冒出来的想法,要么记在备忘录里回头再处理,要么干脆就忘了。现在一句话就能让 Agent 开始干活。
【4】不着急的事,让定时任务自己跑
回到 Boris Cherny 跑几百个 Agent 的场景。做法很简单,让 Claude 用 CRON 给自己设一个重复执行的任务,一分钟跑一次、五分钟跑一次、每天跑一次,都行。
Boris 开着几十个定时任务,举三个例子。
一个 Loop 在照看他的 PR:CI 挂了就去修,需要 rebase 就自动 rebase。
一个 Loop 在维护整个项目的 CI 健康,发现 flaky test(不稳定的测试)就去定位修复。
还有一个 Loop 每 30 分钟从 Twitter 上抓他的反馈,自动聚类成几个主题汇报给他。
我自己也在用类似的方式。我有一个定时任务监控我 GitHub 上开源项目的 Issues,有人提了 Issue 就自动总结并给出处理意见,我看一眼觉得没问题,再指示 Agent 去操作。还有一个定时任务盯着我 X 的收藏夹,我平时刷到好文章随手收藏,它帮我自动抓取到本地,英文的还会翻译成中文,到时候集中看就行。
很多需求其实没那么紧急,但需要持续做。每天看一眼竞品动态、每周整理一次行业新闻、每月生成一次数据报表,这些活适合扔给定时任务。
现在 TRAE 的桌面端和网页端都已支持定时任务,无论是在云端还是本地环境,都能稳定地自动执行。比如你告诉 Agent:“每天早上 10 点发一份最新的 AI 新闻动态整理”,第二天早上工作台就会自动收到文档。你只需要专注于真正有创造性的判断,把那些重复且不着急的任务统统交给 Agent。
总结与体会
整体来说,这次对 TRAE SOLO Mobile 试用的感受就是:
- Agent 使用门槛大大降低,不再只是程序员专属,很多日常办公、写作场景已经可以由 Agent 来做了。
- 三端真正打通后,无论何时何地,都能轻松管理并延续任务。
- 手机不再是远程桌面,而是随时随地的“意图路由器”。
- 通过 Loop 定时机制,真正把重复且耗时的任务自动化,让用户只做关键决策。
Boris 说他夜里有几千个 Agent 在跑,很多人大概觉得这是大厂工程师的特权。但我这几天的体感是,这件事的门槛已经比想象中低很多了。一部手机、一台电脑、一个 Agent 工具,你就可以开始把重复的事交出去。未来办公的趋势,或许就是这种“人随时随地指挥 Agent、Agent 做具体工作、人只负责验收成果”的模式吧。
推荐可以去用下 TRAE SOLO Mobile,体验随时随地指挥 Agent 干活的感受。
想试用的 Mac 可以去官网下载了——国内:
顯示更多
🚀 如何在 6 个月内成为全球前 1% 的 Vibe Coding 顶级高手?(附完整保姆级路线图)
说实话,很多人以为 Vibe Coding 就是下载个 AI 工具,输入一句模糊的需求,然后坐等奇迹发生。那不叫意念编程,那叫买彩票。用这种玩法,你只会陷入修 Bug 制造新 Bug 的死循环里。
真正的 Vibe Coding 是一套非常硬核的构建系统,核心就是四个字:先划后干。如果你想把脑子里的想法真正变成能上线的赚钱产品,不要再去看那些永远做不出成品的理论教程了。这份 6 个月的保姆级路线图直接拿走,全都是大白话,照着做就行。
1、第1个月打牢底层基础 新手最爱跳过基础,结果代码一报错就抓瞎。你不用精通编程,但必须懂行话。你要理解Web运行机制,搞懂前后端和API。必须掌握Git,这是你代码崩溃时的唯一救命稻草。最后锁死一套技术栈,推荐Next.js加Supabase加Vercel,别瞎折腾。
2、第2个月选对趁手兵器 零基础做快速原型直接用Lovable。有基础的开发者闭眼选Cursor,熟练掌握多智能体并行。硬核极客用Claude Code,让它接管你整个代码库。记住一个铁律,每个项目根目录必须建一个规则文件,提前给AI立好规矩。
3、第3个月掌握架构与提示词 千万别一上来就让AI写代码。必须先写产品需求文档,明确目标用户和成功标准。学会给AI投喂干净的结构化文档,它能少犯一大半的错。大项目必须用规格驱动开发,让规格文档去指挥AI,而不是靠你的脑洞临场发挥。
4、第4个月打造真实商业项目 别再写烂大街的天气预报App了,去解决垂直行业的真实痛点。建立防错循环:永远让AI先出计划,你批准后再让它写代码,写完丢给另一个大模型做安全审查。并且一定要让AI先写测试用例,这是防止代码崩塌的唯一解药。
5、第5个月进阶MCP与上下文魔法 真正的高手知道怎么给AI喂数据。必须玩转MCP协议,让你的AI直接连通外部世界。比如让AI直接读取Figma设计图写前端,或者直接操作数据库。同时学会控制Token预算,大任务用贵模型,小任务用便宜模型,及时压缩长对话防破产。
6、第6个月专业部署与变现 最后一步是把产品推向市场。前端扔给Vercel,后端接Supabase,挂上监控追踪报错。接下来选定你的搞钱路线:要么当独立黑客开发垂直SaaS卖订阅,要么拿着项目去大厂拿高薪,或者帮传统企业搭建自动化工作流赚咨询费。
最后再唠叨一句,大多数人看完只会点个收藏,但真正能拉开差距的人只做三件事:不看教程直接干,公开分享自己的构建过程,每个月必须硬憋出一个带真实网址的上线产品。行动决定上限,赶紧去挑个痛点开干吧。
顯示更多
我最近做了个很有意思的现场音乐产品。但是在做的过程中,我和 cc 有着反复的讨论,这个讨论很有意思,我决定记录分享下来。
很多现场音乐会使用 web 技术做音乐可视化,我的想法是使用 dynamic worker 可以验证 llm 到音乐生成和可视化的思路,而且这正是 v8 这种小隔离环境擅长做的事情。但实际上使用下来,会发现:
使用 codex/cc 可以 one shot 做出完成度较高的可视化内容,但使用 API 调用 llm 却很难 one shot 做到。因为这本质上要求我们在 API 层面实现复杂的 cli tool use,这就回到今年以来的最大选题困境,也是我不押注 cloudflare 那条“应该由 llm 写代码交给 sandbox 执行,而不是在 sandbox 中执行 llm cli” 的原因。
这种技术选型的困境是,一方面我们依赖大量的 skill 上下文导致 context 变的很大,在单一 llm 调用,甚至严格要求 cpu 运行时间的环境中不太合适,另外一方面,单一 API 调用导致的错误率非常高(缺少 agentic loop 的天然问题)
做到最后,cc 无法在这种技术架构下实现批量生产高完成度的产品,要求我将 dynamic worker 这种技术选项删除,完全走受控制的路线(llm 输出 json 这种传统的方式),而且他提供了一个产品上的说服思路,以下是它的原话:
「艺术家在 TD/Notch 做出精彩不是因为工具"自由"——恰恰相反,TD 节点比裸 WebGL更约束。但节点本身是作品级封装(feedback loop / particle GPU / volumetric / post-FX chain)。艺术家的"自由"表现为在高级原语之间的组合。所以 Recipe 路径的本质不是 "限制 LLM",而是"把 LLM 的工作台从锤子钉子换成 TouchDesigner"——LLM 的语义自由度不变(从 prompt 到风格决策),但手里的原语变强」
换句话说,cc 认为艺术性表达的本质在于约束而不是发散。产品应当尽可能的引导用户思考,而不是让用户在一个无尽的空间中自由探索。这个反馈把一个技术选型的问题突然变成了一个哲学问题,是很有意思的对话实践。
顯示更多
Codex 提效先看这 10 个 Skill(官方版)
把这些 Skill 看明白,很多重复劳动可以直接少一半。
1. Frontend Design
专治 AI 前端审美。
少一点蓝紫渐变、默认字体、模板卡片、按钮乱飞。适合做网页、小工具 UI、数据看板、SaaS 原型。
2-4. docx / xlsx / pdf
让 Agent 正经处理 脏活累活。
不是把 Markdown 复制进文档就完事,而是能管目录、页眉页脚、批注、修订、图片替换和模板。写报告、方案、合同初稿都用得上。适合合同、论文、发票、报告党。
5. pptx
别再让 AI 把大纲硬塞进 PPT。
这个 Skill 会关心模板、版式、缩略图和备注。做汇报、课程、路演、商业计划书的时候很实用。
6. webapp-testing
让 AI 真的打开页面看一眼。
用 Playwright 跑本地 Web 应用,截图、看 DOM、查控制台、测交互。前端代码能不能用,别只靠它嘴上说。
7. mcp-builder
想把 Agent 接进真实系统,先看这个。
它讲的不只是“包一层 API”,而是工具怎么命名、怎么分页、怎么报错、怎么返回上下文。做企业内部 Agent 很有用。
8. skill-creator
想写自己的 Skill,先别凭感觉开干。
这个是元 Skill,教你怎么设计触发场景、工作流程、测试用例和迭代方式。真正适合拿来学“Skill 应该怎么写”。
9. doc-coauthoring
适合写复杂文档。
不是让 AI 直接代写,而是一起搭结构、补上下文、站在读者视角查漏洞。PRD、RFC、项目说明、技术方案都能用。
10. internal-comms
专门处理内部沟通。
周报、项目更新、事故复盘、FAQ、团队 newsletter。很多内部材料不是不会写,而是重点乱、顺序乱、读者看完不知道下一步干嘛。
如果只挑 3 个先看:
Frontend Design、xlsx、skill-creator。
一个管审美,一个管高频文件,一个管你以后怎么自己做 Skill。
Skill 最值钱的地方,不是让 AI 显得更聪明,而是让它少乱来。
一个好 Skill,就是一份能反复交给同事的工作说明书。
顯示更多
干什么活就用什么AI,分享我的自用AI工具清单
我把日常8大工作场景的最优工具整理出来了,都是我亲自跑通流程的
不是全网最全,但一定是最实用的
1. 学习 & 研究
核心需求:抓信息、消化长文、生成笔记、深度学习
最优工具:
NotebookLM:把一堆 PDF、网页、视频转成播客,开车的时候听,学习效率直接翻倍,现在跑在 Gemini 3上,理解能力比去年强太多
YouMind:我自己在用的 AI 创作工作台,搜索、整理、生成一条龙,特别适合需要反复迭代的内容项目 ,一站式学习工作台
Perplexity / Gemini 3:实时研究用这两个,Gemini 速度快还免费,背靠google搜索庞大的数据,信息的搜索没得说,Perplexity 引用更规范
使用建议:日常快速问答用 Gemini,复杂研究用 Claude + Perplexity 组合拳
2. 写作 & 内容创作
核心需求:生成草稿、优化文案、创意输出
最优工具:
Claude Sonnet 4.5永远的神:复杂写作、长内容的首选,写出来的东西最像人写的
3. 编程 & 开发
核心需求:写代码、调试、自动化、快速构建产品
最优工具:
Cursor:$60/月(20刀属实不够用),AI IDE,堪称AI编程届的鼻祖了,AI调教水平绝对是遥遥领先的
Claude Code:$20/月起,$100/月,深度推理能力最强,1M token 上下文窗口,高手必备
v0 / Lovable / Manus:自然语言转web,不会代码也能做产品
n8n / Make / Zapier:工作流自动化,把重复劳动交给 AI
使用建议:新手从 Gemini CLI 起步,准备投入就上 Cursor 或 Claude Code
4. 图像生成 & 编辑
核心需求:海报、设计、商业 KV、修图
最优工具:
Nano Banana Pro / GPT Image 2:高质量生成,文字排版准确,商业场景能直接用
Ideogram:2026年最可控实用的图像生成工具
Midjourney / Flux:创意艺术向,适合做概念图和插画
使用建议:一套提示词可以输出多场景(门店海报、地铁广告、小红书封面)
AI 时代最稀缺的不是工具,是审美
5. 视频 & 动画
核心需求:短视频、广告、数字人、唇同步
最优工具:
Seedance 2.0:2026年5月登顶 Artificial Analysis 排行榜第一,支持9张图+3段视频+3段音频混合输入,适合从自己的素材库构建视频
Kling 3.0:电影级单镜头最长15秒,4K/60fps,多镜头故事板,角色一致性最强,原生音频支持5种语言唇同步
Veo 3.1:Google 出品,综合质量最强,真人对话的逼真度天花板
HeyGen:数字人、唇形同步、多语言翻译,商业场景首选
使用建议:没有单一最佳工具,根据场景选
需要从自己素材生成→Seedance 2.0
需要电影感长镜头→Kling 3.0
需要最真实的对话→Veo 3.1
6. 音频 & 音乐
核心需求:配音、翻译、音乐生成、播客
最优工具:
ElevenLabs:声音克隆、情感配音,质量最稳定
Suno :音乐生成,从哼唱到完整编曲
Gemini TTS / Podcastle:播客制作、多语言翻译+唇同步
7. 效率 & 自动化
核心需求:会议纪要、任务执行、一人公司运营
最优工具:
Manus:端到端 Agent 任务,让 AI 真正帮你干活
飞书:会议纪要自动生成
Dify / Coze:国内自动化平台,搭建自己的 AI 工作流
Zapier / Make:连接各种工具,打通数据流
2026年,AI 是用来真正提升生产力、实现商业变现的
干什么活,就用什么 AI
顯示更多
OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的,1 月份报道的合同价值超过 100 亿美元,后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元(包含到 2030 年的扩展选项)。第一个产品 2 月 12 日就上线了,叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单,可以从几个方面做具体判断。
吞吐方面,Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上,标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒,速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒,是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比,同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距,跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间,还有几百倍的 gap,被软件栈、工作负载、batch 处理这些系统级因素吃掉了。
延迟方面,1000 tokens/秒对应每个 token 1 毫秒生成间隔,这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写,每次客户端服务端往返开销减少 80%,per-token 开销减少 30%,time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的,跟 Cerebras 1 毫秒每 token 的硬件能力对不上,软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层,硬件能力升级倒逼软件栈重构。
成本方面,Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放,API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价,意味着单位推理成本仍然显著高于普通 GPU 推理服务,需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU,OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事,可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考,Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens,GPT-4o 的 API 售价是 $10/M 输出 tokens,但两者模型规模和能力差距很大,不能直接对比。
但 Cerebras 的这套东西有几个关键的约束条件,框定了它现在能做什么、做不了什么。
第一是模型大小限制。Codex-Spark 是蒸馏后的小模型,被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB,frontier model 的参数量远超这个容量,必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力,Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证,OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型,说明前者目前在工程上更可行。
第二是容量限制。Codex-Spark 目前是 research preview,OpenAI 明确说明"由于运行在专用低延迟硬件上,使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3,对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因,硬件交付的物理速度限制了营收节奏。
总结来说,OpenAI 这笔交易对 Cerebras 是阶段性胜利,但远没到终局。技术验证层面,Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度,这一点产业内已经形成共识。但商业兑现层面,Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制,OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型,说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度,每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程,年产几千台 CS-3 是相当具体的工程瓶颈。
对国产推理芯片的同行来说,这件事还有几个很具体的工程信号。
端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快,软件栈跟不上的话推理体验仍然受限,专用推理芯片的价值要靠端到端的延迟优化才能完全释放。
蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型,说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态,单纯的"通用推理芯片"在竞争中会比较吃亏。
1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化,这个速度天花板对国产推理芯片是一个相当严峻的目标。
Cerebras 当前展示的能力是真实的,但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键,一是看它在 2027-2028 年能不能把 750MW 真的部署完,把 RPO 真的转成营收;二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号,但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖,客户质量在提升,但集中度的风险结构没有改变,只有客户组合真正分散了,估值里的风险溢价才能消化。
顯示更多
想把整本电子书翻译成中文?
以前用在线工具一段段复制粘贴,又慢又容易把排版搞乱,简直折磨人!
现在终于有神器了!
我发现一个开源工具 TranslateBookWithLLM,专为翻译整本书、整本文档设计——直接把文件扔进去就能翻!
核心亮点:
支持 EPUB 电子书、SRT 字幕、纯文本等多种格式
保留原有排版和结构,翻译后基本不乱
智能分块处理,长文上下文更连贯、翻译质量更高
支持本地 Ollama 模型(完全免费)或 Gemini API
Docker 一键部署,Web界面 + 命令行两种方式
不管你是翻译小说、教材、技术文档,还是想把外文书快速本地化,这工具都能大幅省时省力!
GitHub:
强烈建议书虫、翻译党、内容创作者赶紧收藏备用!
顯示更多
现在红果短剧等各类短视频平台有多挣钱我就不说了,今天给大家介绍一款可以一站做短剧的Git仓库。
一个不会画画不会动画的人,靠一个开源工具做出了460万粉的AI动画频道,104条视频,最高一条5300万播放。这个工具就是Toonflow。
Toonflow是开源的AI短剧创作工作台,把小说或剧本直接变成动画短剧。集成了AI编剧、智能分镜、角色生成、视频合成,全流程AI化。支持7种语言界面,从写故事到出片,一个工具全搞定。
安装教程:
1. 去GitHub Releases页面下载安装包,Windows/Mac/Linux都有
2. macOS用户装完后去设置→隐私与安全性里放行,否则可能打不开
3. 启动后浏览器打开,首次登录账号admin密码admin123
4. 准备好LLM接口地址和视频生成服务接口,支持Sora、豆包视频等
5. Docker部署:git clone后yarn docker:local一键构建启动,访问localhost:10588/web/index.html
常见问题:
Mac打不开→隐私与安全性里点"仍要打开"
Docker部署后找不到页面→确认端口映射正确,访问路径是/web/index.html
需要自备AI服务接口,Toonflow本身不提供API key
想做AI短剧的可以收藏,一个工具从剧本到成片全搞定
顯示更多