搜索 REASON 相关的推文

UCAT@UCAT_BRC20

2023.12.30 10:32

"There is no reason that can knock down UCAT." 没有任何事物能将 #UCAT# 击倒。 $ucat #ucat招财猫社区# #BTC   📷📷📷# $UCAT

0

5

19

5

转发到社区

沫沫的沫@moi3i4

2026.03.20 07:53

你已经看太久了不是内容的问题是你根本没打算停下来 You stayed for a reason #第一视角# #羞耻感# #反差风#

0

16

1.8K

91

转发到社区

lidang 立党（劝人卖房/学CS/买SP500/纳100/OpenAI/Anthrop第一人）@lidangzzz

2026.05.13 03:27

半年来，我一直反复介绍的四个原则：原则1，AI时代的第一性原理：LLM一定会越来越聪明，benchmark越来越高，context window越来越大，reasoning越来越长，价格越来越便宜，inference速度越来越快，这是scaling law今天依然持续的具体方向，不用你质疑，这是你唯一的信仰和行业最大共识。原则2，管理学设计红利：从我提出“自动编程机”、行业提出vibe coding、SWE-Agent以来，从cursor到manus到metaGPT到claude code，人们逐渐把LLM Agent抽象成人，把软件管理、工程管理、管理学等等所有方法论直接套在multi agent workflow上面，严格按照人类管理学的方式去拆分、review、执行、反馈、循环，这一波很快红利也吃完了，因为 a. LLM Agent毕竟不是人，存在着memory有限、执行力有限、function calling工具有限等等局限；b. 人类用于管理学的各种方法，直接套在LLM Agent上有利有弊，红利迅速挖掘完，剩下的弊端大量存在，比如过度交流、七手八脚、随时停工等等。原则3，LLM Agent的职位和定位：绝大多数人，把claude code当做一个工具，最终的产品是用工具来完成的，最终的代码也是人与SWE Agent一步一步interactively迭代产生、迭代review、迭代部署的，而我反复告诉过所有人，也是我又一条首次提出的原创观点，multi agent未来越来越会变成本身的一个runtime，这个runtime就运行在production里面，产品和面向的对象消费的，不只是软件或者SaaS本身，而是这个runtime实时产生的内容，所以claude code/opencode/codex/openclaw这些agent，本身将会越来越多地被嵌入到产品本身，在产品关键逻辑和决策中发挥作用，而绝对不仅仅停留在开发层面，把产品仅仅局限在SWE Agent单向产出和部署的代码和服务上。原则4，也是我一直强调的，就是当人们试用了SWE Agent这种强大工具之后，人们还有哪些low hanging fruits可以寻找？SWE Agent目前最适合解决哪类问题？我反复讲过的一点是，对于一个设计复杂、环境复杂、场景复杂、用户复杂、体量复杂、范式复杂、一切开放、一切无解的超级复杂系统，这并不是SWE Agent最擅长的领域，相反这些场景需要人去和环境、客户、场景、性能一点点迭代才能打磨好的产品，比如微信的100种功能，Facebook的一大堆功能模块和十几年来迭代出来的极其复杂的infra，支付宝后面成千上万的基金和风控，这些都不是AI Agent能一次性解决的问题，相反这些场景和问题不仅高度开放，更高度依赖人的观察、人的设计、人的反馈、人的定义。 AI Agent最适合的场景，甚至是我原创提出goal driven（ a. 定义简单、干净、封闭（一道数学系、一个确定性最小系统、一个编译器、一种算法、一个lean证明、一个电路或者信号模拟、蛋白质模拟和预测、CAD设计与仿真、游戏关卡测试、行为经济学仿真，都是well-defined problems，都有非常明确且封闭的边界） b. 解决问题的搜索空间巨大（可能有100~10万种天马行空的解决方案，并且绝大多数都是错的） c. 容易验证，容易verify，验证的成本是设计成本的千分之一（比如编译器，设计可能需要几万行甚至几十万行，验证只需要2000个test case全面覆盖，或者一道数学题，解决需要100步，验证答案只需要带入或者lean编译这一步）当然，写一段简单的代码，定义一个封闭、完整、定义完全的编程问题，符合上面这些定义，但是设计一套巨大、复杂、开放、与现实世界深度绑定、高度耦合的系统，让这个系统复杂迭代、添加功能、沟通、review、工程管理、产品管理，这些问题都远远超出这个范畴，很明显是不符合这个要求的。人们未来探索这些multi agent产品和场景的最关键出路，在于继续挖掘这一类问题，而不是盲目把agent比作一个人，乱套各种管理学方法。原则5，这一点我先保密，之后我再讲。

显示更多

0

20

287

62

转发到社区

marlin（蓝v互关）@zhangyanlongco1

2026.05.18 14:48

很多人问我： $CBRS（Cerebras）合理市值到底是多少？我自己的判断是：短期看情绪，中期看推理，长期看生态。短期（1年）： 500-800 亿美元市场现在交易的是： “下一个 AI 核心资产”。只要 AI 牛市继续， CBRS 会持续被当成： NVDA 之外最有想象力的 AI infra 标的。 — 中期（2-3年）： 1000-1500 亿美元关键看：它能不能在 inference（推理）市场真正站稳。因为 AI 后半场最大的瓶颈，可能不是 FLOPS。而是： - KV Cache - 显存 - 带宽 - token latency - scale-out 通信如果长 context / Agent / reasoning 爆发， Cerebras 的 wafer-scale 架构会越来越吃香。 — 长期（5年+）： 2000 亿美元以上（极乐观）前提是：它不只是“一个芯片公司”，而是形成自己的 AI 计算生态。因为历史证明：技术强不一定赢。真正值钱的是： CUDA 这种生态垄断。所以 CBRS 真正的终局，不是对标 AMD。而是：有没有机会成为 AI 时代新的计算平台。这才是市场真正赌的东西。 #AI# #CBRS# #NVDA# #Semiconductor# #Cerebras#

显示更多

0

转发到社区

Ren@FakeMaidenMaker

2026.05.14 03:37

🔥 想做 AI Agent 最烦的不是调模型，而是 RAG、记忆、评估、部署、数据库这些东西全都散在不同教程里，拼起来非常累。最近发现一个神器：Oracle 官方整理的 oracle-ai-developer-hub。 GitHub： 1️⃣ 完整 AI 应用示例提供 Agentic RAG、金融 AI Agent、自然语言查询电商数据库等真实落地案例。 2️⃣ Notebook 实战演示手把手演示 RAG、Hybrid Search、Agent Reasoning、Agent Memory 等核心做法。 3️⃣ 企业级混合数据处理把向量、关键词、图、JSON、关系型数据放到同一个数据库场景里讲，告别玩具版 RAG。 4️⃣ 从 RAG 到多 Agent Workshop提供完整 Workshop，按步骤动手跑一遍，帮你系统性从 RAG 进阶到多 Agent。 5️⃣ 多框架记忆型 Agent 示例包含 OpenAI Agents SDK、Claude Agent SDK、LangGraph 等不同框架的记忆型 Agent 实现。适合特别想把 AI Agent 做得更像生产系统，而不是只停留在聊天 demo 的人收藏使用。

显示更多

0

1

13

3

转发到社区

qinbafrank@qinbafrank

2026.05.11 01:04

Cerebras的IPO火爆，官方考虑大幅上调IPO定价区间。看路透社报道，Cerebras正考虑将IPO定价区间从此前的每股115至125美元上调至150至160美元，涨幅高达约28%。与此同时，公司还计划将发行股数从2800万股增至3000万股。若最终以每股160美元定价，Cerebras此次IPO募资规模将达约48亿美元。个人看Cerwbras的核心优势在于：WSE-3推理领域已建立一定优势，tokens/second 可达GPU集群的15-20倍（低延迟场景下尤其突出）。Agentic workflow、reasoning models、长上下文推理正是其优势凸显的领域。也拿到了大客户订单，OpenAI既是其股东也是签署了长期供货协议。而AWS已将CS-3集成到Bedrock，提供混合Trainium+ Cerebras推理方案。相当于技术和产品已经得到了验证、商业化正在落地。这个时机也很好，现在推理正在快速拓展、市场也希望能找到新的潜在英伟达挑战者、也会给更高的定价和预期。个人看未来的空间看WSE-4如果能成功落地，成本/性能比将进一步拉大差距，让Cerebras从“高端替代”变成“主流基础设施”。未来如果WSE-4成功=从“推理利基冠军”跃升为“AI基础设施第二梯队核心玩家”，市场空间进一步打开。看到两篇关于Cerebras的推文，值得细看： @LinQingV 的这篇 @roger9949 的这篇

显示更多

0

29

117

21

转发到社区

QD-Daralis@mirandaruthp

2026.05.03 07:19

绿帽骚起来.....与淫妻不分伯仲，又是夫妻一起嗦鸡的一天🔥😈 忘记说了，为什么要接吻呢？当然是嘴里含着野爹的精液需要一起鉴赏了。 Tell me… who sucked it better? This horny cuckold couple turned the heat way up Forget to mention the reason of French kiss, surely because they want to taste Master's sperm together. 完整视频Full video 11min 订阅Vip电报

显示更多

0

18

2.2K

834

转发到社区

Barret李靖@Barret_China

2026.05.02 10:09

从实际 vibe coding 的效果来看，并非每个任务选择最强模型就是最佳选择，也不是无脑新开子 Agent 就能保持最佳上下文和执行效率。最贵模型的推理思考能力很强，但处理普通任务，例如读写文件、代码搜索、格式化、简单查询时，效率经常很低。背后的原因也很简单，强模型的 thinking 和 reasoning tokens 开销很大，而这些任务并不需要深度推理，过度思考只会增加延迟和 token 消耗。例如，用 Opus 做一次 Glob 搜索和用 Haiku 做，结果基本一样，但成本会差出两个数量级。要把任务做好，关键不在于模型是不是最强，而是看任务能否正确匹配模型的能力密度。Claude Code 在创建 Sub-Agent 时，就围绕这方面做了大量设计： 1）当需要保留当前对话上下文继续工作时，例如并行探索不同方案、在后台执行独立子任务，它会 fork 一个 Agent，继承当前上下文，让任务在同一语境中延续； 2）当任务目标明确且不依赖父会话上下文，例如代码搜索、方案规划、结果验证，它会直接使用内置 Agent，包括 Explore、Plan、verification、general-purpose 等，调度的时候，会给 Agent 分配一个清晰的任务目标； 3）设计了 Agent Team 模式，支持让多个 Sub-Agent 协同工作，分工不同的子任务，互相之间通过消息传递和共享上下文来配合完成更复杂的工作。Agent Team 跟普通 subagent 的不同之处是，成员 Agent 之间允许通讯。在 Sub-Agent 的模型选择上，Claude Code 是动态设定的，例如 Explore Agent 采用的就是 Haiku 模型，而 Plan 和 verification 默认会继承父模型。 Haiku 模型延迟最低、单 token 成本也最低，在文件搜索、代码定位、文档分析等等只读场景下，准确率已经足够了，整体性价比也是最优的。有了模型选择的基础，再往下就是执行方式的优化。要同时兼顾成本和效率，核心思路是并行执行，将任务拆成多个上下文隔离的子任务，再分派多个 Sub-Agent 并发处理。也分享几个在 Claude Code 中的小技巧，用起来可以让成本、效率和效果达到一个更好的平衡： 1）通过环境变量 CLAUDE_CODE_SUBAGENT_MODEL 可以统一指定子 Agent 的默认模型，主会话用强模型做调度和决策，子 Agent 用轻量模型做执行，配置简单，几乎零成本接入。 2）通过 Fork 模式复用父会话的 Prompt Cache，让并行子任务共享上下文前缀的 KV 缓存，10 个并行 fork 的成本接近 1 + 9 × delta，在大规模并行场景中非常省钱。直接跟主对话说“从当前上下文 Fork 子进程处理”即可。 3）通过 .claude/agents/ 目录下的声明式 Markdown 文件定义专用 Agent，可以精细控制模型选择、工具权限、最大轮次、执行模式、隔离方式、记忆范围、MCP 服务、Hooks 等，适合那些会反复出现的固定角色，例如 code reviewer、security auditor 等等。项目长期使用的专用 Agent 可以考虑用这种方式来定义，后续维护和迭代也更方便。好模型的 token 成本会越来越高，获取难度也是越来越大，短期内一定是供不应求的，因此模型的推理能力需要被转换为一种精细化分配的资源。中低难度的任务把国内模型用起来就好了，反而效率更高，还省钱。在 vibe coding 的时候，学会让不同能力的模型组合完成任务，将会是一项必备技能。😄

显示更多

0

9

85

6

转发到社区

唐华斑竹🦅@uniswap12

2026.05.18 14:08

每个人都应该了解的AI 术语名词，你都认识吗？搞懂这些名词并了解其实现方式和原理。你基本就入门了。 AGI（类人AI）：类似人类思维的AI。 CoT（链式思维）：AI一步步思考。 AI Agents（AI代理）：自动化决策的程序。 AI Wrapper：简化与AI模型的互动。 AI Alignment（AI对齐）：确保AI遵循人类价值观。 Fine-tuning（微调）：使用特定训练数据来改进AI。 Hallucination（幻觉）：AI编造的信息。 AI Model（AI模型）：用于任务的训练AI。 Chatbot（聊天机器人）：模拟人类对话的AI。 Compute（计算）：AI模型的处理能力。 Computer Vision（计算机视觉）：AI理解图像和视频的能力。 Context（上下文）：AI为更好响应保留的信息。 Deep Learning（深度学习）：通过多层神经网络学习的AI。 Embedding（嵌入）：AI的词汇数字化表示。 Explainability（可解释性）：理解AI决策背后的逻辑。 Foundation Model（基础模型）：可适应任务的大型AI模型。 Generative AI（生成式AI）：创建文本、图像等内容。 GPU（图形处理单元）：用于快速AI处理的硬件。 Ground Truth（真实数据）：AI学习的验证数据。 Inference（推理）：AI对新数据做出的预测。 LLM（大型语言模型）：用大量文本数据训练的AI。 Machine Learning（机器学习）：AI通过数据经验改进。 MCP（模型上下文协议）：AI内部数据访问的标准。 NLP（自然语言处理）：AI理解人类语言。 Neural Network（神经网络）：受大脑启发的AI模型。 Parameters（参数）：AI学习的内部变量。 Prompt Engineering（提示工程）：创建输入以指导AI输出。 Reasoning Model（推理模型）：有逻辑推理能力的AI。 Reinforcement Learning（强化学习）：AI通过奖励与惩罚学习。 RAG（检索增强生成）：结合搜索与生成的AI。 Supervised Learning（监督学习）：在标记数据上训练的AI。 TPU（张量处理单元）：AI处理专用芯片。 Tokenization（分词）：将文本分割成词片。 Training（训练）：通过调整参数教AI。 Transformer（变换器）：用于语言理解的AI架构。 Unsupervised Learning（无监督学习）：AI在无标签数据上发现模式。 Vibe Coding（情绪编码）：通过语言捕捉情绪并预测输出。 Weights（权重）：影响AI学习的值。 #AI# #AIAgent#

显示更多

0

1

0

转发到社区

Box (mainnet arc)@BoxMrChen

2026.05.16 04:56

给梁圣尽孝渠道来了 DS招聘DeepSeek Harness产品经理我说实话这个要求是属于真的很简单了要求如下： 2年以上产品经理从业经验，产品逻辑清晰。特别优秀候选人可放宽年限，学历本科及以上。能够使用 vibe coding 写代码，不一定需要技术背景。能够设计系统性的收集数据的方法（包括问卷、访谈、A/B测试、灰度测试等），并使用统计学的工具严谨科学的分析数据。对此有系统性的思考和实践。是 Agent 产品的高强度用户，熟悉 Agent 产品的各种形态，对 Agent 有极大的热情，对模型行为有品味有判断力，对开发者体验及用户体验有强感知。深度使用过 Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes 等类似产品，并将相关产品的使用融入到自己的工作和生活中。理解 LLM 以及 Agent 基本机制及其技术原理，包括 LLM API、KV Cache、Agent Loop、Tool Use、Reasoning、Planning、Skills、MCP、Memory、Subagent、Multi-Agent 等相关知识。对 Prompt Engineering、Context Engineering、Harness Engineering 等课题有第一手实践。具备UI/UX设计素养。能够在 AI 辅助下完成产品原型图设计、UI设计等相关的产品设计工作。优秀的中文沟通能力。能用英文与开源社区、用户社群书面沟通。

显示更多

0

13

136

6

转发到社区