搜尋模型ひとり語り相關推文

李继刚@lijigang

2026.04.17 10:37

模型是国战，不是商战。

0

23

56

3

轉發到社區

rick awsb ($people, $people)@rickawsb

2026.04.09 21:54

模型即应用，算力即模型，刹那即永恒 —- mythos发布观感经过过去几年，从提示词MCP、工作流skill到harness engineering的不断迭代，市场应该已经基本认识到，模型即应用。接下来，随着拥有足够多算力的模型公司迭代速度越来越快，市场会慢慢意识到，算力即模型，随着methos的发布，以及拥有算力优势的头部模型将领先优势不断拉大，让一时的领先变成无法超越的加速度，最终，刹那即永恒

0

7

19

0

轉發到社區

rick awsb ($people, $people)@rickawsb

2026.02.21 19:11

模型即应用算力即模型得算力者得天下所以，我们应该买什么？😆

0

7

11

3

轉發到社區

老金@freeman1266

2026.05.17 15:49

大模型快思考 vs 慢思考：快思考（直接回答）：激活已有模式，直接输出适合简单、熟悉的任务快，但容易犯「想当然」的错误慢思考（Chain of Thought）：把推理过程显式化每一步都是下一步的输入慢，但能处理需要多步推理的复杂问题实际应用：简单任务：不需要慢思考，加了反而可能绕弯数学/逻辑/多步推理：慢思考是必须的复杂 Agent 任务：规划本身就是一种慢思考

0

1

8

0

轉發到社區

百年 AI×出海@yidabuilds

2026.05.17 15:04

国产模型现在比国际同行便宜 15-30 倍 DeepSeek V4-Flash 100 万 token 输入 1 块钱同等质量的 Claude 要几十块接客户的活如果不涉及最顶级的推理用国产模型的成本几乎可以忽略不计了

0

10

0

轉發到社區

高级分析师@techeconomyana

2026.05.15 05:03

大模型用得越多越能体会到，Anthropic的思路是完全正确的。大模型是生产工具利器，一数据中心的天才。AGI永远在路上，只有进行时，没有完成时。凡是Dario作出的决策，我们都坚决维护；凡是Dario指示，我们都始终不渝地遵循。

0

7

88

6

轉發到社區

Winter Research@SovereignIntern

2026.05.14 06:26

顶级模型，好比清北哈佛，智商最高，从事科研工作利用率更高；正常模型，好比本科生，从事白领工作，够用；便宜的低性能模型，好比没考上大学的，做一些蓝领和服务业简单重复的工作刚好。不同模型的智商和成本会对应不同的市场;另外模型的智商、与其对应的市场规模、以及商业成果，未必是很直接的正比关系。

0

3

10

0

轉發到社區

赛博游侠【专注出海项目】@toshi_ga_

2026.05.12 09:21

大模型又幻觉了，说实话这玩意儿就是个高级版“猜词游戏”。你喂它100G数据，它给你编个100%自信的假新闻。圈里人早该醒醒了，别老吹AGI，先解决“不胡说八道”这基本盘。

0

轉發到社區

赛博游侠【专注出海项目】@toshi_ga_

2026.05.12 09:19

大模型又幻觉了，说实话这玩意儿就是个高级版“猜词游戏”。你喂它100G数据，它给你编个100%自信的假新闻。圈里人早该醒醒了，别老吹AGI，先解决“不胡说八道”这基本盘。

0

轉發到社區

qinbafrank@qinbafrank

2026.04.24 01:43

大模型厂商交替领先，真是各领风骚三五月：去年四季度是gemini、今年一季度是cluade、现在感觉轮到GPT5.5了。核心还是大家都在积极进取迭代，只很多时候领先源于对手的松懈。去年在算力投入上非常节制的Authropic最近应该是感受到了算力短缺的痛。梳理下时间线 1、去年四季度： Google Gemini 3 系列（尤其是25年11月左右的Gemini 3 Pro/Deep Think）强势登顶，很多基准（如Humanity’s Last Exam、推理、多模态）领先，引发OpenAI“Code Red”。它在多模态、长上下文和搜索集成上特别亮眼，一度被视为转折点。 2、今年一季度：最耀眼的自然是Anthropic Claude 4.6（Opus/Sonnet，2月发布）强势反超，尤其在编码（SWE-Bench）、长上下文推理、agentic任务和实际生产力上领先。 3、当下2026年4月： OpenAI GPT-5.5正处于发布窗口，刚在ChatGPT和Codex上即将全面上线。它强调更好的上下文理解、编码、computer use和agent能力，试图追赶和超越。大模型领域现在并没有绝对的“唯一王者”，而是各有专长： 1）Claude：主攻编码、长任务、可靠推理往往领先，Agent上迭代非常多。 2）Gemini：多模态、速度、性价比、超长上下文强（3.1 Pro Preview仍很能打）。 3）GPT：通用agent、工具调用、实时应用和生态集成突出，新版在上下文和特定专业任务上提升明显。算力囤积最积极 4）grok：有X这个实时内容平台提供源源不断的训练数据，但近期受制于团队动荡。看跟cursor的合作、以及囤积的大量算力，后面会不会进一步跟上。当然还有meta最新的Muse Spark，AI团队的最新之作。更不用说国内豆包、千问、混元、kimi也是各有特色，杀疯了。这就是当下大模型领域的现状：快速迭代、轮流坐庄。暂时还没有一家能长期领先甚至垄断。当然竞争对用户是好事——模型越来越强、价格/速度也优化。 2月中在《资本开支的战争》推文里有聊过：”往下游看，越往用户端竞争越激烈，当然也是未来AI决胜的关键所在。可以说大模型、在面向B端或者C端的Agent或者应用才是AI的王冠，但这一层面短期其实很难看出谁会成为最后真正的赢家，再很多时候都是交替领先”。现在看确实如此 GPT-5.5出来后估计又要新一轮刷榜了，下一个出来交替领先的会是谁？

0

8

64

13

轉發到社區