模型即应用,算力即模型,刹那即永恒
—- mythos发布观感
经过过去几年,从提示词MCP、工作流skill到harness engineering的不断迭代,市场应该已经基本认识到,
模型即应用。
接下来,随着拥有足够多算力的模型公司迭代速度越来越快,市场会慢慢意识到,
算力即模型,
随着methos的发布,以及拥有算力优势的头部模型将领先优势不断拉大,让一时的领先变成无法超越的加速度,最终,
刹那即永恒
顯示更多
模型即应用
算力即模型
得算力者得天下
所以,
我们应该买什么?😆
大模型 快思考 vs 慢思考:
快思考(直接回答):
激活已有模式,直接输出
适合简单、熟悉的任务
快,但容易犯「想当然」的错误
慢思考(Chain of Thought):
把推理过程显式化
每一步都是下一步的输入
慢,但能处理需要多步推理的复杂问题
实际应用:
简单任务:不需要慢思考,加了反而可能绕弯
数学/逻辑/多步推理:慢思考是必须的
复杂 Agent 任务:规划本身就是一种慢思考
顯示更多
国产模型现在比国际同行便宜 15-30 倍
DeepSeek V4-Flash 100 万 token 输入 1 块钱
同等质量的 Claude 要几十块
接客户的活如果不涉及最顶级的推理
用国产模型的成本几乎可以忽略不计了
顯示更多
大模型用得越多越能体会到,Anthropic的思路是完全正确的。大模型是生产工具利器,一数据中心的天才。AGI永远在路上,只有进行时,没有完成时。
凡是Dario作出的决策,我们都坚决维护;凡是Dario指示,我们都始终不渝地遵循。
顯示更多
顶级模型,好比清北哈佛,智商最高,从事科研工作利用率更高;正常模型,好比本科生,从事白领工作,够用;便宜的低性能模型,好比没考上大学的,做一些蓝领和服务业简单重复的工作刚好。不同模型的智商和成本会对应不同的市场;另外模型的智商、与其对应的市场规模、以及商业成果,未必是很直接的正比关系。
顯示更多
大模型又幻觉了,说实话这玩意儿就是个高级版“猜词游戏”。你喂它100G数据,它给你编个100%自信的假新闻。圈里人早该醒醒了,别老吹AGI,先解决“不胡说八道”这基本盘。
顯示更多
大模型又幻觉了,说实话这玩意儿就是个高级版“猜词游戏”。你喂它100G数据,它给你编个100%自信的假新闻。圈里人早该醒醒了,别老吹AGI,先解决“不胡说八道”这基本盘。
顯示更多
大模型厂商交替领先,真是各领风骚三五月:去年四季度是gemini、今年一季度是cluade、现在感觉轮到GPT5.5了。核心还是大家都在积极进取迭代,只很多时候领先源于对手的松懈。去年在算力投入上非常节制的Authropic最近应该是感受到了算力短缺的痛。
梳理下时间线
1、去年四季度:
Google Gemini 3 系列(尤其是25年11月左右的Gemini 3 Pro/Deep Think)强势登顶,很多基准(如Humanity’s Last Exam、推理、多模态)领先,引发OpenAI“Code Red”。它在多模态、长上下文和搜索集成上特别亮眼,一度被视为转折点。
2、今年一季度:
最耀眼的自然是Anthropic Claude 4.6(Opus/Sonnet,2月发布)强势反超,尤其在编码(SWE-Bench)、长上下文推理、agentic任务和实际生产力上领先。
3、当下2026年4月:
OpenAI GPT-5.5正处于发布窗口,刚
在ChatGPT和Codex上即将全面上线。它强调更好的上下文理解、编码、computer use和agent能力,试图追赶和超越。
大模型领域现在并没有绝对的“唯一王者”,而是各有专长:
1)Claude:主攻编码、长任务、可靠推理往往领先,Agent上迭代非常多。
2)Gemini:多模态、速度、性价比、超长上下文强(3.1 Pro Preview仍很能打)。
3)GPT:通用agent、工具调用、实时应用和生态集成突出,新版在上下文和特定专业任务上提升明显。算力囤积最积极
4)grok:有X这个实时内容平台提供源源不断的训练数据,但近期受制于团队动荡。看跟cursor的合作、以及囤积的大量算力,后面会不会进一步跟上。
当然还有meta最新的Muse Spark,AI团队的最新之作。
更不用说国内豆包、千问、混元、kimi也是各有特色,杀疯了。
这就是当下大模型领域的现状:快速迭代、轮流坐庄。暂时还没有一家能长期领先甚至垄断。当然竞争对用户是好事——模型越来越强、价格/速度也优化。
2月中在《资本开支的战争》推文里有聊过:”往下游看,越往用户端竞争越激烈,当然也是未来AI决胜的关键所在。 可以说大模型、在面向B端或者C端的Agent或者应用才是AI的王冠,但这一层面短期其实很难看出谁会成为最后真正的赢家,再很多时候都是交替领先”。现在看确实如此
GPT-5.5出来后估计又要新一轮刷榜了,下一个出来交替领先的会是谁?
顯示更多