搜索大模型相关的推文、图片

2026.04.24 01:43

大模型厂商交替领先，真是各领风骚三五月：去年四季度是gemini、今年一季度是cluade、现在感觉轮到GPT5.5了。核心还是大家都在积极进取迭代，只很多时候领先源于对手的松懈。去年在算力投入上非常节制的Authropic最近应该是感受到了算力短缺的痛。梳理下时间线 1、去年四季度： Google Gemini 3 系列（尤其是25年11月左右的Gemini 3 Pro/Deep Think）强势登顶，很多基准（如Humanity’s Last Exam、推理、多模态）领先，引发OpenAI“Code Red”。它在多模态、长上下文和搜索集成上特别亮眼，一度被视为转折点。 2、今年一季度：最耀眼的自然是Anthropic Claude 4.6（Opus/Sonnet，2月发布）强势反超，尤其在编码（SWE-Bench）、长上下文推理、agentic任务和实际生产力上领先。 3、当下2026年4月： OpenAI GPT-5.5正处于发布窗口，刚在ChatGPT和Codex上即将全面上线。它强调更好的上下文理解、编码、computer use和agent能力，试图追赶和超越。大模型领域现在并没有绝对的“唯一王者”，而是各有专长： 1）Claude：主攻编码、长任务、可靠推理往往领先，Agent上迭代非常多。 2）Gemini：多模态、速度、性价比、超长上下文强（3.1 Pro Preview仍很能打）。 3）GPT：通用agent、工具调用、实时应用和生态集成突出，新版在上下文和特定专业任务上提升明显。算力囤积最积极 4）grok：有X这个实时内容平台提供源源不断的训练数据，但近期受制于团队动荡。看跟cursor的合作、以及囤积的大量算力，后面会不会进一步跟上。当然还有meta最新的Muse Spark，AI团队的最新之作。更不用说国内豆包、千问、混元、kimi也是各有特色，杀疯了。这就是当下大模型领域的现状：快速迭代、轮流坐庄。暂时还没有一家能长期领先甚至垄断。当然竞争对用户是好事——模型越来越强、价格/速度也优化。 2月中在《资本开支的战争》推文里有聊过：”往下游看，越往用户端竞争越激烈，当然也是未来AI决胜的关键所在。可以说大模型、在面向B端或者C端的Agent或者应用才是AI的王冠，但这一层面短期其实很难看出谁会成为最后真正的赢家，再很多时候都是交替领先”。现在看确实如此 GPT-5.5出来后估计又要新一轮刷榜了，下一个出来交替领先的会是谁？

显示更多

0

8

64

13

转发到社区

欧阳拽白@OuYangZhuaiBai

2026.05.07 05:54

国产大模型，可以配置了：腾讯、阿里、小米

0

29

19

2

转发到社区

DeFi Teddy@DeFiTeddy2020

2026.05.06 03:49

《AI大模型公司和加密交易所人员流动：冰火两重天》 Coinbase在大裁员 Anthropic却在疯狂招人不少科技公司的CTO 去Anthropic当普通工程师 Anthropic基本薪水范围（不包括奖金/期权）招聘HR: 20万美金高级工程师：30-50万美金研究lead：85万美金

显示更多

Brian Armstrong@brian_armstrong

2026.05.05 10:55

This is an email I sent earlier today to all employees at Coinbase: Team, Today I’ve made the difficult decision to reduce the size of Coinbase by ~14%. I want to walk you through why we're doing this now, what it means for those affected, and how this positions us for the future. Why now Two forces are converging at the same time. We need to be front footed to respond to both. First, the market. Coinbase is well-capitalized, has diversified revenue streams, and is well-positioned to weather any storm. Crypto is also on the verge of the next wave of adoption, with stablecoins, prediction markets, tokenization, and more taking off. However, our business is still volatile from quarter to quarter. While we've managed through that cyclicality many times before and come out stronger on the other side, we’re currently in a down market and need to adjust our cost structure now so that we emerge from this period leaner, faster, and more efficient for our next phase of growth. Second, AI is changing how we work. Over the past year, I’ve watched engineers use AI to ship in days what used to take a team weeks. Non-technical teams are now shipping production code and many of our workflows are being automated. The pace of what's possible with a small, focused team has changed dramatically, and it's accelerating every day. All of this has led us to an inflection point, not just for Coinbase, but for every company. The biggest risk now is not taking action. We are adjusting early and deliberately to rebuild Coinbase to be lean, fast, and AI-native. We need to return to the speed and focus of our startup founding, with AI at our core. What this means To get there, we are not just reducing headcount and cutting costs, we’re fundamentally changing how we operate: rebuilding Coinbase as an intelligence, with humans around the edge aligning it. What does this mean in practice? - Fewer layers, faster decisions: We are flattening our org structure to 5 layers max below CEO/COO. Layers slow things down and create coordination tax. The future is small, high context teams that can move quickly. Leaders will own much more, with as many as 15+ direct reports. Fewer layers also means a leaner cost structure that is built to perform through all market cycles. - No pure managers: Every leader at Coinbase must also be a strong and active individual contributor. Managers should be like player-coaches, getting their hands dirty alongside their teams. - AI-native pods: We’ll be concentrating around AI-native talent who can manage fleets of agents to drive outsized impact. We’ll also be experimenting with reduced pod sizes, including “one person teams” with engineers, designers, and product managers all in one role. In short: AI is bringing a profound shift in how companies operate, and we’re reshaping Coinbase to lead in this new era. This is a new way of working, and we need to leverage AI across every facet of our jobs. To those who are affected I know there are real people behind these decisions — talented colleagues who have poured themselves into this company and our mission. To those of you who will be leaving: thank you. You’ve helped build Coinbase into what it is today, and I am sincerely grateful for everything you've done. All impacted team members will receive an email to their personal account in the next hour with more information, and an invitation to meet with an HRBP and a senior leader in your organization. Coinbase system access has been removed today. I know this feels sudden and harsh, but it is the only responsible choice given our duty to protect customer information. To those affected, we will be providing a comprehensive package to support you through this transition. US employees will receive a minimum of 16 weeks base pay (plus 2 weeks per year worked), their next equity vest, and 6 months of COBRA. Employees on a work visa will get extra transition support. Those outside of the US will receive similar support, based on local factors and subject to any consultation requirements. Coinbase prides itself on talent density. Our employees are among the most talented people in the world, and I have no doubt that your skills and experience will be highly sought after as you pursue your next chapters. How we move forward To the team that is staying, I know this is a difficult day. We’re saying goodbye to colleagues and friends you've been in the trenches with. But here’s what I want you to know as we move forward together: Over the past 13 years, we have weathered four crypto winters, gone public, and built the most trusted platform in our industry. We’ve made it this far by making hard decisions and by always staying focused on our mission. This time will be no different – nothing has changed about the long term outlook of our company or industry. And most importantly, our mission has never been more important for the world. Increasing economic freedom requires a new financial system, and we’re building it. The Coinbase that emerges from this will be more capable than ever to achieve our mission. Brian

显示更多

0

6

9

0

转发到社区

qinbafrank@qinbafrank

2026.05.05 03:25

为什么大模型厂商都与投资机构成立合资公司？这意味着大模型在B端的竞争进入了地面阵地战模式。这两天大模型厂商最大的动作无疑是Authropic和OpenAI在同一天宣布联合PE投资机构、投行等成立AI-native 企业服务的合资公司（JV），堪称“AI大模型厂商在企业落地赛道上的正面交锋”。 Anthropic与Blackstone、Hellman & Friedman 以及 Goldman Sachs合作；而OpenAI则是拉上了TPG、Brookfield Asset Management、Bain Capital还有软银几家机构。成立的合资公司都是企业服务性质的，将各自的大模型推广给广大中型企业，帮助它们将AI部署到核心业务运营中，两家大模型厂商会派驻工程师、顾问，提供从定制、集成、合规到持续优化的全套服务。 1、为什么要找这些投资机构合作？ 1）这些投资机构手里握着成千上万家 portfolio company（覆盖医疗、制造、金融、零售等）。通过合作，大模型厂商能快速获取客户群，同时为这些 PE 公司带来生产力提升和成本节约（提升投资回报 IRR）。这是一种高效的分销策略，避免一家家推销。 2）AI 采用瓶颈在“部署”而非“模型”本身，模型再强，企业也缺“最后一公里”——集成、流程重构、合规、培训、持续迭代。传统咨询公司太贵太慢，大模型厂商又没有足够咨询人才。跟投资机构成立合资公司，招募专业的部署、实施、培训人才，加快企业采用AI的进程和速度，同时加快自己在B端的拓展，抢夺更多的B端客户。这就是Authropic和OpenAI纷纷与投资机构成立合资公司的真是意图。 2、更深层次看，这就意味着大模型厂商在 B端（企业/政府侧）的扩张确实已从“空军轰炸”（品牌宣传、hype、广撒网影响力）转向“阵地战/地面作战”（深挖壕沟、嵌入核心流程、逐个战场争夺具体合同）。正好大模型在B端营销推广从“空军”到“阵地战”的转变逻辑 1）早期空军策略（2023-2025）：主要靠 ChatGPT/Claude 等爆款产品制造品牌影响力，通过媒体、开发者社区、免费/低价试用快速占领心智。目标是“让大家都知道 AI 很强”，然后等企业自然来买 API/订阅。收入主要来自品牌溢价和规模效应，竞争焦点在模型性能、参数、安全叙事上。 2）现在阵地战（2026年之后）：模型能力已趋同，胜负手转向“最后一公里”：谁能真正把 AI 嵌入企业核心业务流程（ERP、供应链、客服、决策系统）、政府机密网络、合规体系，并持续提供实施服务。这需要重资产投入：派驻工程师、定制集成、行业 playbooks、长期驻场支持、风险共担。不是卖“模型”，而是卖“AI 驱动的业务转型解决方案”。 OpenAI 和 Anthropic 的 JV（DeployCo / 新企业服务公司）就是典型地面作战：借 PE 机构的 portfolio 公司作为“根据地”，直接把工程师塞进企业内部，帮中型企业做深度部署。这不是广撒网，而是建立“俘获式分销渠道 + 护城河”——一旦嵌入业务，切换成本极高今年初各家大模型争夺美国国防部订单就是这一转变的典型体现。各家纷纷游说五角大楼，Anthropic因为安全护栏刚被国防部排除在外，OpenAI就快速快速补位。而后续国防部跟多家大模型厂商一起签约，这种多家并存（避免单一依赖）的情况，更是体现“阵地战”的残酷：不是赢者通吃，而是寸土必争更深层次看，大模型厂商在B端的竞争，技术领先程度已经不是唯一的权重，部署能力、渠道网络、政府关系、合规灵活性将会成为新护城河。 PE + 政府双渠道，本质就是就是在抢“地面控制权”

显示更多

0

11

48

13

转发到社区

0xTodd ( thinking )@0xTodd

2026.04.29 01:32

其实大模型收“翻译税”的问题，主要还是在于： -训练集对非英文语言的采集比例； -分词器对非英文语言的优化程度。比方说，同样一段话，A 社 Claude 英文消耗的 token 是 1，中文的话就是 1.7。说白了，就是他们的分词器优先能把英文识别成高频单词，而中文只能拆得更细、更碎一点（浪费 Token）。比方说“推特”这个词，低效的分词器就会把它拆成“推”加“特”；但如果你是针对中文优化过的分词器，它就会直接把“推特”作为一个词整体。所以说，反过来，如果你用 DeepSeek 或者是 Kimi，他们对于中文语料的采集更多，所以分词器能更高效地把中文拆成单个 token，这样他们就更省钱。因此，这些国产大模型在处理中文时，消耗的 token 甚至比英文还要更少，还能反向收“翻译补贴”。

显示更多

Aran Komatsuzaki@arankomatsuzaki

2026.04.28 13:54

The non-English tax is real. Sutton's Bitter Lesson, translated across languages and normalized to OpenAI English token count: Hindi: OpenAI 1.37×, Anthropic 3.24× Arabic: OpenAI 1.31×, Anthropic 2.86× Chinese: OpenAI 1.15×, Anthropic 1.71× Claude’s tokenizer charges a much higher linguistic tax.

显示更多

0

4

18

3

转发到社区

qinbafrank@qinbafrank

2026.04.25 03:47

改变大模型竞争格局的一次投资，昨晚Google宣布对Authropic最高400亿美元新投资承诺：1）立即投入 100 亿美元现金，与26年2月融资轮估值一致，不含后续新募资金； 2）额外 300 亿美元视 Anthropic 达到特定业绩里程碑后投入； 3）同时支持 Anthropic 大幅扩充算力（Google Cloud 将提供新增 5 吉瓦容量，未来 5 年内可进一步扩展）这次投资完成，谷歌应该就是Authropic最大的份额的外部股东了、当然严格控制在 15% 以内，以免触及反垄断法。对Google来说意义重大： 1）对冲 OpenAI 风险，Google 通过少数股权绑定 Anthropic，同时自身全力推Gemini，这是一种典型“投资对手”策略——既防止 OpenAI独大，又通过 Vertex AI集成 Claude 丰富产品生态。 2）通过巨额云合同将 Anthropic 的增长转化为 Google Cloud 收入，做大自身的TPU生态、用投资换取算力绑定；这个非常关键， 3）在 AI 军备竞赛中保持技术前沿地位；4）潜在 IPO 后账面巨额浮盈，Anthropic 潜在估值已经逼近OpenAI了。对Authropic来说意义更重大：进一步获得海量算力支持（TPU 是其训练核心），加速 Claude 迭代和企业客户扩张。资金储备更加充足紧随 Amazon 上周承诺最高 250 亿美元投资之后，Anthropic 在短短一周内锁定超 650 亿美元新资金承诺。把Anthropic过去半年的金主清单列出来，会发现一个荒谬的现实： 1）亚马逊：50亿美元现金 + 上限250亿美元 + 5GW Trainium算力 + 1000亿美元AWS采购合同； 2）谷歌：100亿美元现金 + 上限400亿美元 + 5GW TPU算力； 3）英伟达：上限100亿美元 + 1GW GPU供给； 4）微软：上限50亿美元 + Anthropic向Azure采购300亿美元算力。四家硅谷顶级玩家，全部在Anthropic的股东名册上。也是之前算力短缺的痛苦，让Authropic疯狂寻找新算力供给：思路很清晰，绑定算力供给的最大玩家，但并不是跟一家深度绑死确保自身的灵活度，分散供给。闲杂压力给到了OpenAI上以前硅谷大模型御三家，OpenAI、Authropic、Gemini，现在后两者既竞争又合作。Meta、Grok还在奋力追赶。而算力格局、TPU生态正在快速崛起，未来真有可能GPU、TPU两强相争（虽然现在还差距很大） Google对Anthropic 的投资从 2023 年的 3 亿美元起步，已演变为累计超百亿美元（含最新 400 亿承诺）的战略布局，核心是算力绑定 + 少数股权 + 云收入的三重收获。最新 400 亿美元承诺标志着双方联盟进入新阶段，也凸显 AI 基础设施竞赛的激烈程度。竞争进一步白热化

显示更多

qinbafrank@qinbafrank

2026.04.24 01:43

大模型厂商交替领先，真是各领风骚三五月：去年四季度是gemini、今年一季度是cluade、现在感觉轮到GPT5.5了。核心还是大家都在积极进取迭代，只很多时候领先源于对手的松懈。去年在算力投入上非常节制的Authropic最近应该是感受到了算力短缺的痛。梳理下时间线 1、去年四季度： Google Gemini 3 系列（尤其是25年11月左右的Gemini 3 Pro/Deep Think）强势登顶，很多基准（如Humanity’s Last Exam、推理、多模态）领先，引发OpenAI“Code Red”。它在多模态、长上下文和搜索集成上特别亮眼，一度被视为转折点。 2、今年一季度：最耀眼的自然是Anthropic Claude 4.6（Opus/Sonnet，2月发布）强势反超，尤其在编码（SWE-Bench）、长上下文推理、agentic任务和实际生产力上领先。 3、当下2026年4月： OpenAI GPT-5.5正处于发布窗口，刚在ChatGPT和Codex上即将全面上线。它强调更好的上下文理解、编码、computer use和agent能力，试图追赶和超越。大模型领域现在并没有绝对的“唯一王者”，而是各有专长： 1）Claude：主攻编码、长任务、可靠推理往往领先，Agent上迭代非常多。 2）Gemini：多模态、速度、性价比、超长上下文强（3.1 Pro Preview仍很能打）。 3）GPT：通用agent、工具调用、实时应用和生态集成突出，新版在上下文和特定专业任务上提升明显。算力囤积最积极 4）grok：有X这个实时内容平台提供源源不断的训练数据，但近期受制于团队动荡。看跟cursor的合作、以及囤积的大量算力，后面会不会进一步跟上。当然还有meta最新的Muse Spark，AI团队的最新之作。更不用说国内豆包、千问、混元、kimi也是各有特色，杀疯了。这就是当下大模型领域的现状：快速迭代、轮流坐庄。暂时还没有一家能长期领先甚至垄断。当然竞争对用户是好事——模型越来越强、价格/速度也优化。 2月中在《资本开支的战争》推文里有聊过：”往下游看，越往用户端竞争越激烈，当然也是未来AI决胜的关键所在。可以说大模型、在面向B端或者C端的Agent或者应用才是AI的王冠，但这一层面短期其实很难看出谁会成为最后真正的赢家，再很多时候都是交替领先”。现在看确实如此 GPT-5.5出来后估计又要新一轮刷榜了，下一个出来交替领先的会是谁？

显示更多

0

12

95

12

转发到社区

Sky G.cph@skyguoCypherium

2026.04.23 14:19

训练大模型，算力和显存带宽哪个更重要、GPU和CPU哪个更重要？

0

2

5

0

转发到社区

Fast is slow@WinForKakei

2026.05.09 16:31

国内这些大模型站在股东的角度几乎都是纯纯的价值毁灭，有至少以下几个原因： 1. 买不到N卡，你训练和推理的效率就低，花更多的钱办更少的事。 2. 大模型没有类似互联网产品的网络效应，一个社交app或者一款游戏，每增加一个用户边际成本增加很少甚至可以忽略不计，但大模型产品每增加一个用户就多一个用户消耗的token。 3. c端用户付费意愿低，收费收不上来，表格是国内一线梯队模型vs Mythos、Opus、GPT的费用，单位是美金/1Mtoken。智谱的老板是明白人，所以ipo后的第一笔资本支出是先买了物业…… 字节已经算好的了，新加坡公司比南山公司腾讯在1上能有些突破。但就算有海外主体应该N卡也不够，所以才会有去Arizona训练seed、去Oracle训练Tiktok的新闻。为什么传言豆包要开始收费？你要知道字节的产品（红果、汽水为代表）主打一个白嫖阿！毛估估字节做豆包和seed应该烧掉小2000亿了，去年净利润-70%。地主家也没余粮了，做商业不是做慈善啊。但是现在资本市场认为没有大模型的互联网公司都要被颠覆、要倒闭，如果你认可在一个价值毁灭的产品里暂时掉队不是一件可怕的事情，那么可以在泥沙俱下里淘淘金。

显示更多