搜索 Cerebras 相关的推文

2026.05.15 01:39

Cerebras上市首日股价飙升逾一倍。这为备受期待的AI企业IPO大年拉开了序幕。市场对Cerebras股票的追捧，折射出投资者对AI领域的狂热。OpenAI和Anthropic正考虑在今年下半年进行IPO。SpaceX计划于6月挂牌上市。

显示更多

0

5

11

1

转发到社区

宇十一@BTCdayu

2026.05.14 00:37

Cerebras IPO最新定价为每股185.00美元，共发行3000万股A类普通股，目前FDV达到564亿美元。

0

2

13

0

转发到社区

StableStock_華語@StableStock_CN

2026.05.13 12:20

Cerebras IPO 之夜｜美股盛宴的臨界點 5 月 14 日,英偉達最強勁敵 Cerebras 掛牌上市 —— 衝擊 2026 年美國最大 IPO 片上記憶體達 GPU 的 880 倍。OpenAI 200 億美元訂單。2030 年營收看至 50 億美元,華爾街高度關注明晚 8 點,跟 @qinbafrank 、@iamai_omni 、@ZixiStablestock 一起聊: 🎯 Cerebras 拆解、AI 晶片格局 🎯 現在是泡沫,還是價值未盡? 🎯 我們站在週期的哪個位置? 📅 5 月 14 日 (周四) 20:00 (UTC+8) 📍 X Space｜是泡沫的尾聲,還是新故事的起點?

显示更多

0

3

9

2

转发到社区

Nico投资有道@tychozzz

2026.05.11 11:14

Cerebras 这家 AI 硬件科技股，周四就要在纳斯达克 IPO 上市了，市场关注度热度非常高。本来想着投研之后发篇推文简单聊聊。但越研究，发现这家公司越有料。在 AI 推理需求爆发的时间节点，Cerebras 的 WSE3 芯片提出了一套另类的解决方案，带宽是英伟达 B200 的 2600 倍，主打 AI 推理，迎合了市场的需求。不过想必 Cerebras 短期炒作以及情绪面会非常严重，我的初步想法是在上市当天，小仓位投机参与一下。这两天我会专门做一期视频，详细讲讲 Cerebras 这家公司，尽量在周四之前发出来。欢迎大家订阅我的新频道 Nico 前沿 Alpha：

显示更多

0

30

48

7

转发到社区

qinbafrank@qinbafrank

2026.05.11 01:04

Cerebras的IPO火爆，官方考虑大幅上调IPO定价区间。看路透社报道，Cerebras正考虑将IPO定价区间从此前的每股115至125美元上调至150至160美元，涨幅高达约28%。与此同时，公司还计划将发行股数从2800万股增至3000万股。若最终以每股160美元定价，Cerebras此次IPO募资规模将达约48亿美元。个人看Cerwbras的核心优势在于：WSE-3推理领域已建立一定优势，tokens/second 可达GPU集群的15-20倍（低延迟场景下尤其突出）。Agentic workflow、reasoning models、长上下文推理正是其优势凸显的领域。也拿到了大客户订单，OpenAI既是其股东也是签署了长期供货协议。而AWS已将CS-3集成到Bedrock，提供混合Trainium+ Cerebras推理方案。相当于技术和产品已经得到了验证、商业化正在落地。这个时机也很好，现在推理正在快速拓展、市场也希望能找到新的潜在英伟达挑战者、也会给更高的定价和预期。个人看未来的空间看WSE-4如果能成功落地，成本/性能比将进一步拉大差距，让Cerebras从“高端替代”变成“主流基础设施”。未来如果WSE-4成功=从“推理利基冠军”跃升为“AI基础设施第二梯队核心玩家”，市场空间进一步打开。看到两篇关于Cerebras的推文，值得细看： @LinQingV 的这篇 @roger9949 的这篇

显示更多

0

29

117

21

转发到社区

麦通MSX@MSX_CN

2026.05.14 10:30

🚀 Cerebras 热度拉满， MSX Pre-IPO 一期也迎来验证时刻。 📌 美东时间 5 月 14 日， $CBRS 正式上线，IPO 发行价定在 185 美元。 🧠 作为英伟达挑战者， Cerebras 押注 AI 推理与晶圆级芯片路线，也是当下 AI 半导体赛道最受关注的新变量之一。 🎁 已参与 MSX Pre-IPO 一期 Cerebras 项目的用户，可直接获得空投的 $ CBRS.M 股票代币。 💡 从 Pre-IPO 到 IPO， MSX 想做的很简单：让优质资产自由流通，链上美股用麦通。 #MSX# #麦通# #链上美股用麦通# #CBRS# #Cerebras# #AI#

显示更多

0

42

85

30

转发到社区

麦通MSX@MSX_CN

2026.05.14 09:45

🚀 AI 芯片新贵 Cerebras Systems，将在开盘撮合完成后，由 MSX 同步 Nasdaq 节奏上线现货交易。 “英伟达挑战者”，今天正式上桌。👀 公告详情👇 #MSX# #麦通# #链上美股用麦通# #CBRS# #AI#

显示更多

0

46

66

55

转发到社区

Macro_Lin ｜市场观察员@LinQingV

2026.05.13 15:20

$CBRS 假设 Cerebras 跟 CPO 结合起来，能否成为一台为极致推理而生的性能巨兽？ Cerebras WSE-3 的片上 SRAM 带宽是 21 PB/s，这个数字只对已经在片上的数据有效。一旦模型大到装不进单台 CS-3 的 44GB SRAM，就需要多台 CS-3 协同，activation 在机器之间流动。这段片间互联走的是 SwarmX 以太网 fabric，12 条 100GbE 链路，总带宽约 150 GB/s，跟片上 21 PB/s 差了超过十万倍。这是 Cerebras 部署 frontier model 时性能出现断崖的根本原因，也是 OpenAI 选择蒸馏小模型而不用 weight streaming 跑完整 GPT-5.3 的底层逻辑。如果把 CPO引入 CS 系统，把光引擎直接封装到 WSE 的 package 上，片间互联带宽有望从现在的 150 GB/s 跳到几十 TB/s，提升两个数量级。电信号不用走长距离 PCB trace 再到外挂光模块，直接在芯片旁边完成电光转换，延迟更低，功耗更低，信号完整性更好。跑一个万亿参数模型可能需要 20 到 30 台 CS 系统，权重全部常驻在各台机器的片上 SRAM 里不动，activation 通过 CPO 在机器之间高速流动。每台 CS 内部是 21 PB/s 的片上带宽处理几十层计算，跨机传一个几 MB 的 activation tensor 在几十 TB/s 的 CPO 下只需要亚微秒级延迟，基本可以被藏在计算延迟后面。系统的有效带宽会非常接近"全部在片上"的体验。这种配置下 Cerebras 对 GPU 方案的带宽优势是碾压级的，NVIDIA 再怎么升级 HBM 也追不上 SRAM + CPO 的组合。对比 NVIDIA 刚收购的 Groq 多芯片方案也有数量级优势，Cerebras 每个节点是 44GB、21 PB/s 的整片晶圆，Groq 每个节点只有 500MB、150 TB/s 的标准芯片，跨节点通信频率差两个数量级。工程难度非常大。在一整片 300mm 晶圆上集成 CPO 跟在常规芯片上做完全不同。光引擎的物理位置（晶圆没有传统意义上的 package 边缘）、WSE 本身 23kW 功耗旁边怎么保持激光器的温度稳定、CPO 光通道的良率怎么管理（WSE 的 compute core 可以靠冗余核补偿缺陷，光通道没有这个机制），每一个都是全新的封装工程问题。这条路如果走通了，Cerebras 的 wafer-scale 架构就到了终极形态。片上 21 PB/s SRAM 带宽负责计算，CPO 负责多机扩展，权重常驻不动，activation 光速流转，一台专为推理而生的性能巨兽。这套系统在 decode 吞吐上可能没有理论对手。推理是 AI 产业链里离收入最近的环节，谁的 token 更快更便宜，谁就吃到最大的商业化红利。尤其是高频交易、实时 Agentic 工作流、自动驾驶决策链这类对推理速度有确定性要求的场景，够用和极致之间的差距就是能做和不能做的区别。

显示更多

0

28

125

19

转发到社区

Macro_Lin ｜市场观察员@LinQingV

2026.05.10 07:40

OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的，1 月份报道的合同价值超过 100 亿美元，后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元（包含到 2030 年的扩展选项）。第一个产品 2 月 12 日就上线了，叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单，可以从几个方面做具体判断。吞吐方面，Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上，标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒，速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒，是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比，同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距，跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间，还有几百倍的 gap，被软件栈、工作负载、batch 处理这些系统级因素吃掉了。延迟方面，1000 tokens/秒对应每个 token 1 毫秒生成间隔，这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写，每次客户端服务端往返开销减少 80%，per-token 开销减少 30%，time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的，跟 Cerebras 1 毫秒每 token 的硬件能力对不上，软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层，硬件能力升级倒逼软件栈重构。成本方面，Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放，API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价，意味着单位推理成本仍然显著高于普通 GPU 推理服务，需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU，OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事，可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考，Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens，GPT-4o 的 API 售价是 $10/M 输出 tokens，但两者模型规模和能力差距很大，不能直接对比。但 Cerebras 的这套东西有几个关键的约束条件，框定了它现在能做什么、做不了什么。第一是模型大小限制。Codex-Spark 是蒸馏后的小模型，被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB，frontier model 的参数量远超这个容量，必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力，Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证，OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型，说明前者目前在工程上更可行。第二是容量限制。Codex-Spark 目前是 research preview，OpenAI 明确说明"由于运行在专用低延迟硬件上，使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3，对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因，硬件交付的物理速度限制了营收节奏。总结来说，OpenAI 这笔交易对 Cerebras 是阶段性胜利，但远没到终局。技术验证层面，Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度，这一点产业内已经形成共识。但商业兑现层面，Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制，OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型，说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度，每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程，年产几千台 CS-3 是相当具体的工程瓶颈。对国产推理芯片的同行来说，这件事还有几个很具体的工程信号。端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快，软件栈跟不上的话推理体验仍然受限，专用推理芯片的价值要靠端到端的延迟优化才能完全释放。蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型，说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态，单纯的"通用推理芯片"在竞争中会比较吃亏。 1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化，这个速度天花板对国产推理芯片是一个相当严峻的目标。 Cerebras 当前展示的能力是真实的，但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键，一是看它在 2027-2028 年能不能把 750MW 真的部署完，把 RPO 真的转成营收；二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号，但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖，客户质量在提升，但集中度的风险结构没有改变，只有客户组合真正分散了，估值里的风险溢价才能消化。

显示更多

0

67

306

44

转发到社区

勃勃OC@bboczeng

2026.05.08 23:36

AI 芯片制造商 Cerebras 据称计划在周一上调 IPO 定价 $CBRS 预计将在周一为其 IPO 定价，价格区间为每股 125 至 135 美元。据称，该 IPO 的认购倍数已经超过 20 倍。

显示更多

0

5

6

0

转发到社区