搜尋 CS進出相關推文 — 推特瀏覽器

2026.05.13 15:20

$CBRS 假设 Cerebras 跟 CPO 结合起来，能否成为一台为极致推理而生的性能巨兽？ Cerebras WSE-3 的片上 SRAM 带宽是 21 PB/s，这个数字只对已经在片上的数据有效。一旦模型大到装不进单台 CS-3 的 44GB SRAM，就需要多台 CS-3 协同，activation 在机器之间流动。这段片间互联走的是 SwarmX 以太网 fabric，12 条 100GbE 链路，总带宽约 150 GB/s，跟片上 21 PB/s 差了超过十万倍。这是 Cerebras 部署 frontier model 时性能出现断崖的根本原因，也是 OpenAI 选择蒸馏小模型而不用 weight streaming 跑完整 GPT-5.3 的底层逻辑。如果把 CPO引入 CS 系统，把光引擎直接封装到 WSE 的 package 上，片间互联带宽有望从现在的 150 GB/s 跳到几十 TB/s，提升两个数量级。电信号不用走长距离 PCB trace 再到外挂光模块，直接在芯片旁边完成电光转换，延迟更低，功耗更低，信号完整性更好。跑一个万亿参数模型可能需要 20 到 30 台 CS 系统，权重全部常驻在各台机器的片上 SRAM 里不动，activation 通过 CPO 在机器之间高速流动。每台 CS 内部是 21 PB/s 的片上带宽处理几十层计算，跨机传一个几 MB 的 activation tensor 在几十 TB/s 的 CPO 下只需要亚微秒级延迟，基本可以被藏在计算延迟后面。系统的有效带宽会非常接近"全部在片上"的体验。这种配置下 Cerebras 对 GPU 方案的带宽优势是碾压级的，NVIDIA 再怎么升级 HBM 也追不上 SRAM + CPO 的组合。对比 NVIDIA 刚收购的 Groq 多芯片方案也有数量级优势，Cerebras 每个节点是 44GB、21 PB/s 的整片晶圆，Groq 每个节点只有 500MB、150 TB/s 的标准芯片，跨节点通信频率差两个数量级。工程难度非常大。在一整片 300mm 晶圆上集成 CPO 跟在常规芯片上做完全不同。光引擎的物理位置（晶圆没有传统意义上的 package 边缘）、WSE 本身 23kW 功耗旁边怎么保持激光器的温度稳定、CPO 光通道的良率怎么管理（WSE 的 compute core 可以靠冗余核补偿缺陷，光通道没有这个机制），每一个都是全新的封装工程问题。这条路如果走通了，Cerebras 的 wafer-scale 架构就到了终极形态。片上 21 PB/s SRAM 带宽负责计算，CPO 负责多机扩展，权重常驻不动，activation 光速流转，一台专为推理而生的性能巨兽。这套系统在 decode 吞吐上可能没有理论对手。推理是 AI 产业链里离收入最近的环节，谁的 token 更快更便宜，谁就吃到最大的商业化红利。尤其是高频交易、实时 Agentic 工作流、自动驾驶决策链这类对推理速度有确定性要求的场景，够用和极致之间的差距就是能做和不能做的区别。

0

28

125

19

轉發到社區

Charles在路上@Charles77xixi

2026.04.26 10:31

今天和 @EuSiir Kevin 见了一面。00 年，CS & Finance 双学位，目前在香港某交易工作。聊完之后感觉拿到了很多增量信息，以及意识到了科班 finance 背景对投资市场的认识，和纯普通二级市场玩家的视角真的不太一样。 1️⃣ 我问他：finance 里有什么科班知识，是对投资真的有用的吗？他拿 Polymarket 作为例子，很多人会觉得 Polymarket 只是一个赌博网站。但从 finance 的角度看，它是 make sense 的。因为信息本身有价值，而有价值的东西，就应该被 price in。预测市场的意义不在于预测的准确性，它真正有意思的地方，是把分散在不同人手里的信息，用价格聚合起来。一个事件发生概率是多少？在社交媒体上大家会吵成一团，Polymarket 上直接给你一个价格。这个价格不一定准，但它比空喊观点更接近市场，因为有人真金白银押了自己的判断。 Kevin 自己也会玩 Polymarket，并且确实赚到过钱。作为一个在交易所工作的同学，我觉得他对crypto的看法挺有意思，也比很多中文圈KOL更接近Truth。他 2021 年就进 crypto 市场了，早期做过合约，也爆过仓，最疯狂的那段时间每天都炒到凌晨三四点，然后八点起床上班。但后来就完全不碰合约了，应该算是个很典型的路径。我发现很多人进入 crypto 的第一课都是杠杆，但真正留下来的人，最后都会离杠杆越来越远。他现在使用的是杠铃投资策略，所有投资标的都是crypto。 - 大部分资金放在简单赚币、Defi 等相对稳的地方吃利息。 - 小部分资金偶尔打 meme，不过现在处于熊市周期，机会相对于之前少了很多。 - 另一部分就是持续 DCA BTC，不买其他的任何标的。目前这套策略在熊市能带来的收益也不算低，能够稳定cover日常消费。他只买 BTC的理由也很直接：这是 crypto 里确定性最强的标的。目前圈子里小范围的共识是，现在这个区间的 BTC 可以逐渐建仓\加仓，未来依然有不少上涨空间。大家并不认为 BTC 是 Ponzi，或者换个说法，很多市场都有 Ponzi 结构，比如美股、A 股、房地产市场，都依赖后来者继续出价。 2️⃣ 还聊了香港留学的性价比。如果目标是拿身份，香港并没有很多人想得那么划算。香港拿到永居要 7 年。把读书的 2 年算进去，毕业后还要再待大概 5 年。这意味着你还要判断毕业后这 5 年你能不能接受香港的职业环境，并且目前香港身份的红利也在不断下降。香港 IT 机会整体不算多，更多是 finance 里的开发岗位。部分核心大厂岗位，刚需欧美经历。而且金融机构里的技术栈比较老，开发也不是核心部门，成长速度和技术挑战可能有限，有点像在国企养老。 3️⃣ build in public 其实现在很多人都开始意识到这件事的重要性，Kevin 也一样，他的职业生涯也进入了一个相对的瓶颈期，尤其是努力工作的回报相对线性。很多人有了一定积蓄，找到一条相对稳定的赚钱路径之后，都会开始做各种不同的尝试。单靠一份工作，很难承载一个人未来几年的所有可能性。对程序员来说，build in public 最重要的东西，我觉得有两个方向。第一个是 GitHub，这是程序员最重要的名片。在 build 成本被打到地板的今天，agency 和 taste 会越来越重要，agency决定了你要主动做什么，taste决定了你最后做出来的效果怎么样。以前 GitHub 空着，还可以说自己工作太忙，代码都写在公司仓库里，现在这个解释越来越站不住脚了。很多时候，你只需要一个想法，AI coding 就能帮你把第一版落地。如果 GitHub 还是空的，就很难证明自己真的有主动性。 GitHub 应该展示三件事：主动性、品味、专业性。你可以做一些自己真正感兴趣的 side project。也可以参与一些适合自己的、有深度、业界认可的开源社区。不用一上来就追求很大的项目。一个小项目，只要方向选得准、实现干净、文档清楚，也能体现很多东西。第二个是 X、小红书这类自媒体账号。很多技术人会天然排斥做内容，觉得写代码才是正事，搞流量很虚。但把东西讲清楚、卖出去、让别人愿意关注你，本身就是很重要的能力。这套能力在职场里也能复用：你要说服同事接受你的方案、你要让老板理解你的价值、你要让合作伙伴相信你能把事情做成。这些都已经超出了纯技术问题。账号还有一个价值：它是你的动态 portfolio，一页简历太短了，简历只能告诉别人你做过什么。一个长期更新的账号，可以让别人看到你的判断、表达、审美、关注的问题，以及你如何持续学习，这比一页简历更接近真实的人。最后再次感谢@EuSiir Kevin，接触到了很多增量信息，期待下次见面~

0

6

0

轉發到社區

Macro_Lin ｜市场观察员@LinQingV

2026.05.10 07:40

OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的，1 月份报道的合同价值超过 100 亿美元，后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元（包含到 2030 年的扩展选项）。第一个产品 2 月 12 日就上线了，叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单，可以从几个方面做具体判断。吞吐方面，Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上，标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒，速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒，是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比，同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距，跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间，还有几百倍的 gap，被软件栈、工作负载、batch 处理这些系统级因素吃掉了。延迟方面，1000 tokens/秒对应每个 token 1 毫秒生成间隔，这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写，每次客户端服务端往返开销减少 80%，per-token 开销减少 30%，time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的，跟 Cerebras 1 毫秒每 token 的硬件能力对不上，软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层，硬件能力升级倒逼软件栈重构。成本方面，Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放，API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价，意味着单位推理成本仍然显著高于普通 GPU 推理服务，需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU，OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事，可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考，Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens，GPT-4o 的 API 售价是 $10/M 输出 tokens，但两者模型规模和能力差距很大，不能直接对比。但 Cerebras 的这套东西有几个关键的约束条件，框定了它现在能做什么、做不了什么。第一是模型大小限制。Codex-Spark 是蒸馏后的小模型，被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB，frontier model 的参数量远超这个容量，必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力，Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证，OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型，说明前者目前在工程上更可行。第二是容量限制。Codex-Spark 目前是 research preview，OpenAI 明确说明"由于运行在专用低延迟硬件上，使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3，对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因，硬件交付的物理速度限制了营收节奏。总结来说，OpenAI 这笔交易对 Cerebras 是阶段性胜利，但远没到终局。技术验证层面，Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度，这一点产业内已经形成共识。但商业兑现层面，Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制，OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型，说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度，每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程，年产几千台 CS-3 是相当具体的工程瓶颈。对国产推理芯片的同行来说，这件事还有几个很具体的工程信号。端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快，软件栈跟不上的话推理体验仍然受限，专用推理芯片的价值要靠端到端的延迟优化才能完全释放。蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型，说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态，单纯的"通用推理芯片"在竞争中会比较吃亏。 1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化，这个速度天花板对国产推理芯片是一个相当严峻的目标。 Cerebras 当前展示的能力是真实的，但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键，一是看它在 2027-2028 年能不能把 750MW 真的部署完，把 RPO 真的转成营收；二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号，但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖，客户质量在提升，但集中度的风险结构没有改变，只有客户组合真正分散了，估值里的风险溢价才能消化。

0

67

306

44

轉發到社區

Season夕笙💜@season_cos

2026.05.27 05:49

@cs_ppt 這種的是假帳號

0

4

0

轉發到社區

区块链日记 🐬TermMax@Steam_Diary123

2026.05.27 05:40

@Meta8Mate CHZ CS啊

0

轉發到社區

人在币圈（Lovecity） (小爱)./@lovecity0088

2026.05.15 06:16

最近开始痴迷cs比赛,今天下午绿龙打G2 绿龙最近3场比赛全胜，状态比较火热，Donk直接拉满而G2最近比较坎坷，特别是瑞士轮打的比较挣扎，队内又缺少第二个稳定的发挥点，看以往的两边交手记录，以往都是绿龙较轻松的拿下如果不爆冷，无论是以往交手记录和近期的状态，大概率绿龙轻松取胜

0

14

17

0

轉發到社區

0xAA@0xAA_Science

2025.10.23 09:32

不少大学生把CS GO饰品当理财产品，贷款炒。今天CS GO改了饰品合成机制，导致价格暴跌，好像有几个大学生跳楼了，事情闹挺大。

0

238

1.3K

61

轉發到社區

hunter_0@0xhunter_null

2026.05.15 09:20

教你一眼看出什么叫“没有任何CS背景纯vibe coding”的人： 1.环境变量乱七八糟 2.拉三条链的数据，完全没有任何并发，等着吃别人尾气 3.没有缓存，同一个币推三次，他每次都把数据重新查一遍现在很多“社区项目”的代码水平，大概就这样。我顺手给它修了一版： PS.这个策略本身还是很顶的，第一个把IO策略写好后开源的项目，我是程序员老毛病犯了()()，随时随地开始优化

0

5

82

8

轉發到社區

马蹄橘子@bitcoinzhang1

2026.03.02 09:04

对不起，是我乐观了，只有3%的比例，纯纯CS啊，按照盘前价格6U/分，可能还要打折不信自己查➡️

马蹄橘子@bitcoinzhang1

2026.03.02 03:39

说个坏消息按照现在币安盘前的价格如果空投5%比例，一分估值11刀。如果空投10%比例，一分估值22刀而且仅仅是静态估值，币安alpha和booster还有更便宜的筹码要砸问了一下前排大户进场早的，成本也是10 看起来集体反撸了@opinionlabsxyz 这就是预测市场的造富效应吗感觉opn这个空投一发，Bsc的另外两个估值也被锁死了，朴实无华的商战吗

0

23

29

0

轉發到社區

华尔街观察 Xtrader@cnfinancewatch

2026.06.01 14:21

摩托罗拉15亿美元收购D-Fend事件及对 $ONDS 价值影响分析突发消息：摩托罗拉解决方案公司宣布以15亿美元收购以色列反无人机企业D-Fend，本次收购将对ONDS旗下Sentry CS业务产生重大价值影响。摩托罗拉此次斥资15亿美元收购的D-Fend，是一家专注于射频（RF）技术的以色列反无人机企业。该公司业务布局广泛，产品已在全球30多个国家完成数千次实战部署，过去三年年收入增速高达50%，行业成长性突出。据预估，D-Fend 2026年营收有望达到1.85亿美元，本次收购对应其单一反无人机平台营收倍数为8.1倍。值得重点关注的是，上市公司ONDS旗下的Sentrycs业务，与D-Fend具备高度相似的核心属性：同样是以色列本土企业、同样深耕射频（RF）反无人机技术，在行业资质、落地部署规模、项目成功经验等方面均高度对标。回顾过往交易，ONDS此前仅花费2.25亿美元就完成了对Sentrycs的收购。参照摩托罗拉本次收购锁定的8.1倍营收估值倍数，以Sentrycs 2026年约1亿美元的预期营收测算，仅Sentrycs单一业务的对标交易价值就高达8.1亿美元。估值差距尤为悬殊的是，Sentrycs仅仅是ONDS整体业务架构中的单一平台模块，而ONDS手握完整的反无人机系统体系架构，资产价值被严重低估。本次摩托罗拉收购案，为市场明确了反无人机平台对行业战略收购方的核心估值标准。一方面，这极大利好反无人机（C-UAS）防护对抗赛道的整体估值；另一方面，也充分印证了ONDS精准高效的双向并购布局策略。

0

2

0

轉發到社區