TwiScan
Hot
Communities
Login
Register
English
日本語
한국의
简体中文
繁体中文
Register and share your invite link to earn from video plays and referrals.
Register now
川沐|Trumoo🐮
@xiaomustock
一个自由的AI股票大宗期权纯二级韭菜交易员 -所有内容不构成任何投资建议-不会参与接受任何推广和广告-不会私聊任何人不碰任何人资金-任何借我名义私聊或者推广或者收费或其他地方假借助理顾问也都是诈骗,谨防上当。 推特只用作自身投资笔记,悉知。
Joined March 2022
540
Following
228.7K
Followers
川沐|Trumoo🐮
@xiaomustock
2026.02.12 18:24
Openai搞的这个Cerebras 芯片比较有意思😅 1. 晶圆级尺寸 (Wafer-Scale):世界上最大的芯片,有多大呢,脸盘那么大.😅 晶体管数量: 拥有 4 万亿个晶体管(作为对比,H100 只有 800 亿个) 2. 极高的片上内存带宽 (On-chip SRAM) 这是 Cerebras 吊打 GPU 的核心武器。 消除瓶颈: 在传统的 GPU 架构中,模型计算时需要在显存(HBM)和计算核心(Core)之间频繁搬运数据,这产生了巨大的能耗和延迟。(内存计算会稀释HBM增长率,但蛋糕足够大,同时SRAM的成本也很高,前期对三星海力士美光三巨头威胁不大) 全片上存储: Cerebras 拥有高达 44GB 的片上 SRAM 内存,带宽达到了每秒 21 PB (PetaBytes)。这意味着模型的大部分权重可以完全存储在芯片内部,读写速度比 GPU 的显存快上千倍,从而实现了 OpenAI 模型那样的“秒速”推理。 3. 极简的编程与扩展 单机即集群: 由于芯片本身足够大,一个 Cerebras 节点(CS-3)的算力就相当于几十个甚至上百个传统的 GPU 节点。 无需切分模型: 开发者不需要像在 GPU 集群上那样,把一个大模型拆分成很多份并考虑复杂的跨服务器通讯(Model Parallelism)。在 Cerebras 看来,整个模型就在“一块”芯片上跑。 4. 针对大语言模型 (LLM) 的稀疏优化 处理零值: AI 模型中有很多权重是“零”(稀疏性),传统 GPU 依然会对这些零进行无效计算。Cerebras 芯片内置了稀疏计算引擎,能够直接跳过零值,从而进一步榨取性能。
Show more
0
0
23
89
15
Forward to community
Most Popular Users
New York Post
@nypost
3.8M Followers
aespa
@aespa_official
4.7M Followers
三上悠亜
@yua_mikami
9.1M Followers
야살 / Yasal
@Yasal_170
869.9K Followers
Natsume✨枣糕
@natsume0v0
1.2M Followers
billboard
@billboard
15.2M Followers
桃乃木かな
@Kana_Momonogi
2.1M Followers
Elon Musk
@elonmusk
240M Followers
Donald J Trump Truth Social Posts On X
@TrumpTruthOnX
553.8K Followers
ROSHY
@RoshyTV
330.6K Followers
Sam Altman
@sama
4.9M Followers
乐老爺AV選
@HappyLok1157
108.8K Followers
H.E. Justin Sun 👨🚀 🌞
@justinsuntron
4M Followers
一劍浣春秋
@chee828
229K Followers
Alina Becker 🍑
@abecker_cos
2.4M Followers