TwiScan
인기
커뮤니티
로그인
회원가입
English
日本語
한국의
简体中文
繁体中文
가입 후 초대 링크를 공유하면 동영상 재생 및 초대 보상을 받을 수 있습니다.
지금 가입
川沐|Trumoo🐮
@xiaomustock
一个自由的AI股票大宗期权纯二级韭菜交易员 -所有内容不构成任何投资建议-不会参与接受任何推广和广告-不会私聊任何人不碰任何人资金-任何借我名义私聊或者推广或者收费或其他地方假借助理顾问也都是诈骗,谨防上当。 推特只用作自身投资笔记,悉知。
가입 March 2022
540
팔로잉 중
228.8K
팬
川沐|Trumoo🐮
@xiaomustock
2026.02.12 18:24
Openai搞的这个Cerebras 芯片比较有意思😅 1. 晶圆级尺寸 (Wafer-Scale):世界上最大的芯片,有多大呢,脸盘那么大.😅 晶体管数量: 拥有 4 万亿个晶体管(作为对比,H100 只有 800 亿个) 2. 极高的片上内存带宽 (On-chip SRAM) 这是 Cerebras 吊打 GPU 的核心武器。 消除瓶颈: 在传统的 GPU 架构中,模型计算时需要在显存(HBM)和计算核心(Core)之间频繁搬运数据,这产生了巨大的能耗和延迟。(内存计算会稀释HBM增长率,但蛋糕足够大,同时SRAM的成本也很高,前期对三星海力士美光三巨头威胁不大) 全片上存储: Cerebras 拥有高达 44GB 的片上 SRAM 内存,带宽达到了每秒 21 PB (PetaBytes)。这意味着模型的大部分权重可以完全存储在芯片内部,读写速度比 GPU 的显存快上千倍,从而实现了 OpenAI 模型那样的“秒速”推理。 3. 极简的编程与扩展 单机即集群: 由于芯片本身足够大,一个 Cerebras 节点(CS-3)的算力就相当于几十个甚至上百个传统的 GPU 节点。 无需切分模型: 开发者不需要像在 GPU 集群上那样,把一个大模型拆分成很多份并考虑复杂的跨服务器通讯(Model Parallelism)。在 Cerebras 看来,整个模型就在“一块”芯片上跑。 4. 针对大语言模型 (LLM) 的稀疏优化 处理零值: AI 模型中有很多权重是“零”(稀疏性),传统 GPU 依然会对这些零进行无效计算。Cerebras 芯片内置了稀疏计算引擎,能够直接跳过零值,从而进一步榨取性能。
더 보기
0
0
23
89
15
커뮤니티로 전달
인기 있는 사용자
야살 / Yasal
@Yasal_170
869.9K 팬
乐老爺AV選
@HappyLok1157
108.8K 팬
彭博商業周刊 / 中文版
@BloombergBWCN
40.9K 팬
一劍浣春秋
@chee828
229K 팬
New York Post
@nypost
3.8M 팬
小牛
@Xiaoniu6161
170.9K 팬
有村架純's staff
@Kasumistaff
559.1K 팬
橋本環奈
@H_KANNA_0203
5M 팬
billboard
@billboard
15.2M 팬
0xAA
@0xAA_Science
178.9K 팬
浜辺美波
@MINAMI373HAMABE
2.4M 팬
aespa
@aespa_official
4.7M 팬
绯夜晚棠
@saurabhwork
31.2K 팬
安宇泽
@DFHDJZY
16.3K 팬
川沐|Trumoo🐮
@xiaomustock
228.8K 팬