搜尋 128】M-line 相關推文

2026.06.02 02:34

昨天GTC大会我直接看麻了—— 英伟达，它又来了。这次不是什么"性能小幅提升"，不是"能效比优化了8%"这种挤牙膏——它直接把一块对标RTX 5070性能的旗舰GPU塞进了一颗SoC，跟CPU共享高达128GB统一内存，然后告诉你：这是一台笔记本电脑的芯片。四十年了。PC这个东西，四十年了第一次被人从根上重新定义。我当时看到这个消息的第一反应是：英特尔你还好吗？高通你还有救吗？先说说这东西到底意味着什么。过去Windows PC最大的物理性原罪，就是CPU和GPU是两个独立的大脑，数据在中间跑来跑去，慢、贵、浪费。苹果用M系列芯片统一内存架构教育市场教了好几年，Windows阵营一直在旁边尬看。现在英伟达直接掀桌子：我来了，我带着CUDA来了。这才是真正可怕的地方。高通骁龙X系列折腾了两年，好不容易证明了Windows on Arm能跑，但AI开发者为什么不买账？因为生态。因为整个AI工程界的母语叫CUDA，从PyTorch到各种底层加速库，没有CUDA你就是个外星人。高通费尽心机拉拢开发者，结果英伟达一进场，自带全套生态，开发者在笔记本上跑的代码和云端服务器上的代码——一模一样，无缝衔接。这一刀，插的不只是高通的心脏，连苹果在AI开发者圈的布局都得重新掂量。然后说说英伟达自己的如意算盘。很明显，它在对冲风险。 AI计算的重心正在从训练向推理漂移，终端设备越来越重要。如果英伟达只守着数据中心的GPU矿山，万一哪天推理需求全跑到别的架构上，它就被架空了。所以它要把算力触角伸到你的桌面，伸到你的背包里。以后不管你的AI任务跑在云上还是跑在本地，英伟达都能收到过路费。这个商业闭环，真的很丝滑。当然，它也在赌。把高性能GPU塞进SoC，独立显卡的市场份额肯定要被自己蚕食一部分。它赌的是AI PC带来的增量能补上这个窟窿。能不能赌赢？我不知道。但敢这么下注的，也只有英伟达了。但是—— 我必须说但是。卖给谁？这是RTX Spark最大的问号，也是我看完发布会之后心里最凉的地方。 DeepSeek们把云端API的价格打到了什么程度？便宜到让人心疼。你买一台RTX Spark旗舰本要花多少钱？那笔钱拿去烧token，一个重度用户能用好几年。本地跑模型，性价比正在被云端击穿。普通用户凭什么花大价钱，就为了在本地跑一个比云端还弱的模型？所以RTX Spark真正的用户画像，可能比英伟达预期的要窄很多。开发者、隐私敏感型用户、极客——这些人会爱死它。但那个想象中的"大众换机潮"，我觉得还得等很久。总之，英伟达这次确实重新定义了战场，AI竞争从云端租算力，蔓延到了你桌面上的每一寸芯片。压力最大的是英特尔的传统x86阵营，还有刚在Arm PC市场勉强站稳脚跟的高通——这两家，接下来的日子都不好过。但英伟达仍面临一道尚未完全跨越的坎：高价本地硬件与廉价云服务的矛盾。这个问题若得不到更好解决，RTX Spark就可能更多停留在极客与专业用户的玩具阶段，而难以成为真正的时代转折点。路还长。盯着看。

0

16

24

5

轉發到社區

qinbafrank@qinbafrank

2026.05.09 10:20

SpaceX之前最重磅的IPO估计就是下周这个超大晶圆制造商Cerebras Systems的上市了，Cerebras是一家专注于AI加速器的美国公司，总部位于加州Sunnyvale，成立于2016年。公司以“晶圆级集成”（Wafer-Scale Engine，简称WSE）技术闻名，核心产品是将整个300mm硅晶圆直接做成一颗超级大的AI处理器，而不是像传统GPU那样切成小芯片再封装。这解决了AI训练/推理中常见的内存带宽和芯片间通信瓶颈问题，被誉为“世界上最大的AI芯片”。树立了下关于Cerebras几部分关键信息。 1、核心技术和产品 1）晶圆级引擎（WSE）传统AI芯片（如NVIDIA H100/B200）采用多芯片模块（MCM）或小型die，通过NVLink/HBM等外部互联扩展。但Cerebras的WSE把整个晶圆做成单一die，避免了芯片间通信延迟和带宽损失，实现了“片上”海量并行计算。 WSE-3采用“Weight Streaming”架构，将计算和内存解耦，支持外部MemoryX扩展（1.5TB、12TB、120TB甚至1.2 PB），单系统即可训练高达24万亿参数的超大模型。 2）CS-3系统单台15U机柜，内置1颗WSE-3，支持水冷。通过SwarmX互联可扩展至2048台集群，峰值达256 exaFLOPS。单台CS-3就能在不到1天内从零训练Llama 2 70B模型（Meta GPU集群需约1个月）。 3）性能优势 Cerebras强调“消除数据移动瓶颈”：比上一代CS-2（WSE-2）：性能翻倍，功耗和成本不变（CS-2用7nm，2.6万亿晶体管，40 GB SRAM）。比NVIDIA H100/B200：在内存密集型大模型任务中优势显著。CS-3单系统内存容量远超10,000节点GPU集群；推理速度可达GPU云的数倍（尤其是长上下文/大模型）。公司声称在Llama/Falcon等模型上tokens/second提升2倍。实际基准：Condor Galaxy 3（64台CS-3集群，8 exaFLOPS）已于2024年Q2上线，与G42合作。集群编程像“单芯片”一样简单，无需复杂分布式框架。优势：极致内存带宽 → 适合万亿/十万亿参数模型训练与推理。扩展性强 → 集群像单机一样编程，开发效率高。能效/成本在特定 workloads 上优于GPU（同功耗下性能翻倍）。挑战：单系统功耗高（25kW），部署门槛高（需专用数据中心基础设施）。晶圆级制造良率和缺陷容忍技术虽成熟，但整体成本高（单系统硬件估算数百万美元）。生态不如CUDA成熟，主要针对AI训练/推理大模型，不如GPU通用。总体上Cerebras是“垂直优化”的AI超级计算机方案，适合追求极致规模和速度的 hyperscaler、主权AI项目、国家实验室，而非通用GPU替代品。 2、发展历程 Cerebras从“卖硬件”转向“AI超级计算平台”，已从早期科研验证走向商用落地（Condor Galaxy等主权AI项目）。从SeaMicro老兵到AI晶圆级先锋 Cerebras成立于2015-2016年（官方多以2016年计），总部位于加州Sunnyvale。创始人团队全部来自SeaMicro（2012年被AMD以3.34亿美元收购），早期处于stealth模式四年，专注解决“晶圆级集成良率难题”。 1）2019年：发布首代WSE-1，开启晶圆级AI芯片时代。 2）2020-2022年：推出CS-1/CS-2系统，完成从“芯片”到“系统+软件栈”的闭环，与TSMC深度绑定实现量产。 3）2024年：WSE-3及CS-3系统落地，性能翻倍；同期首次递交S-1（后因业务优化于2025年10月撤回）。 4）2025-2026年：转向云推理服务+混合模式，与OpenAI签署巨额合作； 5）2026年2月完成Series H，4月重启S-1，5月启动路演，计划Nasdaq上市（代码CBRS）。 3、核心团队及融资 1）核心团队 Andrew Feldman（CEO、联合创始人）：连续创业者，曾任SeaMicro CEO、Force10 Networks产品VP（后被Dell收购）、Riverstone Networks营销VP。斯坦福MBA背景，擅长产品化与资本运作。 Gary Lauterbach（联合创始人、前CTO）：Sun Microsystems UltraSPARC首席架构师，58项专利，曾主导AMD数据中心业务。 Sean Lie（联合创始人、现CTO）：MIT本科+硕士，AMD高级架构师，29项专利。 Michael James（首席架构师）：SeaMicro软件架构师，后任AMD对应岗位。 Jean-Philippe Fricker（首席系统架构师）：DSSD/SeaMicro资深硬件架构师，30项专利。团队优势在于“系统思维”而非单纯芯片设计：他们深谙数据中心功耗、互联与软件优化，曾用fabric架构重塑服务器。这正是Cerebras能解决晶圆级缺陷容忍与Weight Streaming架构的关键。 2）融资历程累计融资约29-37亿美元（含多轮），估值从早期数百M美元飙升至IPO前230-266亿美元：早期：Series B/C/D（2016-2018）累计约1.7亿美元，投资者包括Foundation Capital、Eclipse、Sequoia、Benchmark。中后期：2019 Series E（2.72亿美元，估值24亿美元）；2021 Series F（2.54亿美元，估值41亿美元）。 2025-2026：Series G（11亿美元，估值81亿美元）；Series H（10亿美元，估值230亿美元，Tiger Global领投，Benchmark、Fidelity、AMD等跟投）。 4、业务模式与财务表现 Cerebras早期卖硬件（CS-2/CS-3系统），后来转向云服务（Cerebras Inference，云端提供超快AI推理）和混合模式。客户包括CSP、 hyperscaler、企业、主权AI项目（如G42）、研究机构。 2025财年财务：收入5.1亿美元（同比+76%，2024年2.9亿美元，2023年0.787亿美元，2022年0.246亿美元，20倍增长）。硬件收入约3.58亿美元，云及其他服务1.52亿美元。 GAAP净利润：约0.879亿美元（2024年净亏损4.85亿美元），首次实现盈利（不过非GAAP仍有亏损）。剩余履约义务（backlog）：246亿美元（OpenAI等多年前期大单贡献），2026-2027年预计确认15%。客户集中度：2025年G42占24%（此前曾高达87%），另一UAE客户占62%，但已显著多元化；OpenAI签署超100-200亿美元多年前期合作（含1亿美元贷款+认股权证）。公司定位从“卖芯片”转向“AI基础设施平台+云”，并与Qualcomm等合作加速边缘部署。 5、IPO相关信息： IPO 基础发行2800万A类普通股，超额配售420万A类普通股，核心管理层和投资人不卖股。纯公司发行新股用于募资，无大量旧股套现。 IPO定价$115–$125/股，因需求超20倍，已计划上调至$125–$135/股（可能进一步调整）。高区间（$125）募资约35亿美元（基础28M股），含超额配售最高约40.25亿美元。高估值下（$125/股）对应市值约266亿美元IPO后总流通股本约 2.13亿百万股（包括Class A、B、N等）。其中： Class A（上市交易股）为IPO发行的28M股 + 超额部分；其余Class B（高投票权，创始团队/早期投资者/优先股转换后）和Class N（非投票权，如OpenAI认股权证相关）。 ipo后解禁期前的流通比例标准锁定期： 180天或提前至Q3 2026财报发布后两个交易日（取较早者）。解禁前初始流通股（Initial Float）：仅IPO发行的 28百万股（基础）或最高 32.2百万股（含超额）。锁定期内真实流通比例：约 13.1%–15.1%（28M / 213M ≈ 13.1%；32.2M / 213M ≈ 15.1%）预期定价日：下周三5月13日，预期上市交易日：5月14日（周四），代码CBRS。整体而言估值虽高，但增长潜力和技术壁垒值得关注本条由@bitget_zh赞助，「Bitget 买美股：秒级入场，丝滑交易」

0

16

364

86

轉發到社區

墓碑科技@mubeitech

2026.06.01 19:50

把128GB统一内存塞进轻薄本，英伟达发布 RTX Spark 超级芯片，直接重塑 Windows PC 的天花板。里面装的是 Blackwell RTX GPU 和 Grace CPU。加上这128GB的统一内存，这台机器能直接在本地跑起巨大的 AI 模型。速度极快，且数据完全私密。不再需要把敏感素材传给云端，你的笔记本就是一个算力堡垒。用 AI 创作的门槛，被直接踩平了。觉得 ComfyUI 节点太复杂、太反人类，可以直接让内置的 AI 代理 OpenClaw 替你干活。输入几句话，它自己去调参数、写提示词。从一张草图生成材质效果，再直接用它做起始帧生成视频，全部本地一气呵成。创作者的性能瓶颈也被碾碎了。靠着这巨大的内存，你能直接剪辑 12K 4:2:2 的视频。或者渲染高达 90GB 的巨型场景。在 Blender 里，有了 DLSS 4.5 光线重建技术的加持。你在场景里随意拖动，就能实时看到几乎等同于最终渲染的画质。至于游戏，那可是英伟达的老本行。《心灵杀手 2》、Pragmata 等游戏，直接在 1600p 分辨率下光追全开。 DLSS 4.5 里的新 Transformer 模型，把环境细节拉到了新高度。更别说它原生支持带有反作弊系统的多人联机游戏。真正的个人计算新形态已经来了。不再依赖网络带宽，不再忍受云端延迟。装载这颗芯片的新型轻薄本和紧凑型台式机，今年秋天就会出货。本地算力的狂欢，正式开场。

0

19

46

9

轉發到社區

雪踏乌云@Pluvio9yte

2026.05.12 02:25

卧槽，128万人民币流水！策哥这是何意味啊，比我们多四分之一的Token消耗，流水竟然是我们的6倍多😭 这下大家都知道DragonCode不赚钱了吧，我说不赚钱大家还不信😭 另外招代理，开课，加盟，我和泊舟@bozhou_ai 什么都教。两个程序员手把手教学，售前售后，渠道对接，源码部署。我们没有那么赚钱，于是打算发展一下加盟下游。不割韭菜，大致就类似于把蜜雪冰城推广到全国。具体有意向的进评论区群。

天策@Leobai825

2026.05.09 14:30

少年，忘掉那个她，跟哥一起卖Token吧她会骗你，哥不会，听哥的，好好赚钱把体力和时间拼到极致，意志力会带你杀出重围

0

23

53

2

轉發到社區

夜郎奔（精品资源搬运工）@yelangben

2026.04.21 20:09

PFES-128 一个中年、不受欢迎、性欲旺盛的男人，完全无条件地接受了一位穿着紧身裤、臀部丰满的女清洁工，并愿意为她做任何事，他无法抗拒她不经意间露出内裤的诱惑…… 高潮喷射性服务！Akari Neo

0

171

10

轉發到社區

夜郎奔（精品资源搬运工）@yelangben

2026.03.12 00:41

FJIN-128 乳头揉捏失禁一个普通女孩因敏感乳头被玩弄而养成失禁习惯，无法停止射精，成为教室里的肉体手淫者！上坂芽衣

0

1

135

12

轉發到社區

白猫少女@kktu520

2026.05.22 04:39

限时特惠 128门槛赠送这两套图 288门槛起在赠送两个视频

0

轉發到社區

Barret李靖@Barret_China

2026.05.03 10:13

Codex 在 0.128.0 引入了 /goal，一个不达目的不罢休的 Agent 设计，轻轻松松跑七八个小时，烧 Token 也很猛。它跟 Spec-Driven Development 不太一样，实现上比较直接，约等于把社区流行的 Ralph loop 内置到了 TUI 里：while :; do cat PROMPT.md | codex; done。 /goal 既不做任务规划，也不做流程编排，它只提供约束和目标。只要目标没达成，它就让模型持续干活。那它是如何不忘记任务的呢？其实也很简单，它把目标写进了数据库🥲，默认放在 ~/.codex/state_5.sqlite，每次 loop 都会读一遍数据库。当前的设计里，一个 session 只支持一个 goal，无论是进程重启还是 ctrl+c 中断都会自动恢复目标任务。在任务的恢复机制上倒是做了一些优化，为了避免跟用户抢控制权，/goal 会严格检查当前线程是否处于空闲状态，然后再自动注入一个 continuation prompt 推进下一个 turn，prompt 拼接的内容大概做了这么几件事情：1）把目标转成可验证交付物；2）构建 checklist；3）检查真实产物（文件、输出、测试）。在 prompt 里还做了比较强硬的检测声明：不接受看起来完成，不要因为 token 预算焦虑就提前完成，不要相信之前的记忆，只要有不确定性就继续干。这种设计最大的问题就是巨量的 token 消耗，/goal 没有采用对话追加模式，每轮都会发送完整的对话历史，这会导致 token 消耗随轮次 n² 增长，而烧钱的问题完全靠服务器端的 prompt cache 机制来缓解。cache 也不是完全免费，只是成本更低而已，Claude Code 的 cache-hit 价格是 1 折左右，估计 Codex 的价格会更低。可以这么理解，/goal = 目标驱动（objective）+ 状态感知（budget/time）+ 验收机制（audit）。每一步要做什么，完全交给模型自己来判断，相当于把模型当成一个负责交付结果的工程师。