註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 128】M-line
128】M-line 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 128】M-line 的搜尋結果
昨天GTC大会我直接看麻了—— 英伟达,它又来了。这次不是什么"性能小幅提升",不是"能效比优化了8%"这种挤牙膏——它直接把一块对标RTX 5070性能的旗舰GPU塞进了一颗SoC,跟CPU共享高达128GB统一内存,然后告诉你:这是一台笔记本电脑的芯片。 四十年了。PC这个东西,四十年了第一次被人从根上重新定义。 我当时看到这个消息的第一反应是:英特尔你还好吗?高通你还有救吗? 先说说这东西到底意味着什么。 过去Windows PC最大的物理性原罪,就是CPU和GPU是两个独立的大脑,数据在中间跑来跑去,慢、贵、浪费。苹果用M系列芯片统一内存架构教育市场教了好几年,Windows阵营一直在旁边尬看。 现在英伟达直接掀桌子:我来了,我带着CUDA来了。 这才是真正可怕的地方。高通骁龙X系列折腾了两年,好不容易证明了Windows on Arm能跑,但AI开发者为什么不买账?因为生态。因为整个AI工程界的母语叫CUDA,从PyTorch到各种底层加速库,没有CUDA你就是个外星人。高通费尽心机拉拢开发者,结果英伟达一进场,自带全套生态,开发者在笔记本上跑的代码和云端服务器上的代码——一模一样,无缝衔接。 这一刀,插的不只是高通的心脏,连苹果在AI开发者圈的布局都得重新掂量。 然后说说英伟达自己的如意算盘。 很明显,它在对冲风险。 AI计算的重心正在从训练向推理漂移,终端设备越来越重要。如果英伟达只守着数据中心的GPU矿山,万一哪天推理需求全跑到别的架构上,它就被架空了。所以它要把算力触角伸到你的桌面,伸到你的背包里。 以后不管你的AI任务跑在云上还是跑在本地,英伟达都能收到过路费。这个商业闭环,真的很丝滑。 当然,它也在赌。把高性能GPU塞进SoC,独立显卡的市场份额肯定要被自己蚕食一部分。它赌的是AI PC带来的增量能补上这个窟窿。能不能赌赢?我不知道。但敢这么下注的,也只有英伟达了。 但是—— 我必须说但是。 卖给谁? 这是RTX Spark最大的问号,也是我看完发布会之后心里最凉的地方。 DeepSeek们把云端API的价格打到了什么程度?便宜到让人心疼。你买一台RTX Spark旗舰本要花多少钱?那笔钱拿去烧token,一个重度用户能用好几年。 本地跑模型,性价比正在被云端击穿。普通用户凭什么花大价钱,就为了在本地跑一个比云端还弱的模型? 所以RTX Spark真正的用户画像,可能比英伟达预期的要窄很多。开发者、隐私敏感型用户、极客——这些人会爱死它。但那个想象中的"大众换机潮",我觉得还得等很久。 总之,英伟达这次确实重新定义了战场,AI竞争从云端租算力,蔓延到了你桌面上的每一寸芯片。压力最大的是英特尔的传统x86阵营,还有刚在Arm PC市场勉强站稳脚跟的高通——这两家,接下来的日子都不好过。 但英伟达仍面临一道尚未完全跨越的坎:高价本地硬件与廉价云服务的矛盾。这个问题若得不到更好解决,RTX Spark就可能更多停留在极客与专业用户的玩具阶段,而难以成为真正的时代转折点。 路还长。盯着看。
顯示更多
0
16
24
5
轉發到社區
SpaceX之前最重磅的IPO估计就是下周这个超大晶圆制造商Cerebras Systems的上市了,Cerebras是一家专注于AI加速器的美国公司,总部位于加州Sunnyvale,成立于2016年。公司以“晶圆级集成”(Wafer-Scale Engine,简称WSE)技术闻名,核心产品是将整个300mm硅晶圆直接做成一颗超级大的AI处理器,而不是像传统GPU那样切成小芯片再封装。这解决了AI训练/推理中常见的内存带宽和芯片间通信瓶颈问题,被誉为“世界上最大的AI芯片”。树立了下关于Cerebras几部分关键信息。 1、核心技术和产品 1)晶圆级引擎(WSE) 传统AI芯片(如NVIDIA H100/B200)采用多芯片模块(MCM)或小型die,通过NVLink/HBM等外部互联扩展。但Cerebras的WSE把整个晶圆做成单一die,避免了芯片间通信延迟和带宽损失,实现了“片上”海量并行计算。 WSE-3采用“Weight Streaming”架构,将计算和内存解耦,支持外部MemoryX扩展(1.5TB、12TB、120TB甚至1.2 PB),单系统即可训练高达24万亿参数的超大模型。 2)CS-3系统 单台15U机柜,内置1颗WSE-3,支持水冷。通过SwarmX互联可扩展至2048台集群,峰值达256 exaFLOPS。单台CS-3就能在不到1天内从零训练Llama 2 70B模型(Meta GPU集群需约1个月)。 3)性能优势 Cerebras强调“消除数据移动瓶颈”: 比上一代CS-2(WSE-2):性能翻倍,功耗和成本不变(CS-2用7nm,2.6万亿晶体管,40 GB SRAM)。 比NVIDIA H100/B200:在内存密集型大模型任务中优势显著。CS-3单系统内存容量远超10,000节点GPU集群;推理速度可达GPU云的数倍(尤其是长上下文/大模型)。公司声称在Llama/Falcon等模型上tokens/second提升2倍。 实际基准:Condor Galaxy 3(64台CS-3集群,8 exaFLOPS)已于2024年Q2上线,与G42合作。集群编程像“单芯片”一样简单,无需复杂分布式框架。 优势: 极致内存带宽 → 适合万亿/十万亿参数模型训练与推理。 扩展性强 → 集群像单机一样编程,开发效率高。 能效/成本在特定 workloads 上优于GPU(同功耗下性能翻倍)。 挑战: 单系统功耗高(25kW),部署门槛高(需专用数据中心基础设施)。 晶圆级制造良率和缺陷容忍技术虽成熟,但整体成本高(单系统硬件估算数百万美元)。 生态不如CUDA成熟,主要针对AI训练/推理大模型,不如GPU通用。 总体上Cerebras是“垂直优化”的AI超级计算机方案,适合追求极致规模和速度的 hyperscaler、主权AI项目、国家实验室,而非通用GPU替代品。 2、发展历程 Cerebras从“卖硬件”转向“AI超级计算平台”,已从早期科研验证走向商用落地(Condor Galaxy等主权AI项目)。 从SeaMicro老兵到AI晶圆级先锋 Cerebras成立于2015-2016年(官方多以2016年计),总部位于加州Sunnyvale。创始人团队全部来自SeaMicro(2012年被AMD以3.34亿美元收购),早期处于stealth模式四年,专注解决“晶圆级集成良率难题”。 1)2019年:发布首代WSE-1,开启晶圆级AI芯片时代。 2)2020-2022年:推出CS-1/CS-2系统,完成从“芯片”到“系统+软件栈”的闭环,与TSMC深度绑定实现量产。 3)2024年:WSE-3及CS-3系统落地,性能翻倍;同期首次递交S-1(后因业务优化于2025年10月撤回)。 4)2025-2026年:转向云推理服务+混合模式,与OpenAI签署巨额合作; 5)2026年2月完成Series H,4月重启S-1,5月启动路演,计划Nasdaq上市(代码CBRS)。 3、核心团队及融资 1)核心团队 Andrew Feldman(CEO、联合创始人):连续创业者,曾任SeaMicro CEO、Force10 Networks产品VP(后被Dell收购)、Riverstone Networks营销VP。斯坦福MBA背景,擅长产品化与资本运作。 Gary Lauterbach(联合创始人、前CTO):Sun Microsystems UltraSPARC首席架构师,58项专利,曾主导AMD数据中心业务。 Sean Lie(联合创始人、现CTO):MIT本科+硕士,AMD高级架构师,29项专利。 Michael James(首席架构师):SeaMicro软件架构师,后任AMD对应岗位。 Jean-Philippe Fricker(首席系统架构师):DSSD/SeaMicro资深硬件架构师,30项专利。 团队优势在于“系统思维”而非单纯芯片设计:他们深谙数据中心功耗、互联与软件优化,曾用fabric架构重塑服务器。这正是Cerebras能解决晶圆级缺陷容忍与Weight Streaming架构的关键。 2)融资历程 累计融资约29-37亿美元(含多轮),估值从早期数百M美元飙升至IPO前230-266亿美元: 早期:Series B/C/D(2016-2018)累计约1.7亿美元,投资者包括Foundation Capital、Eclipse、Sequoia、Benchmark。 中后期:2019 Series E(2.72亿美元,估值24亿美元);2021 Series F(2.54亿美元,估值41亿美元)。 2025-2026:Series G(11亿美元,估值81亿美元);Series H(10亿美元,估值230亿美元,Tiger Global领投,Benchmark、Fidelity、AMD等跟投)。 4、业务模式与财务表现 Cerebras早期卖硬件(CS-2/CS-3系统),后来转向云服务(Cerebras Inference,云端提供超快AI推理)和混合模式。客户包括CSP、 hyperscaler、企业、主权AI项目(如G42)、研究机构。 2025财年财务:收入5.1亿美元(同比+76%,2024年2.9亿美元,2023年0.787亿美元,2022年0.246亿美元,20倍增长)。硬件收入约3.58亿美元,云及其他服务1.52亿美元。 GAAP净利润:约0.879亿美元(2024年净亏损4.85亿美元),首次实现盈利(不过非GAAP仍有亏损)。 剩余履约义务(backlog):246亿美元(OpenAI等多年前期大单贡献),2026-2027年预计确认15%。 客户集中度:2025年G42占24%(此前曾高达87%),另一UAE客户占62%,但已显著多元化;OpenAI签署超100-200亿美元多年前期合作(含1亿美元贷款+认股权证)。 公司定位从“卖芯片”转向“AI基础设施平台+云”,并与Qualcomm等合作加速边缘部署。 5、IPO相关信息: IPO 基础发行2800万A类普通股,超额配售420万A类普通股,核心管理层和投资人不卖股。纯公司发行新股用于募资,无大量旧股套现。 IPO定价$115–$125/股,因需求超20倍,已计划上调至$125–$135/股(可能进一步调整)。高区间($125)募资约35亿美元(基础28M股),含超额配售最高约40.25亿美元。 高估值下($125/股)对应市值约266亿美元IPO后总流通股本约 2.13亿百万股(包括Class A、B、N等)。其中: Class A(上市交易股)为IPO发行的28M股 + 超额部分; 其余Class B(高投票权,创始团队/早期投资者/优先股转换后)和Class N(非投票权,如OpenAI认股权证相关)。 ipo后解禁期前的流通比例 标准锁定期: 180天或提前至Q3 2026财报发布后两个交易日(取较早者)。 解禁前初始流通股(Initial Float): 仅IPO发行的 28百万股(基础)或最高 32.2百万股(含超额)。 锁定期内真实流通比例: 约 13.1%–15.1%(28M / 213M ≈ 13.1%;32.2M / 213M ≈ 15.1%) 预期定价日:下周三5月13日,预期上市交易日:5月14日(周四),代码CBRS。 整体而言估值虽高,但增长潜力和技术壁垒值得关注 本条由@bitget_zh赞助,「Bitget 买美股:秒级入场,丝滑交易 」
顯示更多
0
16
364
86
轉發到社區
把128GB统一内存塞进轻薄本,英伟达发布 RTX Spark 超级芯片,直接重塑 Windows PC 的天花板。 里面装的是 Blackwell RTX GPU 和 Grace CPU。 加上这128GB的统一内存,这台机器能直接在本地跑起巨大的 AI 模型。 速度极快,且数据完全私密。 不再需要把敏感素材传给云端,你的笔记本就是一个算力堡垒。 用 AI 创作的门槛,被直接踩平了。 觉得 ComfyUI 节点太复杂、太反人类,可以直接让内置的 AI 代理 OpenClaw 替你干活。 输入几句话,它自己去调参数、写提示词。 从一张草图生成材质效果,再直接用它做起始帧生成视频,全部本地一气呵成。 创作者的性能瓶颈也被碾碎了。 靠着这巨大的内存,你能直接剪辑 12K 4:2:2 的视频。 或者渲染高达 90GB 的巨型场景。 在 Blender 里,有了 DLSS 4.5 光线重建技术的加持。 你在场景里随意拖动,就能实时看到几乎等同于最终渲染的画质。 至于游戏,那可是英伟达的老本行。 《心灵杀手 2》、Pragmata 等游戏,直接在 1600p 分辨率下光追全开。 DLSS 4.5 里的新 Transformer 模型,把环境细节拉到了新高度。 更别说它原生支持带有反作弊系统的多人联机游戏。 真正的个人计算新形态已经来了。 不再依赖网络带宽,不再忍受云端延迟。 装载这颗芯片的新型轻薄本和紧凑型台式机,今年秋天就会出货。 本地算力的狂欢,正式开场。
顯示更多
0
19
46
9
轉發到社區
卧槽,128万人民币流水!策哥这是何意味啊,比我们多四分之一的Token消耗,流水竟然是我们的6倍多😭 这下大家都知道DragonCode不赚钱了吧,我说不赚钱大家还不信😭 另外招代理,开课,加盟,我和泊舟@bozhou_ai 什么都教。两个程序员手把手教学,售前售后,渠道对接,源码部署。 我们没有那么赚钱,于是打算发展一下加盟下游。不割韭菜,大致就类似于把蜜雪冰城推广到全国。具体有意向的进评论区群。
顯示更多
少年,忘掉那个她,跟哥一起卖Token吧 她会骗你,哥不会,听哥的,好好赚钱 把体力和时间拼到极致,意志力会带你杀出重围
0
23
53
2
轉發到社區
PFES-128 一个中年、不受欢迎、性欲旺盛的男人,完全无条件地接受了一位穿着紧身裤、臀部丰满的女清洁工,并愿意为她做任何事,他无法抗拒她不经意间露出内裤的诱惑…… 高潮喷射性服务!Akari Neo
顯示更多
0
0
171
10
轉發到社區
FJIN-128 乳头揉捏失禁 一个普通女孩因敏感乳头被玩弄而养成失禁习惯,无法停止射精,成为教室里的肉体手淫者! 上坂芽衣
0
1
135
12
轉發到社區
限时特惠 128门槛赠送这两套图 288门槛起在赠送两个视频
Codex 在 0.128.0 引入了 /goal,一个不达目的不罢休的 Agent 设计,轻轻松松跑七八个小时,烧 Token 也很猛。 它跟 Spec-Driven Development 不太一样,实现上比较直接,约等于把社区流行的 Ralph loop 内置到了 TUI 里:while :; do cat PROMPT.md | codex; done。 /goal 既不做任务规划,也不做流程编排,它只提供约束和目标。只要目标没达成,它就让模型持续干活。 那它是如何不忘记任务的呢?其实也很简单,它把目标写进了数据库🥲,默认放在 ~/.codex/state_5.sqlite,每次 loop 都会读一遍数据库。当前的设计里,一个 session 只支持一个 goal,无论是进程重启还是 ctrl+c 中断都会自动恢复目标任务。 在任务的恢复机制上倒是做了一些优化,为了避免跟用户抢控制权,/goal 会严格检查当前线程是否处于空闲状态,然后再自动注入一个 continuation prompt 推进下一个 turn,prompt 拼接的内容大概做了这么几件事情:1)把目标转成可验证交付物;2)构建 checklist;3)检查真实产物(文件、输出、测试)。 在 prompt 里还做了比较强硬的检测声明:不接受看起来完成,不要因为 token 预算焦虑就提前完成,不要相信之前的记忆,只要有不确定性就继续干。 这种设计最大的问题就是巨量的 token 消耗,/goal 没有采用对话追加模式,每轮都会发送完整的对话历史,这会导致 token 消耗随轮次 n² 增长,而烧钱的问题完全靠服务器端的 prompt cache 机制来缓解。cache 也不是完全免费,只是成本更低而已,Claude Code 的 cache-hit 价格是 1 折左右,估计 Codex 的价格会更低。 可以这么理解,/goal = 目标驱动(objective)+ 状态感知(budget/time)+ 验收机制(audit)。每一步要做什么,完全交给模型自己来判断,相当于把模型当成一个负责交付结果的工程师。
顯示更多
0
13
89
8
轉發到社區
有一台128GB显存的一体机 你可以分配: 72GB用来运行本地大模型 32GB用来运行Cypherium AI挖矿 8GB用于系统运行 还有16GB弹性分配
网友花128元给女盆友玩水上飞人! 为什么工作人员的双手要抱得那么高!