註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 Nvidia
Nvidia 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 Nvidia 的搜尋結果
NVIDIA 这次真的不讲武德,直接甩出一个开源的视频理解怪兽 Nemotron 3 Nano Omni,处理视频快得离谱:1 小时就能搞定 10 小时的视频内容,比播放速度还快 10 倍 核心靠的是 3D 卷积技术,不再逐帧傻扫,而是成块"吞噬"数据,效率直接拉满 以后这些场景真的爽: 全天监控里找"没戴安全帽且在争吵"的人 几百个素材里精准定位"有海浪声且拍到日落"的画面 听一段机器运转视频就能诊断电机异响 几分钟帮你搞定,连 Whisper 的钱都省了 不过要注意,这哥们是个典型的偏科生 技能点全加在了多模态理解和处理效率上,想拿它写代码或者搞高难度文本推理,表现可能还不如一些轻量级纯文本模型 结论:别把它当全能程序员,但在音视频分析、海量素材打标这些实战场景里,它绝对是开源界的神 搞 AI 视频、多模态的兄弟,这个必须试试 项目地址放评论区了👇
顯示更多
0
7
271
46
轉發到社區
NVIDIA 与 IREN 宣布达成战略合作,加速部署最高 5 吉瓦的 AI 基础设施 NVIDIA 将向 $IREN 投资最高 21 亿美元
挑战 Nvidia 的芯片公司 Cerebras 上市日期定在 5.14,发行价 $115-$125, 对应市值在 270 亿美金 Cerebras的特色的是「大芯片」,整片 12 寸晶圆,片上内存 44GB SRAM,内存带宽高达 21 PB/s, 是 B200/Rubin 的 2625 倍,推理速度 15x 下面这个视频很直观,Cerebras 跑 GPT-5.3-Codex-Spark, 13 秒就把一个贪吃蛇游戏做出来了,常规的 GPT-5.3-Codex 用了 50 秒,在小模型上的确有优势 不过 44GB SRAM 装不下超过 1T 参数的主流大模型,通过外挂 MemoryX 模式能训练 24T 参数模型,但速度优势就没有那么大了,预估会缩小到 2-3x Cerebras 还有 2 个需要注意的点,86% UAE 都是 UAE 客户,集中度高;今年增速放缓,P/S 高达 43-49x 另外,Nvidia 的整个生态,仍是非常坚实的护城河 不过作为今年的 AI 芯片第一股,短时间内大概率还是会炒一波,Hiive 上目前 $181 +45%, Hyperliquid 上最高到过 320,现在 210 +68% 希望 moomoo 能支持打新,目前还没看到
顯示更多
0
15
222
38
轉發到社區
下载NVIDIA App,领取《鸣潮》游戏礼包 包含游戏道具:高级能源核心 x 2、高级能量袋 x 1、贝币 x 20000。 数量有限,兑完即止。(本活动仅适用于中国大陆用户) 本活动将于 2026 年 6 月 10 日结束。
顯示更多
写在英伟达(NVIDIA)下周财报之前 --- 英伟达对客户进行“直接提价”以及“变相提价(通过系统级捆绑与产品架构重构)”情况分析。 英伟达利用其在AI算力市场近80%的绝对垄断地位,其提价策略已经从传统的“单纯调高芯片零售价”演变为“通过重塑算力采购规则和网络捆绑进行价值最大化回收”。 一、 英伟达的“直接提价”与“变相提价”策略 1. 直接提价(芯片与消费级层面) 消费级GPU直接提价:针对消费端旗舰显卡(如 RTX 5090),由于新一代 GDDR7 显存成本大幅攀升,英伟达近期已正式向其 AIC 合作伙伴提价 300 美元(约合 2000 元人民币),这导致消费级高端显卡的实际零售价在渠道端被进一步推高。 数据中心芯片均价(ASP)的大幅上调:新一代 Blackwell 架构芯片的单体售价较上一代 Hopper 显著提高。市场预计,即使是入门级的 B100,其平均售价(ASP)也在 3.0 万到 3.5 万美元之间(已与上一代旗舰 H100 持平);而包含 Grace CPU 和双 B200 GPU 的高端 GB200 超级芯片,单体售价则直奔 6.0 万至 7.0 万美元。 2. 变相提价(系统化、网络捆绑、产业链利润回收) 系统级打包销售(System Bundling):这是英伟达最核心的“变相提变/溢价”手段。英伟达正加速从“卖 GPU 芯片”向“卖整体机柜解决方案”转型。以 GB200 NVL72 平台为例,其单套整机柜的售价高达 280 万至 340 万美元,而推理优化的 GB300 NVL72 售价则攀升至 600 万至 650 万美元。客户在购买时无法单独采购裸 GPU 芯片,必须同时为机柜内附带的 NVLink 交换机系统、Spectrum-X 以太网卡、液冷系统等组件高额买单。 压缩代工厂空间以回收产业链利润:在未来的 Vera Rubin 架构中,英伟达计划直接向客户交付预建好的计算托盘(Trays),这一核心部件将占到服务器总物料清单(BOM)成本的约 90%。这实际上剥夺了服务器代工厂(如戴尔、超微等)的设计和配套件溢价空间,变相将整个算力产业链的所有利润全部回收到英伟达手中。 网络设备的交叉提价施压:目前美国司法部(DOJ)的反垄断调查以及中国国家市场监督管理总局(SAMR)的审查,其核心指控就在于英伟达涉嫌“如果客户在购买 GPU 时选择竞争对手(如 AMD、Intel)的芯片,英伟达就会对其网络设备进行惩罚性加价或不予支持”,以此变相强迫客户购买整套英伟达方案。 二、 资本市场的相关分析 毛利率与 ASP 计入:华尔街卖方模型已将 2026 财年英伟达数据中心混合 GPU 的 ASP 假设从 2.6 万美元直接上调到了 3.3 万美元。华尔街对英伟达下周财报维持在 75% 附近的极高非 GAAP 毛利率预期,也是基于这一提价能力已充分兑现的前提 。 整机柜的溢价定价:富国银行(Wells Fargo)将英伟达目标价上调至 315 美元,其核心框架就是建立在“300 万美元级别整机柜(GB200/GB300 NVL72)”的大规模出货假设之上。也就是说,短期内系统打包销售带来的高客单价已经没有多余的“超预期未定价空间”。如果下周财报中管理层无法证明整机柜出货的毛利率能够持续坚守在 75% 以上,股价甚至会因此回调 。 从更长远的算力网络生命周期来看,未来可能还有更极端的变相提价和系统价值膨胀(Dollar Content Expansion): 当算力集群从目前的 GB300 世代向未来的 Rubin Ultra 世代演进时,网络组件和芯片整合的系统打包价值将实现大幅跨越。 也就是说,市场目前仅定价了 Blackwell 世代的系统级提价,但对于 Rubin 世代通过深度系统集成、在整个数据中心 BOM 成本中榨取高达 90% 绝对利润的能力,并未给予完全的溢价体现。 总结而言,英伟达由于显存成本上涨带来的消费级 GPU 直接涨价,以及靠网络套件进行的数据中心系统级变相提价,市场短期已经被计入得非常充分,但长期来看,仍有相当的空间。 免责声明:本人持有文章中提及资产,观点充满偏见,非投资建议,dyor
顯示更多
0
10
65
11
轉發到社區
英伟达(NVIDIA)CEO黄仁勋在北京南锣鼓巷品尝北京传统饮品豆汁,看得出来一定很不习惯😂 @bcgame
0
19
35
0
轉發到社區
特朗普访华,NVIDIA CEO 老黄特别飞到阿拉斯加 趁空军一号加油时,赶上航班 所以,这次跟特朗普一起到达北京的业界大佬,就是马斯克与黄仁勋 也代表 AI、半导体这种科技外交,已经是中美关系重要的议题 特斯拉和英伟达不晓得会不会在特朗普访华期间涨点,月光会重点关注下 其他几位清单里的老板们,不晓得是不是也在各自的私人飞机上 另外,这次据说是因为媒体报道老黄不在特朗普访华名单上,大统领就在最后关头打电话邀请老黄
顯示更多
0
16
30
2
轉發到社區
特朗普政府计划邀请 Nvidia、苹果、埃克森美孚、波音、高通、黑石、花旗和 Visa 的 CEO 随特朗普总统访华 特朗普政府计划邀请来自 Nvidia、苹果、埃克森美孚、波音、高通、黑石、花旗和 Visa 等公司的 CEO,陪同特朗普总统访问中国。 美国财政部长 Scott Bessent、美国贸易代表 Jamieson Greer,以及驻华大使 David Perdue 正在协助筛选随行人员。 官员们预计,此行可能达成的商业协议有限,例如涉及大豆和波音飞机的交易;此行的主要重点将是加强特朗普与习近平之间的关系。
顯示更多
如果你运行一个 NVIDIA H100 集群,并且希望训练任务能真正跑完,那么你必须有大约 5% 的算力冗余:而这相当于每个月有超过 100 万美元的芯片“闲置”。 这个结论来自一项在 11 月发布的研究:基于 1,056 块 GPU、持续 2.5 年、累计 1,170 万 GPU 小时的运行数据。这是目前公开领域中,对 H100 可靠性规模最大的一次分析。 成本之所以这么高,原因在于:每块 H100 出现“不可纠正内存错误”(uncorrectable memory errors)的概率,是 NVIDIA A100 的 3.2 倍。NVIDIA 为应对错误设计的恢复机制(例如行重映射、错误隔离)原本是按 A100 较小规模设计的,在 H100 上不仅触发更频繁,而且失败率也更高。单节点可用性大约是 99.3%,听起来还不错,但一旦把它扩展到数百个节点、再叠加一个月的运行时间,整体成功率就会显著下降。 论文中最有价值的数字其实藏在推算里:如果单节点可用性从 99.3% 提升到 99.9%,所需的超额配置(overprovisioning)可以减少 2.5 倍。这正是为什么行业开始把“硬件可靠性”当作“软件问题”来解决——这是一个纯粹的经济驱动。
顯示更多
🧵Thread: 在NVIDIA GTC遇到了OpenClaw创始人Peter 1/ 一个把Claude、Meta、OpenAI同时卷进来的独立开发者 一个人干翻了硅谷对"AI Agent该长什么样"的定义 聊了20分钟,记录几个让我印象深刻的细节 👇
顯示更多
0
19
73
6
轉發到社區