今天看到很有意思的一则新闻“CME将与Silicon Data合作推出算力期货市场”。
是的,算力成为一种新的大宗期货,即将登陆芝加哥商品交易所了。算力,是真的就是硅基生命的玉米大豆石油了。
显示更多
DFU-Tools:一个面向 macOS 的桌面工具
用于辅助 Apple Silicon、T2 以及部分 iPhone、iPad 设备进行 DFU、重启、恢复和修复操作
⚠️数据无价 先备份 操作需谨慎
显示更多
🌈昨晚一手行业信息
①【算力】芝商所将与Silicon Data合作推出算力期货市场,有望继续强势表现!
②【船舶】央视新闻报道船舶发动机正同步排产,工人师傅们正加紧赶交付,现在订单已经排到了2028年,有望迎来短期资金
显示更多
电诈园区都在用AI克隆声音行骗了,你还不了解这东西?
与其被骗,不如自己先搞懂它——开源工具 Voicebox,把AI声音克隆这套玩意儿直接装进你自己电脑,数据不上云、零泄露,安全感直接拉满。
功能也不含糊:
1️⃣ 5大TTS引擎随意切,Qwen3、23国语言都支持
2️⃣ 一小段音频就能克隆声音,生成长度随便
3️⃣ 变调混响压缩8种后期效果,专业级
4️⃣ 多轨时间线编辑,有声书播客多角色配音一条龙
5️⃣ Mac Apple Silicon原生加速,Win/Linux同样跑得动
GitHub 15.1k星,MIT协议,商用随便用。
做播客、短视频配音的,订阅费直接省掉。
🔗
显示更多
今天财报,重点是盘前的 $EOSE $NBIS !!
1. Nebius $NBIS
市值: $47.65B
收入 Est: $388.57M
YoY 增长: 573.05%
看点: 重点关注 2026 $7B - $9B ARR 的展望是否维持 / 抬高!
我的重仓。
2. Tower Semiconductor $TSEM
市值: $25.8B
收入 Est: $410.98M
YoY 增长: 14.77%
看点: 重点关注其在硅光子(Silicon Photonics)领域的进展,尤其是 800G/1.6T 模块 !
3. Eos Energy Enterprises $EOSE
市值: $2.91B
收入 Est: $56.4M
YoY 增长: 379.28%
看点: 关注其锌基电池系统的产能扩张进度,全年展望,有没有数据中心大单!
另外,这家也有很高的做空仓位,有可能会和 $FLNC 一样有轧空行情。(NFA)
买了一点埋伏,这家可以试试开个盲盒。
4. Gilat Satellite Networks $GILT
市值: $1.58B
收入 Est: $114.56M
YoY 增长: 14.33%
5. Aeluma $ALMU
市值: $507.32M
收入 Est: $1.35M
YoY 增长: -
6. AmpliTech Group $AMPG
市值: $67.89M
收入 Est: $5M
YoY 增长: 66.67%
看点: 展望!公司重申 2026 年全年收入目标至少为 $50M。
也是我的持仓,上季度财报 miss 后暴跌,最近股价慢慢涨回来了,这次希望不要再让人失望!
显示更多
过去 2 小时跟踪了全网 435 条新闻消息,筛出 5 条值得关注的核心信号。美国 4 月 CPI 飙升至 3.8% 创三年新高,配合霍尔木兹海峡 10 亿桶的实物缺口,二次通胀已从预期变为物理现实。
1/ US CPI hits 3-year high as energy costs explode. Headline 4.0% data shows 3.8% YoY growth with energy inflation surging to 17.9%. Fed's Goolsbee calls the report 'worse than expected' as core services hit 0.45% monthly, effectively killing H1 rate cut hopes.
$TSM $NVDA
2/ Global oil deficit reaches 1 billion barrels. ADNOC CEO warns the Hormuz blockade has created a massive physical supply gap that compounds daily. With WTI breaking $101 and Brent at $107, the market is finally pricing the structural failure of global energy transit.
$CVX $XOM
3/ CME to launch AI compute futures. The world's largest derivatives exchange is partnering with Silicon Data to commoditize GPU rental rates. This shift turns AI compute from a capital expense into a hedgeable financial asset, validating the 'compute as the new oil' paradigm.
$NVDA $AVGO
4/ Cerebras IPO at $5.5B valuation triggers OpenAI windfall. The chipmaker's listing could net OpenAI over $5B for its 11% stake as it seeks to diversify hardware supply. This establishes a clear valuation floor for custom AI silicon outside the NVIDIA monopoly.
$MSFT $NVDA
5/ Treasury Secretary Bessent backs Bank of Japan's path. Meeting with PM Ishiba, Bessent signaled 'full confidence' in Governor Ueda and acknowledged that fundamentals will stabilize the Yen. This reduces the tail risk of a chaotic, uncoordinated global carry trade unwinding.
$SONY $TM
That's the signal from this window. With CPI and energy both breaking higher, is the Fed's 2% target officially dead? Repost if you're watching the same tape.
显示更多
聊一下Intel的EMIB-T,这个技术可能在未来两年改变先进封装的竞争格局。
先说背景。AI加速器的封装面积越来越大,一颗芯片装不下的计算和内存,需要把多颗die封装在一起协同工作。当封装面积超过单次光刻曝光的极限,就需要用”局部硅桥”来连接相邻的die。这个思路,TSMC和Intel各自走出了不同的实现路径。
TSMC的CoWoS-L,L代表LSI(Local Silicon Interconnect),用局部硅桥做相邻die之间的高密度互连,全局布线靠InFO RDL扇出层完成,整个工艺在圆形晶圆载板上加工。Intel的EMIB,同样是局部硅桥,但嵌入的是矩形有机基板,全局布线靠基板上的金属层完成。两者底层思路相近,但制造平台和全局布线的密度存在本质差异。
早期EMIB有一个结构性短板。硅桥里没有垂直通孔,电源从基板底部送不穿桥,只能绕路。偏偏最需要电的PHY电路就坐在桥的正上方(信号线越短越好,所以PHY放在die最边缘),电源反而要从die中心横向传过来。路径长,压降大,瞬态响应差。HBM3e时代还能应对,到HBM4接口宽度翻倍、pin速率推到6.4Gbps以上,这条供电路径就成了瓶颈。
EMIB-T就是解这个问题的。T代表TSV,在桥里打铜通孔,电源从基板直接垂直穿过桥送到上面的PHY。同时桥里集成MIM电容和接地铜网格,就地稳压滤噪。供电路径从横向绕行变成垂直直连。
这个改动释放了两层约束。第一层是供电能力,可以支撑HBM4/4e级别的功耗需求。第二层是封装面积上限,Intel目标是2026年做到120×120mm封装、集成8倍光罩面积的硅,2028年推进到120×180mm、超过12倍光罩。
跟CoWoS-L的竞争,核心差异在制造平台。CoWoS-L在圆形晶圆载板上完成全部工艺,面积越大,晶圆边缘的浪费越大,RDL层的均匀性和翘曲控制难度也非线性上升。EMIB-T在矩形有机基板上多放桥,每个桥的工艺独立重复,整体良率虽然也随桥数量指数衰减,但衰减速率稳定可控。封装越大,EMIB-T在成本上的优势越明显,良率的可控性也越高。反过来说,CoWoS-L的InFO RDL层提供了更高密度的全局布线和电源分配能力,加上NVIDIA等客户的设计生态已经深度适配CoWoS工艺,迁移成本极高,这是CoWoS短期内不可替代的护城河。
目前的状态是,标准EMIB量产良率90%,Intel表示已接近传统FCBGA封装水平。EMIB-T验证良率也到了90%,但这是小批量数据,量产目标98%。郭明錤的评价很准确,从90%到98%比从零到90%难得多。2026年EMIB-T进产线验证,2027年可能出现第一批产品(Jaguar Shores),Google TPU等外部客户也在评估EMIB-T方案,2028年才是真正的放量年。当然,Intel近几年的产品节奏有过多次延期,这个时间线能否如期兑现本身就是一个需要追踪的变量。
对TSMC的影响,我的判断是分流,不是替代。NVIDIA跟TSMC的全栈绑定短期内动不了,但Google、Meta这些做自研AI ASIC的客户,以及Apple等寻求封装供应链多元化的厂商,封装面积需求大、成本敏感、又有分散供应链的动力,EMIB-T给了它们一个真实可用的备选。Bernstein估算,EMIB平台封装每颗芯片成本在几百美元量级,而Rubin级别加速器上CoWoS-L封装成本约900到1000美元。即便只从边缘蚕食,打破CoWoS垄断定价权这件事本身,对整个产业链的影响也远超实际转移的份额。
SK hynix这两天也传出在跟Intel合作研发EMIB封装。HBM供应商主动拥抱EMIB生态,说明连它们自己都不想被CoWoS产能卡住出货节奏。
Intel的EMIB-T,正在把先进封装的竞争从”谁的技术更好”转向”谁能在超大面积上同时控住成本和良率”。从目前的市场叙事来看,EMIB-T的结构性优势应该还没被充分讨论。
显示更多
之前做LLM推理芯片架构探索的时候,我把四大AI推理ASIC公司的架构都翻过一遍。Groq、SambaNova、Tenstorrent、Cerebras。前三家的思路虽然各有侧重,但底层逻辑都在同一个框架里:片上大SRAM + dataflow架构 + 确定性调度,核心差异在NoC拓扑、内存层级、编译器抽象这些维度上展开。
Cerebras是里面让我真正被震惊到的一家,而它却这四家里马上第一个拿到IPO结果的。
这家公司的选择比其他三家都激进一个量级:不做芯片,直接做整片wafer。
单颗WSE-3,21.5cm × 21.5cm的整片晶圆,90万个PE通过scribe-line stitching在物理上连成一片连续的silicon。这个工艺是Cerebras和TSMC联合定制的,把原本用于晶圆切割的窄条改造成跨reticle的金属导线,让所有reticle在物理上拼接成一整块芯片。(配图二展示了单颗WSE-3内部结构:左半边是整片晶圆的reticle网格和scribe-line拼接,右半边放大了单个PE的微架构。)
单个PE的结构极简:8-wide FP16 SIMD计算核,48KB本地SRAM直连,没有cache层级,所有数据访问都是确定性的单周期。加上一个5端口路由器(N/S/E/W + loopback),相邻PE之间的通信延迟也是单周期。关键在于,跨reticle边界的mesh在物理参数上和reticle内部完全一致,编译器和runtime完全不需要感知reticle边界的存在。
从LLM推理的视角看,这个均匀性的价值非常大。
LLM推理的瓶颈在decode阶段。每生成一个token,模型权重要被完整读取一次,计算量却很小,典型的memory-bound场景。GPU集群在这个环节的核心问题是数据搬运:HBM带宽有限,多卡之间还要经过NVLink → NVSwitch → InfiniBand → Ethernet四层互联,每一层带宽和延迟都差几个量级,编程模型必须显式处理每一层的拓扑边界。
Cerebras的做法完全绕开了这个问题。单片wafer内部fabric带宽27 PB/s,权重从外部的MemoryX存储集群通过SwarmX流入wafer后,在PE之间按数据流模式传播执行,同一套placement和routing算法跑遍整片wafer。(配图一展示了这个系统级架构:MemoryX参数存储集群到SwarmX互联fabric,再到底层最多2048台CS-3节点,权重广播和梯度规约的数据流方向一目了然。)
90万个PE各自带48KB SRAM,合计约42GB片上存储,每个PE对自己本地SRAM的访问是单周期确定性的,PE间通信每跳single-cycle,延迟和曼哈顿距离成正比。对于推理场景,前提是weight streaming的编译器能把权重有效地分配到对应的PE上,这42GB分布式片上SRAM的聚合带宽远超GPU的HBM方案,没有cache层级带来的访问不确定性,没有跨芯片搬运的开销。
回到我自己的体感。做推理芯片架构的时候,NoC拓扑和内存层级的权衡花了大量精力,因为芯片边界是硬约束,跨芯片通信的成本和片内通信之间永远存在断层。Cerebras的做法等于从片内通信的角度消除了这个断层,代价是整条制造和封装链都要重新定义。
这也解释了Cerebras的工程取舍。所有架构创新集中在wafer内部,scale-out方向直接复用100GbE + RoCE的以太网生态。wafer内27 PB/s对比跨CS-3的SwarmX在Tbps量级,几个数量级的差距全部交给商品化网络承担。推理场景下单wafer内部的带宽和延迟优势可以直接转化成token生成速度。
OpenAI选择和Cerebras合作做推理,从架构层面看逻辑是通的。大规模在线推理需要低延迟、高吞吐、确定性时延,这三点恰好是wafer-scale架构在片上通信均匀性方面的结构性优势。
但这套架构也有几个结构性的问题值得正视。
良率和成本是绕不开的。整片wafer做单颗芯片,任何一个reticle的缺陷都影响整体。Cerebras靠冗余PE和路由绕行来应对,但冗余比例和良率数据从未公开过。一片wafer的制造成本本身就远高于切割后卖单颗die的模式,叠加23kW、15U的单系统功耗和体积,部署密度和TCO在大规模推理集群的经济性上面临考验。
最关键的是KV cache的容量瓶颈。42GB片上SRAM看起来很大,但长上下文推理场景下KV cache随序列长度线性增长。以Llama 70B为参考,FP16下128K上下文的KV cache就要吃掉约40GB,即使做KV cache量化,长序列场景下的容量压力仍然显著。片上放不下的部分必须依赖MemoryX做外部存储,数据要经过SwarmX回传,这条路径的带宽在Tbps量级,和wafer内部27 PB/s的差距意味着长序列场景下decode速度会被外部带宽卡住。这可能是Cerebras在推理场景面临的最核心的架构约束。
显示更多
说一件AI圈反常识的事:
本地跑大模型省钱这个叙事,今天被一篇 williamangel的实测稿正面翻车了。
测试机是 14 寸 M5 Max + 64GB 内存,零售价 $4,299。Gemma 4 31B 本地推理速度 10-40 token/s,按 $0.18-$0.20/kWh 的家庭电价摊算,每百万 token 综合成本落在 $0.40-$4.79 这个区间。看起来不错——本地、私密、零订阅费。
但 OpenRouter 同一个模型 $0.38-$0.50/百万 token,部分供应商吞吐 60-70 token/s。云端比本地便宜,速度还快两倍。
问题在哪:"本地跑模型省钱"这个故事里最大的认知错位是——它默认那台 $4,299 的机器是免费的。机器本身就是成本,电也是成本,时间也是成本:折旧、闲置、机房噪音、笔记本插电时长、Mac mini 不开机就跑不了任务。
为什么这个故事流行:一是订阅疲劳,大家受够了月费叠加,本地跑像是"一次性买断算力";二是隐私和离线作为真实需求,被错位地包装成了"省钱"卖点;三是 Apple Silicon 的 unified memory + MPS 硬件叙事确实漂亮,但漂亮不等于划算。
本地推理赢的是隐私、离线、可控、不被 rate limit 卡脖子。它输的恰恰是按账算。
这台 M5 Max 不是私有 AI 数据中心,它是一台贵价开发机,碰巧也能跑模型。
参照系是当年的自建挖矿机。技术上完全可行,但电费和折旧很快把账面利润吃光,最后真赚钱的不是矿工,是矿池和云算力。LLM 这一轮,OpenRouter 们就是新的矿池。
显示更多
昨天 5 月读书会,结束后回家倒头爽睡到下午四点,才有时间总结下昨天我们聊了什么。昨天是请到了日本医药品行业的专家来给大家分享研制一款新药后者医学器械是如何进行融资,执照审批,进入医保和定价的过程。从去年开始,somehow 日本成了新药审批最快的国家(2025 年审批通过超过 36 种),厚生労働省的「先驱审批」(SAKIGAKE)策略允许一款药物在没有明显副作用的时候就投放市场,并设定一个临时临床验证期间,以证明这款药物真正有用时才授予永久资格。
当然我个人最关心的不是现在的行政流程,医疗和制药行业也 AI 的广泛影响下收到冲击,其中存在什么机会才是我们最关心的话题。
没有人没事会经常去医院看病,通常,我们发现不适再前往医院时,身体已经需要相当的医疗介入,因为身体的免疫反应滞后于病灶。我认为,在 AI 时代,会有一部分,甚至可能是一大部分医疗的需求从诊所或医院中剥离开来,无论你如何定义它,个人 AI 辅助医疗也好,家庭医疗也好,按需检测也好,它本质上是使用 AI 在帮我们每个人建立自己的外层免疫系统。
那么,对于这种产品来说,持续监测是有效免疫预测的前提,我在这个基础上寻找了很多方案,大部分非侵入式的检测提供的都是行为数据,比如睡眠,血压,体重,拟合的身体压力水平,这些数据并不能提供直观的免疫系统状态,更无法做有效预测,在侵入式和非侵入式的中间,有不少公司做微针探测细胞间隙液的指标情况,但也存在着大量误差,最接近这个概念的,应当是持续的全血检测,在产品完成度上最好的,是 siphox health 这家公司。
非常有意思的一点是,一旦你深入挖掘这些公司的本质特征,会发现此类公司通常不是医疗和药物驱动的公司,而是半导体行业公司,siphox health 的投资人是 YC,Intel ,本身的产品原理是通过硅光子谐振腔免疫检测,创始人本身也是 Silicon Photonics(硅光子)领域的专家(我猜公司的命名来源也是这个)
这是一个很有趣的发现,因为这意味着最可能建立起人体外层免疫操作系统的公司并非医疗公司,药物研发厂商或者检测机构。我自己的经验认为,对于 AI 模型来说,数据的连续采集比行业平均 baseline 更加重要,而后者,通常是大型医疗检测机构的核心数据和护城河。
当然,siphox 的方案仍然只有特别关注自身健康或者有基础疾病的人才会采用,因此,我觉得这个市场还处于非常初级的阶段,我觉得只有当低侵入式方案能找到真正有效的核心指标之后,才会有面向大众的产品出现,到时,我们会有一款 App 可以在 AI 的支持下全面的,实时的监测人体的免疫系统和健康状态,毫无疑问,这是 AI + 健康的未来。
显示更多