搜尋 40代転職相關推文

2026.05.09 09:06

为什么xAI要把数据中心Colossus1租给Authropic？这篇推文应该是分析最到位的，核心逻辑是： xAI目前总共持有大约55 万+个GPU（以H100等效性能为基础），而Colossus1（22 万个）仅占总可用容量的约40%，且是一个混合 H100/H200/GB200 的训练集群。这种混合集群并不是合适训练（不同代际GPU见通信延迟很大），但是非常适合推理（推理需要远没有那么紧密同步的 GPU 间通信）。恰恰Authropic现在最需要推理算力，而且一家就能把Colossus1的算力全部吃掉。而且Anthropic 作为单一租户占用所有22万个 GPU，多租户下出现的网络交换抖动（意外延迟）消失了。双方的技术弱点最终几乎完美互补。老马把完全基于 Blackwell 构建的数据中心Colossus 2留给自己，用以训练xAI下一代大模型。租赁出较旧的、混合代的 Colossus 1。作为一个混合H100/H200/GB200的训练集群，Colossus 1只能实现 11% 的MFU（利用率）。然而，一旦它被移交给单一推理客户，这个资产就转变为一个现金流资产，以大约每 GPU 小时 2.60 美元的价格出租（GPU 类型租赁率的加权平均）。对于 xAI 来说，本来是训练的“地狱集群”，在重新部署用于推理时变成了“金鹅”，每年带来50–60 亿美元的收入。将这 60 亿美元与 xAI 的损益表对比时，其分量就更清晰了。将 xAI 的 1Q26 净亏损年化，大约每年 60 亿美元的亏损。换句话说，向 Anthropic 租赁 Colossus 1 产生的 50–60 亿美元年度收入，几乎完美对冲了 xAI 的亏损数字不得不说、这是一次完美的合作：Authropic获得急缺的推理算力； SpaceXAI获得能弥补其AI业务年度亏损的现金流。

Jukan@jukan05

2026.05.09 03:44

Why did xAI hand over a 220,000-GPU cluster to Anthropic? The technical backdrop to xAI's decision to hand Colossus 1 over to Anthropic in its entirety is more interesting than it appears. xAI deployed more than 220,000 NVIDIA GPUs at its Colossus 1 data center in Memphis. Of these, roughly 150,000 are estimated to be H100s, 50,000 H200s, and 20,000 GB200s. In other words, three different generations of silicon are mixed together inside a single cluster — a "heterogeneous architecture." For distributed training, however, this configuration is close to a disaster, according to engineers familiar with the setup. In distributed training, 100,000 GPUs must finish a single step simultaneously before the cluster can advance to the next one. Even if the GB200s finish their computation first, the remaining 99,999 chips have to wait for the slower H100s — or for any GPU that has hit a stack-related snag — to catch up. This is known as the straggler effect. The 11% GPU utilization rate (MFU: the share of theoretical FLOPs actually realized) at xAI recently reported by The Information can be read as the numerical fallout of this problem. It stands in stark contrast to the 40%-plus MFU figures achieved by Meta and Google. The problem runs deeper still. As discussed earlier, NVIDIA's NCCL has traditionally been optimized for a ring topology. It works beautifully at the 1,000–10,000 GPU scale, but once you push into the 100,000-unit range, the latency of data traversing the ring once around becomes punishingly long. GPUs need to churn through computations rapidly to keep MFU high, but while they sit waiting endlessly for data to arrive over the network fabric, more than half of the silicon falls into idle. Google sidestepped this bottleneck with its own custom topology (Google's OCS: Apollo/Palomar), but xAI, by my read, has not yet reached that stage. Layer Blackwell's (GB200) "power smoothing" issue on top, and the picture comes into focus. According to Zeeshan Patel, formerly in charge of multimodal pre-training at xAI, Blackwell GPUs draw power so aggressively that the chip itself includes a hardware feature for smoothing power delivery. xAI's existing software stack, however, was optimized for Hopper and does not understand the characteristics of the new hardware; when it imposes irregular loads on the chip, the silicon physically destructs — literally melts. That means the modeling stack must be rewritten from scratch, which in turn means scaling is far harder than most of us imagine. Pulling all of this together points to a single conclusion. xAI judged that training frontier models on Colossus 1 simply was not efficient enough to be worthwhile. It therefore moved its own training workloads wholesale onto Colossus 2, built as a 100% Blackwell homogeneous cluster. Colossus 1, on the other hand — whose mixed architecture is far less crippling for inference, which parallelizes more forgivingly — was leased in its entirety to an Anthropic that desperately needed inference capacity. Many observers point to what looks like a contradiction: Elon Musk poured enormous capital into building Colossus, only to hand the core asset over to a direct competitor in Anthropic. Others read it as xAI capitulating because it is a "middling frontier lab." But these are surface-level reads. Look at the numbers and a different picture emerges. xAI today holds roughly 550,000+ GPUs in total (on an H100-equivalent performance basis), and Colossus 1 (220,000 units) accounts for only about 40% of the total available capacity. Colossus 2 — built entirely on Blackwell — is already operational and continuing to expand. Elon kept the all-Blackwell homogeneous cluster (Colossus 2) for himself and leased out the older, mixed-generation Colossus 1. In other words, he handed the pain of rewriting the stack — the MFU-11% debacle — to Anthropic, while keeping his own focus on training the next generation of models. The real point, then, is this. Elon's objective appears to be positioning ahead of the SpaceXAI IPO at a $1.75 trillion valuation, currently floated for as early as June. The narrative SpaceXAI now needs is that xAI — long the "sore finger" — is not merely a research lab burning cash, but a business with a "neo-cloud" model in the mold of AWS, capable of leasing surplus assets at high yields. From a cost-of-capital perspective, an "AGI cash incinerator" is far less attractive to investors than a "data-center landlord generating cash." As noted above, the most important detail of the Colossus 1 lease is that it is for inference, not training. Unlike training, inference requires far less tightly synchronized inter-GPU communication. Even when the chips are heterogeneous, the workload parcels out cleanly across them in parallel. The straggler effect — the chief weakness of a mixed cluster — is essentially neutralized for inference workloads. Furthermore, with Anthropic occupying all 220,000 GPUs as a single tenant, the network-switch jitter (unanticipated latency) that arises under multi-tenancy disappears. The two sides' technical weaknesses end up complementing each other almost exactly. One insight follows. As a training cluster mixing H100/H200/GB200, Colossus 1 was an asset that could only deliver an MFU of 11%. The moment it was handed over to a single inference customer, however, that asset transformed into a cash-flow asset rented out at roughly $2.60 per GPU-hour (a weighted average of the lease rates across GPU types). For xAI, what was a "cluster from hell" for training has become a "golden goose" minting $5–6 billion in annual revenue when redeployed for inference. Elon's genius, I would argue, lies not in the model but in this asset-rotation structure. The weight of that $6 billion becomes clearer when set against xAI's income statement. Annualizing xAI's 1Q26 net loss yields roughly $6 billion in losses per year. The $5–6 billion in annual revenue generated by leasing Colossus 1 to Anthropic, in other words, almost perfectly hedges xAI's loss figure. This single deal effectively pulls xAI to break-even. Heading into the SpaceXAI IPO, this functions as a core line of financial defense. From a cost-of-capital standpoint, if the image shifts from "research lab burning cash" to "infrastructure tollgate stably printing $6 billion a year," the entire tone of the offering can change. (May 8, 2026, Mirae Asset Securities)

0

20

195

27

轉發到社區

Sea@Sea_Bitcoin

2026.05.05 09:46

今天 CT 上最大的瓜，特朗普家族的 DeFi 项目 WLFI 正式起诉孙哥。这份 42 页的 PDF 起诉书里，披露了一些挺有意思的细节 👇 1/ 孙宇晨持仓规模通过 Blue Anthem 持有约 40 亿枚 $WLFI。其中 20 亿枚是 2024 年 11 月花 3000 万美元买的；另外 10 亿枚是 WLFI「赠送」的 (换他加入顾问委员会)；2025 年 1 月又买了约 10 亿枚 (没说多少钱)。 2/ 做空时间线 2025 年 8 月 31 日，$WLFI 公开交易前不到 24 小时，HTX 48 钱包 (孙哥控制) 分三笔、每笔约 1 亿美元 USDT，转到同一个 Binance 充值地址，总计 3 亿美元。这个钱包来源是 Huobi Recovery Wallet —— 孙哥 2023 年自己在 Twitter 上公开认领过。第二天 (9 月 1 日) WLFI 上线交易，价格跌了 26%，空头仓位暴增 23%。意思是说这些作空行为是由孙哥主导的。 3/ 代持 (straw purchases) 起诉书称，孙哥的实体通过 handshake deal (握手协议) 替未披露的第三方代持 WLFI 代币，违反了合同约定。 4/ 还把价值约 900 万美元的 WLFI 转到了 Binance 起诉书提到，孙相关实体把约 900 万美元等值的 WLFI 转到了 Binance。这违反了不可转让代币的条款 —— Blue Anthem 签署的协议里明确写了：WLFI 可以「有权自行决定是否解锁、限制访问或冻结任何钱包」。而且 Blue Anthem 还在协议里承诺了没有做过 WLFI 的做空交易。 5/ 动用中国警方起诉书指控，孙哥向中国执法部门虚假报告「World Liberty stole from you」，导致一名在北京的 WLFI 员工被长时间讯问。 6/ 花钱雇水军起诉书指控，孙宇晨花钱雇了 KOL 和机器人社交账号，来放大他的攻击性言论。四条贴子分别有 170 万、120 万、52.5 万和 40 万浏览量。 7/ 损失了 Native Market 合作起诉书提到，因为孙哥的诽谤言论，很大程度上导致潜在合作伙伴 Native Market 拒绝推进合作了。 8/ 孙宇晨和 Tron Inc 的关系比「顾问」深得多起诉书引用了 Tron Inc 自己的 SEC S-3 文件，里面承认：孙宇晨的父亲 Weike Sun 是 Tron Inc 董事，另一个董事 Zhihong Liu 是 TRON DAO 高级顾问，还有一个董事 Zi Yang 跟 Tronscan 有关。孙宇晨还替 Tron Inc 去敲了纳斯达克开市钟。 9/ 律师函的证据保全要求起诉书里要求，孙哥需要保存与 AI 聊天机器人的对话记录... 并要求关闭任何 auto-delete 设置。🤔 10/ 起诉书本身是 AI 辅助起草的起诉书的最后一页，承认这份文档使用了 AI 技术辅助生成部分内容 😂

WLFI@worldlibertyfi

2026.05.04 12:17

Today, we are filing a lawsuit against Justin Sun for defamation. Sun has launched a coordinated media smear campaign against World Liberty Financial and refused to stop even when confronted with the truth. Here's the story.🧵

0

7

23

0

轉發到社區

KK.aWSB@KKaWSB

2026.05.15 03:14

昨天的晚宴上，C位坐着一个大多数人没见过的湖南女人，她左边是库克,右边是马斯克。 40年前她还是个15岁辍学的农村打工妹。她叫周群飞，1993年22岁的她拿着两万块,在深圳的一间三室一厅里开了厂。那时她已经在深圳打了7年工。 5岁丧母。父亲做炸药出了事,眼睛瞎了,两根手指也没了。家里靠父亲编竹背篮过活。她15岁辍学,跟着舅舅南下广东。进了一家做手表玻璃的港资厂——澳亚光学。白天在流水线上磨玻璃,晚上跑去深圳大学夜校。她考了会计证、电脑操作员证、报关证、驾照。 3年后,她从流水线女工做到了厂长。厂里来了越来越多老板的亲戚,排挤她。她辞职了。辞职那天她没什么资本——就两万块,和8个一起从湖南出来的亲戚。哥哥、姐姐、嫂子、姐夫。他们租了三室一厅,既是车间,也是宿舍。她一个人跑销售。揣着一本黄页,挨家挨户拜访表壳厂。白天推销,晚上回来加班赶工,经常做到凌晨三点。就这样过了10年。 2003年,一个机会来了。摩托罗拉要做一款新手机,叫V3。要求薄到不能再薄,玻璃面板要超薄、超平、零瑕疵。外企的标准把中国所有工厂都筛掉了。她接了。她把厂里几乎全部资源压上去,陪摩托罗拉的工程师改工艺,一遍遍打样。 V3全球卖出1亿台。蓝思科技就此成立。订单从诺基亚、三星接连飞来。 2007年,又一个机会来了。乔布斯发布了第一代iPhone,要求整块屏幕用一种从没量产过的强化玻璃,弧度、厚度、透光率,每一个参数都在工业极限的边缘。苹果工程师跑遍全球,没人接。她接了。她带着团队和苹果工程师一起攻关三个月,把第一代iPhone的玻璃面板做了出来。从那以后,iPad、MacBook、Apple Watch——苹果几乎所有玻璃,都交给了她。她成了全球最大的触控玻璃供应商。后来,特斯拉来了,宝马来了,奔驰、理想都来了。汽车的中控、车窗、B柱玻璃,30家车企交给了她。再后来,人形机器人来了。关节、传感器、外壳。这就是为什么她坐在那张桌子的C位。左边是库克——苹果所有玻璃她做了18年。右边是马斯克——特斯拉的车窗、Optimus的关节,都在她手里。有人问她,这一路她到底靠什么。她没说运气,没说时代,没说勤奋。她说了两个字: "敢接。" 提问的人愣了一下。她说: "别人嫌麻烦的事,你接。别人说做不到的事,你接。摩托罗拉来的时候,中国没人敢接。苹果来的时候,全世界没人敢接。你接了,你就会了。你会了,下一个来找你的人就更大。机会从来不是'看见'的—— 机会是别人推开,你弯腰捡起来的那个东西。"

0

773

4.2K

604

轉發到社區

TechFlow 深潮｜APP 已上线@TechFlowPost

2026.05.13 06:57

上个月在新加坡，卡内基国际和平基金会组织的一场闭门会议间隙，一名中国智库代表向 Anthropic 提出请求：希望开放其最强模型 Claude Mythos 的访问权限。 Anthropic 当场拒绝。事件传回华盛顿后，白宫国家安全委员会高度警觉，将其视为中国在 AI 领域持续施压的信号。 Mythos 是 Anthropic 迄今最强模型，但不对公众开放。它在内部测试中自主发现了数千个零日漏洞，覆盖所有主流操作系统和浏览器，部分漏洞已存在长达 27 年。SWE-bench 验证评分 93.9%，前代 Opus 4.6 为 80.8%。 Anthropic 将其限定在「Project Glasswing」网络安全防御框架内，仅向约 40 家美英机构开放，合作方包括亚马逊、苹果、微软、英伟达、摩根大通等。 Anthropic 明确将中国列为「对抗性国家」（adversarial nation），Mythos 的受限发布将中国机构排除在外。现实困境是，中国众多银行、能源企业和政府机构运行的底层软件，与 Mythos 发现漏洞的那些系统高度重叠。漏洞被发现了，但中国拿不到这张防御牌。 Mythos 发布后，奇安信、深信服、三六零等中国网安上市公司股价连续多日上涨，市场比任何声明都反应得快。IDC 预测中国 AI 网络安全行业规模将从 2025 年的 15.8 亿元增长至 2030 年的 593.5 亿元，增幅超过 37 倍。与此同时，特朗普政府内部正围绕 AI 监管展开博弈。国安系统推动 AI 模型发布前由情报机构做安全评估，商务部想把评估权留在自己手里。特朗普本周访华，AI 议题预计在讨论范围内。但大西洋理事会高级主任 Melanie Hart 提醒：此前拜登时期，中方在 AI 安全对话中主要是「收集美方信息，而非认真讨论 AI 防护」。一个闭门会上的请求被拒，牵出的是一整条链：最强 AI 模型的武器化属性、中美技术脱钩的加深、以及中国关键基础设施在 AI 网安升级中被排除在外的现实。

0

8

23

0

轉發到社區

Elizabeth@Elizabeth2049_

2026.04.02 14:34

生意无处不在我看到普通人能日入1000一天的方法核心是找到供需不平衡，去鱼多的地方钓鱼 1.办理美国签证大部分人都不知道不能带手机所以在大使馆旁边开一个小店存包收费30-50人民币一次我在香港办理美国签证的时候也是寄存在一个花店好像给了当时给了100港币在北京上午大概有150个人寄存上午下午那就是一天8000人民币的收入，一个月20天能赚16万。成本租房成本、人力成本、店里两个人就够了生意2 在北京吃南门涮锅火锅正常排队要排3个小时走闲鱼找黄牛代取号一个号60-80rmb 代抢号的生意元旦一天可以卖出40-60个按平均的来算就是一天 4000人民币收入，成本为0，让美团外卖骑手去取个号，线上渠道打通，躺着赚钱。（不是鼓励黄牛生意，只讨论找到需求）

0

19

70

6

轉發到社區

Benson Sun@BensonTWN

2026.02.04 10:14

很多 Crypto 布道者覺得這個行業「賭場化」讓人失望。我反而覺得這是好事。人類最底層的需求就是「黃、賭、毒」，幾千年來從未改變。Pornhub 每個月超過 40 億次訪問，穩居全球前 15 大網站。這不是墮落，這是人性。年輕人為什麼越來越愛賭？因為傳統的路走不通了。嬰兒潮那代人，努力工作就能買車買房。現在呢？存錢二十年可能還買不起一間破公寓。ETF 年化 7-8%，對有錢人是複利，對普通人是笑話。所以 GameStop、狗狗幣、迷因幣，本質上都是同一件事：被傳統路徑拋棄的人，在尋找不對稱的翻身機會。 Crypto 恰好提供了這個機會。越合規的市場，越難暴富。因為合規的本質是保護投資人，而保護投資人的代價，就是讓聰明人更難賺錢。 Crypto 弱監管的環境裡，技術強、運氣好的人，可以贏走技術差、運氣差的人的錢。這是風險，也是機會。有人說這很墮落。那我問你：抖音讓你刷兩小時沒營養短影音，手遊讓你課金課到傾家蕩產，知識付費讓你買一堆課從來沒看完，這些產業就很高尚嗎？說到底都是把人性弱點變現。Crypto 只是更誠實，直接跟錢掛鉤。與其抱怨，不如擁抱變化。接受 Crypto 是個大賭場的這個事實，然後去找到你的 edge。重塑生產力曲線、改變世界，這個任務交給 AI。 Crypto 就用來承接人類幾千年來最底層的原始需求：賭。賭場化不是終點，是起點。後面可以玩的東西，還多得很。

0

41

377

45

轉發到社區

fin@fi56622380

2026.04.16 07:21

今天芯片圈最大的新闻，莫过于Gerard在创立Nuvia CPU被高通收购五年之后，重新出发，新创立了ARM CPU公司，名字也跟之前非常像，叫Nuvacore 现在这个时间点做数据中心CPU，确实是赶上了CPU十年来最好的时代: AI agent带来CPU短缺潮已经经隐隐浮现，AWS多个客户都提出要包揽所有Graviton ARM CPU产能 ------------ 这个消息对硅谷的芯片打工人吸引力是巨大的，Nuvacore这次的阵容都是功成名就的明星阵容，以前Nuvia创始团队重新集合，拿了红衫的投资，做面向 AI 基础设施/agentic computing 的通用ARM CPU。当年还是一个尚未完全被验证的大方向都能大获成功，而现在ARM CPU服务器正在风口浪尖上，前景和想象力和2019年Nuvia比起来大了太多了上一次Gerard把Google，苹果platform architecture组的架构大佬挖了好多过去，这次的号召力只会强得多，240m的融资，已经验证过的路径和创始团队，肉眼可见的下一个增长风口，一定会让Nuvacore成为湾区最热门最受追捧的芯片startup，没有之一。毕竟这是一个肉眼可见能财富自由而且风险收益比极好的机会 ---------- 遥想当年Nuvia第一代CPU的发布赶上苹果M2时代，还是挺震撼的，Nuvia让高通在一年的时间CPU跑分进步了整整三代，单核跑分从2300变成3200，竟然超过了苹果M2 max一大截可惜Nuvia Phoenix core从发布到最后上市拖了太久太久，中间苹果把牙膏挤爆了连着上市了M3/M4，于是Nuvia CPU上市之后从跟M2比较变成了跟M4比较，从期待中的C位变成背景板了当年Nuvia的眼光非常超前，在2019年ARM CPU服务器市场占有率几乎为零的情况下，就是想从零开始打通这个市场，2021年被高通14亿美元收购之后，高通也给了无限的资源支持，扩招力度很大，给的薪水都是市面上最高一档的。可惜大环境在2022年恶化的很快，加上高通的管理层战略眼光实在太差太短视，在业界ARM服务器生态都开始有起色的时候，为了股价节约开支，竟然再一次把自家的Nuvia CPU 服务器团队解散了（算上2015年已经解散过一次ARM服务器团队）直到2025年，Nvidia的Grace ARM CPU都已经发布四年了，Vera ARM CPU都已经自研好久了，Amazon的ARM CPU Graviton都快占据CPU服务器新出货的50%了，高通才后知后觉谨慎的重启ARM服务器项目所以这次Gerard从高通的高管位置把之前的创始团队拉出来自己干，可能是因为高通高层战略眼光实在太差屡屡错过机会，上次Nuvia想做ARM服务器，高通的承诺也因为大环境恶化没做数，结果被收购之后被高通取消了项目直接改做了laptop芯片和手机芯片加上高通今年在手机销量上因为内存和存储历史级的巨额涨价，可以预见要受到重创(市场萎缩30%)，能拿出的扩张预算有限，在高通能拿到的资源是受到掣肘的而在创业公司里比在 Qualcomm 这种大平台里更容易拿到足够快的决策速度、团队纯度、产品定义权和资本叙事，于是选择在窗口已经被验证时重新集结老班底但更可能因为，AI时代的CPU前景想象力真的太广阔了，完全值得重新投入一次，不是Gerard变了，而是外部市场变了 ------------------------ 进入2025年之后，AI agent的出现，隐隐让CPU重新变成了瓶颈 CPU服务器重新步入增长轨道，而且潜力巨大，有好几个因素： 1. 随着推理时代的到来，GPU演化到针对推理的系统级新架构，CPU 是永远在忙的总指挥orchestrator, 因为要追求token throughput，所以异构计算阶段变多 + 批处理数量batch越来越大，scheduling/routing/data flow复杂度变高，对orchestration要求也变高所以在系统级异构推理架构里，AI加速器和GPU在CPU：GPU的配比上，也变得更为激进，从以前的1：4到Grace Blackwell的1：2，以后是很有希望达到1：1的比例的。Google TPU配Axion，Amazon Tranium配Graviton，Nvidia Rubin配自家Vera CPU 这条在我的去年11月半导体年终回顾写过，基本上在2026年成为了共识，虽然这部分主要是各家AI 芯片自研，并不是纯粹的CPU服务器，其实不算是外部CPU服务器的机会 2. 也是同一篇年终回顾里写到的：从CPU视角去看agentic workload，routing和工具处理都在CPU上，如果把常用的agentic框架做profiling，比如SWE-Agent, LangChain, Toolformer，CPU最长可以占到90%的E2E端到端延迟，throughput瓶颈也更多的卡在CPU，CPU甚至能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情，Agent管理很多个CPU，再加上agent经常要开sandbox，很可能会成就CPU需求的新一波回暖现在回看去年写的这个逻辑，潜力是非常大的。但其实年初可能并没有很大规模发生，年初的CPU增长和各家渲染的CPU短缺潮和这个逻辑暂时关系不大，更多可能是前几年的capex投入GPU的比例太大，造成传统CPU服务器投入不够，所以需求上升是一个回补之前传统服务器投入不够的部分。但到了下半年甚至2027，agent会开始更广泛的铺开，比如智能导购和客服，已经占到了Amazon去年年底100万CPU采购的相当部分比例，这部分的增长是很快的前两个逻辑，基本上是今年主流叙事在讲CPU潜力的共识，但是我的感悟是，还有另外两个逻辑被低估了： 3. 造成CPU服务器潜力更大，更长线的主逻辑，可能和agent本身没有直接关系，而是code agent带来的副产物： coding门槛和速度的大幅优化，让“构建软件 + 连接软件 + 调用软件 + 自动化软件”这整件事便宜了一个数量级，Jevons 悖论在software供给端的展开，最终把世界推向更高的软件密度和 API 密度，这直接带来了CPU传统workload的线性上升从2025年年底开始，coding agent迎来了质变，Claude code迎来了爆发式增长，三个月的token营收增长了三倍，那么导致的下一步必然是Code量的十倍增长,以及App数量的巨量增长即便是在大厂，每天1m token消耗只能算是个平均水平，人均coding量必然是翻倍的（小厂就是翻十倍了），code供给量暴增，不会只停留在 repo 里，而会逐步变成更多长期运行的软件资产，长期存活的feature变多，product变多，microservice变多，API变多长线来看，App/API所有的生产成本和生产周期会变成原来的10%，API实现极大富足。那么API的Usage就会大量的上升,这就会造成传统CPU Workload或者说CPU Seconds大量的上升，这甚至和agentic没有直接关系时间维度上，这个逻辑并不是短期性质，Claude code的爆炸是这几个月刚发生的事情，那么产品上线，microservice，api上线，可能都要向后延迟。当软件变便宜，社会不会少用软件，只会把更多事情软件化所以也许到下半年甚至更久才会看到，传统cpu云的需求又莫名其妙增加了，表面上看，甚至和AI agent没有直接关系 4. CPU是一个技术上很难通缩的东西，不像内存/存储有很多压缩算法会降低单任务对存储的用量，CPU workload增长转化成硬件需求增长是实打实的比如说kvcache其实每年都有各种压缩技术出现，老的压缩技术比如kvcache的multi-head它会share一个head（GQV），这个大概会相当于4倍的压缩，再比如说去年turboquant这个技术也会新带来几倍的压缩。然后加上数据精度从FP16到现在的下一步要到FP4，精度的下降都会带来kvcache的压缩，从而带来存储方面的技术通缩。但CPU是一个技术层面上通缩量很小的事情，目前任何的agentic的cpu workload（CPU seconds）增长都是硬件需求增长，它通缩的方面只有每年每一代跑分提高的10%到15%。如果说另外通缩因素，比如云的五倍六倍的超卖会不会影响？不会，因为它一直是超卖的，所以说超卖/利用率低这个CPU技术通缩的因素不会继续扩大了，每个增长的CPU seconds都是不怎么带打折的硬件线性增长 ARM的指引是CPU的供需缺口可能会到30%以上，这几个原因的叠加，加上AI服务器对CPU服务器产能和订单的挤压，可能会让缺口更大，各个hyperscaler的反应可能是会滞后的 ------------------ CPU整体需求潜力增长的同时，ARM服务器CPU也赶上了历史上最好的时代： Hyperscaler为了节省成本，接近50%的新增传统server CPU都是ARM，Google的Axion，Amazon的Graviton，Microsoft的Cobolt，Graviton甚至2026年的产能已经全部卖完，瓶颈成了产能 Google TPU配Axion，Amazon Tranium配Graviton，Nvidia Rubin配自家Vera CPU，这部分CPU为什么会集体转向ARM，除了成本因素之外，也因为推理系统为了追求token throughput，batch越来越高越做越复杂，自研ARM CPU以及系统性软件硬件的co-design会更方便，比如Nvidia是Dynamo去控制Vera和Rubin之间的协同 Nuvacore的规划上来看，不仅仅满足于做IP，也要做成品，因为在招聘网站上出现了validation engineer的职位但是这次Nuvacore面临的挑战也不小：起步太晚了，无论是市场上，还是技术上，竞争都激烈了很多。CPU服务器和七年前比，已经复杂了很多，已经不再是单片CPU的竞争，而是rack系统级别的复杂度现在开始做2028~2029年上市的CPU，要做到rack级别有竞争力，规模要大很多，基本上要几十个chiplet，500+个core拼起来，还要考虑如何适配AI agentic workload，工作量比以前明显要大的多，对一个startup的挑战比七年前也大得多 ---------------- 上次Nuvia在成立两年之后成功的以14亿美元出售，这次市场热度比五年前高了一个数量级，Nuvacore之后的路会怎么走呢？如果是被收购路线，其实买家可能比五年前比并没有更多，这五年里，Google有了Axion，微软有了Cobalt，Amazon有了Graviton，Nvidia自研的Vera CPU已经成型，连ARM也打破了35年来只做IP的常规，开始做自己的AGI CPU芯片最有可能的是Softbank系，softbank已经在ARM CPU服务器生态上布局深耕了多年，65亿美元收购了Ampere，再收购Nuvacore是很正常的事情，这个市场想象力足够大其他的选择也可能是Meta，因为几家互联网公司里，只有Meta的silicon house没有稳定可靠的CPU服务器，有限的资源在MTIA都做AI加速器去了但是Meta的问题在于稳定性极低，决策每个月都在变化，注意力非常短期化，项目随时取消，对Nuvacore来说完全无法兑现潜力，是一个非常糟糕的买家但总体来说，Nuvacore的选择肯定比五年前宽了太多了，对ARM CPU服务器的潜力大家的共识都很明确，融资的难度要小很多，自己运营扩张起来，阻力比以前小很多，合作伙伴的配合程度上也因为未来预期，会容易很多完全可以自己做大到比Nuvia当年更大的规模再考虑出路，根本不着急卖

0

27

484

96

轉發到社區

土澳大狮兄BroLeon | 🔶BNB |@BroLeon

2026.03.11 02:50

《从福布斯富豪榜看财富流动趋势》今天关于 @cz_binance 被杀猪榜放进前20的消息又满天飞了，按之前的调性大概率等CZ睡醒又要开始辟谣，哈哈。不想露富是华人常见心态，但从我等吃瓜群众看，作为Crypto唯一杀入前列的代表，还是乐得看到CZ给Crypto挣了脸的。顺便分析了一下这次的富豪榜比例情况： ▶️科技（互联网 / AI / 软件 / 芯片）约35–40% 代表：Elon Musk、Jeff Bezos、Mark Zuckerberg ▶️金融与投资约15–20% 代表：Warren Buffett、对冲基金、PE ▶️零售 / 奢侈品 / 消费约10–15% ▶️制造 / 工业约10% ▶️重工业、汽车、制造能源 / 矿业约5–8% ▶️石油、天然气房地产约5–7% 可以看出财富结构正在发生代际变化，世界在不知不觉间已经通过财富流向告诉大家是如何变迁的。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~ 我摘出几个有意思的地方： 1、AI正在成为新的财富发动机。榜单前列里很多财富增长都来自 AI 或 AI相关科技公司，Musk，Larry Page，老黄等人财富增长很大程度来自 AI浪潮带动的科技股上涨。例如 Alphabet 股价上涨直接推动 Page 和 Brin 财富大幅增加。过去十年最赚钱的是移动互联网，未来十年最赚钱的可能是AI基础设施。 2、超级富豪财富增长速度极端惊人榜单还有一个很震撼的数据：全球亿万富豪数量已经超过 3400人，总财富达到约20万亿美元，而且仍在持续增长。更夸张的是：全球最富的10个人一年财富增加接近6000亿美元。财富向极少数人快速集中的速度进一步加快了，科幻小说里一个人掌握全球99%财富的故事好像真有可能发生？ 3、财富结构正在发生代际变化老钱逐渐被科技钱取代，比如奢侈品巨头Bernard Arnault 逐渐被科技创始人压制。现在的超级富豪基本都是科技公司创始人or控制人，平台型企业掌控者而不是传统的：地产石油制造业 4、超级富豪“百亿俱乐部”正在爆炸增长 centibillionaire（千亿美元富豪）数量暴增。全球已经有 18位财富超过1000亿美元的人，这个群体的总财富接近 3.6万亿美元这在十年前几乎是不可想象的。很多机构都预测全球第一位 trillionaire（万亿富豪）可能在2030年前出现。 ~~~~~~~~~~~~~~~~~~~~~~~` 此外，国人比较熟悉和感兴趣的富豪情况： 1、卖水的赢了搞互联网的，首富还是“水王” 钟睒睒（农夫山泉）依然稳坐中国首富。在全球互联网寒冬和电商内卷下，水王靠着刚需和极致的现金流控制力，依然压过张一鸣和马化腾。 2、老黄代表华人之光席卷全球随着AI浪潮，英伟达（Nvidia）CEO黄仁勋身价疯涨，目前已进入全球前10（甚至前8）。对于中文读者来说，他是全球科技圈最受瞩目的华人面孔，也是AI时代的绝对教父。 3、“出海三杰”的进击：赚全球的钱张一鸣（TikTok）、黄峥（拼多多/Temu）、许仰天（Shein）。这三位是典型的“中国供应链+全球化运营”的赢家，反映了中国互联网出海的强大生命力。 4、房地产时代的终结，新能源/半导体的崛起曾经榜单前列的王健林、杨惠妍等地产巨头排名大幅缩水甚至掉队。取而代之的是雷军（小米造车成功）、曾毓群（宁德时代）。资源型财富已经被科技型财富压过去了。 ~~~~~~~~~~~~~~~~~~~~ 说回Crypto，CZ 的财富变化，本质上是整个加密市场周期的一个晴雨表。 Forbes 在计算 CZ 财富时主要参考是Binance股权估值，而非 $BNB 币价和其他链上资产。现在已经是加密熊市， $BNB 价格从顶峰已经跌落50%，但CZ的身家反而上涨。我问了一下AI，这可能与熊市了反而头部交易所的市场份额会上升有关。在2018熊市、2022熊市、现在这个阶段，Binance 的市场份额反而往往会上升，因为原因很简单：熊市会淘汰很多熬不下去的平台。头部交易所反而会趁机吸收流动性用户，进而提高了市场份额。表单上其实还有其他Crypto富豪，比如 Coinbase的 @brian_armstrong (100-130亿，大约200名）， @saylor 老爷子（70-100亿美元，大约300-400名区间）。但Forbes评估时候不看链上财富，所以Crypto富豪的资产往往是被低估的。希望未来有更多加密富豪上榜吧，给咱们行业也长长脸。最后附上福布斯榜单原链接，感兴趣的可以自己再去挖掘一下：

0

50

275

28

轉發到社區

瓜哥@liguagua

2024.09.18 02:31

财富自由终局之战：ena第二季大赚64w刀在瓜哥看来，ena分为3个阶段：第1阶段，能算清楚项目收益率。 4月份，第二季刚启动的时候，那时候的收益率是很不明确的。瓜哥那时候也没咋搞，强制锁仓的usde，直接morpho上借贷撸出来了。直到6月中，usde tvl稳定在35亿刀附近，每天新增积分900亿，可以估算最终总积分是48640亿分（6月15日）+900*77=12w亿积分，瓜哥当时按照4%空投来计算套保的（之所以不是5%，这个后面说），对应1亿积分5000个代币。当时币价0.9刀，最终对应40%年化。瓜哥当时参与资金160w刀左右，把所有预期产出25w个，都在均价0.81刀套保了。第2阶段，做空ena-做多yt组合能够提供50%+收益率。 6月底，当币价来到0.55，以1亿积分5000个代币作为转化计算标准，做空ena-做多yt开始提供了50%左右的利润率。这个利差，伴随着币价下跌后的大反弹，而扩大，最高到7月底8月初来到了80%附近。这个阶段，瓜哥在7月+8月的yt上合计投入接近80w刀，有一部分随着币价超额下跌，而提前平仓。第3阶段，8月份，pendle上只有9月及以后的yt。这时候有个计算技巧，如果把9月 10月yt在9.2之前，以进场apy卖掉，那么可以实现80%的收益率！所以瓜哥在10月susde yt上投入25w刀，在apy 12%附近进场。但8月底只在apy 10.7%卖掉，落袋收益率18.88%（这块也包括瓜哥当时另一个隐含预期，月初susde分红低，所以yt也低，瓜哥想赌一把月底分红能回升，那yt可能也能赚了。结果失败，分红一直维持在4%）（以上收益率都是按照4%空投+实时套保价格算的） 3个阶段，瓜哥分散了6个账户，一共拿到409.4亿积分，拿到代币264w个然后说说几个漏财的操作： 1. 瓜哥之所以按照4%空投预期来套保，而不是5%，主要因为第一季的空投，名义5%，实际没有发到，官方对这个问题装死。所以瓜哥就保守了。最终少套保了60w个，漏财18w刀 2. 在0.326提前解套保，后续回补价格低，漏财12w刀。 3. 阶段3里，10月的yt在8月底平仓，如果拿到9.3 9.4，那么是可以原价平仓的，这块少挣3w多刀。其实这一点，如果做个预期：第3季5%空投+继续有锁仓要求，那么yt就依然是有需求的，那就不需要在8月底贱卖。 4. 套保3个月，资金费支出合计5.3w刀。瓜哥对财富没有特别大的需求，以现在的身家，现在的房价，能200平的房子基本上随便挑了，黑珍珠米其林自由，茅台十四代自由，出行自由，我已经满足了。当然也有更好的房子，比如帝景苑恒禾七尚，这块随缘，不会主动追求了。以后还会聊操作，但不会公开贴盈利数字了。

0

48

234

46

轉發到社區

陈剑Jason@jason_chen998

2026.05.15 01:32

这次美国访华晚宴坐在马斯克和库克中间C位最亮眼的，是蓝思科技创始人周群飞，从农村打工妹到中国女首富，完全没有任何背景全靠自己白手起家。她出生在湖南的一个小村庄，5岁时母亲去世，父亲也因工伤残疾双目失明，家徒四壁，16岁交不起学费被迫辍学去广东打工，在一家工厂流水线打磨玻璃，白天干活，晚上疯狂自学，考了会计证、电脑操作证等技能证书，就这样过了几年，她拿着靠打工攒的2万块，拉上哥哥姐姐、嫂子姐夫等8个亲戚，在深圳开了一家小作坊，做手表玻璃加工，她一个人修机器、跑销售，就这样又干了4年。到了2000年后手机行业开始大规模发展，一次偶然的机会她的手表玻璃厂接到了TCL手机屏幕的订单，她看到了手机玻璃市场的巨大潜力，于是迅速成立了蓝思科技，专门负责手机玻璃的生产研发和销售，一开始只做国产手机和山寨机，但是直到有一次想谈下摩托罗拉的订单，但外企的质量要求非常严格，她赌上几乎全部的资源配合摩托罗拉，拿下了全球销售超过1亿台的V3订单，直接把蓝思科技推到了行业领先位置，随后顺利拿下诺基亚、三星等外企。关键的转折点又一次出现在了2007年，当时乔布斯发布初代iPhone，彻底把手机往全玻璃触屏的方向变革，乔布斯那变态的工艺要求全球都找不到符合的厂商，周群飞敏锐的意识到这又是一个巨大的机会，于是带领团队和苹果工程师联合攻关了3个月，突破关键工艺，成功量产了第一代iPhone玻璃面板，从此拿下苹果长期合同，后续的iPad、MacBook等几乎所有苹果设备全部都交给了蓝思科技，也帮助蓝思科技在触摸玻璃面板领域成为全区最大公司。这也是为什么她能坐在库克旁边，那为什么马斯克也坐在她旁边呢？蓝思科技在玻璃面板干到全球第一后，开始往更加多元的智能化设备发展，包括汽车座舱和机器人，其中汽车领域包括车窗、中控等已经拿下了特斯拉、宝马、奔驰、理想等30家车企，机器人领域则主要负责关节、传感器等部件，这些都和马斯克的业务有深度重合。一个15岁辍学只有初中文凭的女生，从湖南农村出来白手起家成为中国女首富，40年后进入中美会谈，坐在了马斯克和库和中间，这就是周群飞的故事。

0

1.2K

28.7K

8K

轉發到社區