注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 AI属性祭り2026
AI属性祭り2026 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 AI属性祭り2026 的推特
现在是ai叙事没问题,act作为币安最小带ai属性的现货也没问题,他有他应有的流动性价值。但是,ai meme的天花板真的很高嘛?我们已经有doge pepe了,为什么非要ai meme。就像我们需要btc meme吗
显示更多
你说 act goat fart 这些 ai meme ,有啥意思?没意思,只要是 meme 就都很没意思。 比如 doge 和 shib floki这些 meme 有啥意思?图好看?还是运营的好?社区强大? 都不是,命好。 在恰当的时间,被选中罢了。 所以,流水的 ai agent,铁打的 ai meme 头部标的。 我不认为这个判断是错的。
显示更多
0
57
132
9
转发到社区
当前A股市场行情与后续轮动逻辑(随记) 当前A股无外部战争风险冲击,不会出现极速暴跌深V行情,市场主流走势为资金耗尽后的缓慢阴跌,整体呈现极致结构性分化格局。目前除芯片、算力设备板块走出结构性牛市外,其余多数板块陷入结构性熊市,此前慢牛的大银行板块已见顶回落,以茅台为代表的2021年核心优质资产,更是在本轮芯片牛市中持续走弱。 本轮行情属于典型的场内存量资金博弈,无大规模场外增量资金入场。芯片、算力板块持续走强形成强烈资金抽水效应,不断吸走市场存量资金,导致其余弱势板块持续承压。同时本轮芯片算力行情存在阶段性上限,大概率在今年九、十月彻底见顶,板块持续大涨会催生大量套现筹码、消耗市场资金,行情反转是必然趋势,因此当前不宜追高参与。 后续市场将延续“强者转弱、弱者轮动”的格局,芯片算力炒作退潮后,当前低位走熊的标的将迎来反转机会,部分弱势股或短暂补跌后开启修复,成为市场资金的避险方向。 中长期行情依旧围绕AI科技核心主线展开,炒作节奏将从当前上游算力设备,逐步向下游延伸至新能源、AI终端应用领域。能源端核心聚焦太阳能与风电,太阳能发电成本已极具优势、资源储备充足,是未来核心方向,其规模化发展依托火电、水电、核电调峰,当前高压电网板块炒作已处于高位,后续将依次轮动太阳能板(隆基绿能)、太阳能电站(华电新能、三峡新能、龙源电力)板块。 AI终端应用是下一阶段重点,锂电板块可能贯穿,另外海康威视、顺丰控股、东方财富、比亚迪、美的集团等标的,具备扎实的AI科技属性与终端应用场景,拥有长期成长和国际化空间。受市场短线炒作风格影响,这类优质标的暂被低估,待芯片算力热点彻底熄火后,有望率先迎来估值反转与行情修复。
显示更多
AI 股已进入利好充分兑现期,空间有限,赔率不佳。 比特币作为人类史上唯一具备刚性稀缺+数字属性+超主权货币特征的资产,其价值被严重低估。
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
显示更多
0
61
1K
303
转发到社区
AI狂飙带来的新分配制度越来越近,K型分化的未来财政产业政策风向。今天韩股大跌的一个最主要原因就是韩国总统府政策室长提出将AI产业超额利润部分返还全体国民的“公民红利”构想。他认为韩国正从循环型出口经济向技术垄断型经济结构转型,但AI产业超额利润天然集中于少数群体,若不加以制度设计将加剧经济的“K型分化”和国内贫富差距。 再加上三星电子工会要求要求员工从AI利润中获得更大份额,否则威胁5月21日起罢工。今天也是三星电子与其工会进入由政府斡旋的高风险薪资谈判的最后一天。更引发市场担忧。 其实金容范的言论更值得关注,这不仅是他个人的表态,也表明韩国政府越来越将AI视为国家基础设施,而不仅仅是另一种科技趋势。现在全球的经济学家和政治家们越来越多地提醒人们注意,AI技术的出现可能会加剧贫富差距。 金容范在文章里援引挪威主权财富基金作为参照——挪威在1990年代将石油收益注入主权基金,并按财政原则将运营收益回馈社会,将资源繁荣转化为长期社会资产。 他的核心逻辑是:AI基础设施时代的果实,并非少数企业单独创造的成果,而是“源于全体国民半个世纪共同积累的产业基础”。因此,这些果实的一部分应当结构性地返还给全体国民 很巧的是,我引用的推文在2月下旬也有聊过这一点:AI的快速发展一定会带来社会制度、治理结构的变化、而这些变化也会导致新的分配制度。有潜力推动社会向挪威或者沙特模式的分配主义制度转型。以韩国为例,现在存储产业已经成了战略资源资产,何尝不是另外一种形式的类石油的关键资产。 AI时代的超额利润,属性上是集中的。AI产业链上龙头企业的股东、核心工程师、核心资产持有者——这些已经接触到生产性资产的群体,极有可能通过市场机制获得巨大收益。而相当一部分中间阶层,可能只能享受到间接效果。国家变富了,但财富的分布不会自动扩散。 这就需要政府在产业财政政策上重新规划,考虑中间塌陷地到的民众。金容范提到的一些措施可能就是未来的分配形式的主要内容之一:“国民红利目前仅是原则,而非具体政策。核心不是某个具体项目,而是原则。至于最终形式可能:青年创业资产账户、农村基本收入、艺术家支持、老龄年金强化,或AI时代转型教育账户等” 当然这现在应该还是一个开放的问题
显示更多
1、稳态被打破,一定会有新的稳态诞生。新稳态的必然性,是人类社会发展的规律,这符合经济史上的“创造性破坏”(creativedestruction)理论。技术变革摧毁旧结构,但释放资源创新新平衡。例如农业机械化取代农民,却催生城市化和现代服务业。AI可能类似:解放“双手和大脑”后,人类转向高价值活动、高情绪活动。 2、人们只看到失业和混乱,而忽略了长远创新如火车、飞机带来的繁荣如太空基础设施(利用AI降低发射成本、优化计算)、生物永生研究(AI加速药物发现)。工业革命初期(18-19世纪),蒸汽机确实引发大规模失业(如纺织工人抗议),社会动荡(如卢德派破坏机器),但最终推动了生产力爆炸。从蒸汽到电力,再到铁路、汽车、飞机,这些创新创造了新产业、新职位(如工程师、飞行员),整体提升了人类福祉。历史数据显示,技术革命虽延迟显现效益(如蒸汽机需数十年才显著提升生产力),但总带来净正面:例如,数字革命(计算机、互联网)初期也担忧失业,却创造了软件开发、电商等百万职位。 当前AI发展(如代理工具、生成模型)正重演这一模式:2025-2026年已见生产力提升,创业门槛降低(AI工具让启动成本降70-80%),新企业涌现,新的职位也会诞生。而且让个体的能力和效率得到了极大地提升和扩展。 3、AI对就业岗位的冲击,本质是对人类生产属性的挤压。人类需要对自己的功能再定位,当人不主要负责生产甚至不需要生产时,“有用”将变得廉价,人类的稀缺性将转向有趣:生产属性压缩 → 分配结构重构 → 消费属性释放 →人类价值重估。 如果人类劳动时间下降,空闲时间上升,人们会把时间投入到娱乐、消费、内容、游戏、购物等领域。AI不会把所有摩擦和消费都替代掉,否则人类就会“变成植物人”。这里的逻辑是:时间是会被重新分配的,而不是被消灭的。劳动者从重复任务转向高价值活动(如创意或监督AI) 这不是末日,而是重构的过渡期和阵痛期。 4、AI带来生产力和生产效率的极大提升,人类很有可能进入充裕时代。生产力大幅度提升带来的通缩(价格下降)实际上提升购买力,让消费者更富裕。Citrini提到的中介崩塌,实则是资金从中介(rent-seekers)转移到终端用户,推动新消费循环。例如,房地产佣金从2.5-3%降至1%以下,不是破坏市场,而是让卖家净收入增加,买家节省用于装修或家具等新支出。类似地,DoorDash费率下降受益于餐厅、司机和消费者,交易量激增(如Mastercard案例:费率降但收入最终创新高)。历史证明,技术通缩(如计算机革命)总是带来增长,而非崩溃 5、生产力决定生产关系,AI的快速发展,一定会带来整个社会制度、治理结构的变化。这些变化进而导致出现新的分配制度。有潜力推动社会向挪威(以主权财富基金为基础的福利国家)和沙特(资源租金分配模式)式的分配主义制度转型。政府可以通过宏观政策进行对冲,比如财政转移支付、福利体系强化等。 6、当然不是说前方全是坦途,巨大的阵痛期不可避免。前方有坦途,但必须穿越荆棘,这是清醒的现实主义。我们看到最终长期丰裕,但历史也都反复证明,转型过程充满痛苦、颠覆和不平等放大。不能因为“最终繁荣”而忽略短期/中期代价。 生产力提升收益先流向资本和高技能者(科技巨头、AI专家),导致“伟大脱钩”(great decoupling):工资停滞、生产力暴涨。低技能/中技能工人受冲击最大,收入差距拉大,也已引发社会不满和动荡。 也就是倒逼了第5点说到的,政府在政策上必然会做出调整。大规模再培训、失业保险扩展、AI税收资助UBI或主权政策,如挪威主权基金模式。
显示更多
0
33
107
17
转发到社区
重新审视 Token (词元)的属性 TLDR: 之前我也一度觉得是大宗商品/资产 甚至还设想过相关的交易和定价逻辑 也看到不少人提过Token期货,交易所之类 但现在我倾向它只是一种服务,没必要过度金融化 毕竟它没有办法脱离AI推理单独存在,无法被提前生产出来或预先被囤积。但换个角度看,是服务,就天然是分层的、多元的,不同的人有不同的需求,这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。 在这浪潮中,红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑: 1、Token (词元)经济从何而来? 首先它是AI训练转向AI推理的产物, 这是理解 Token 商业模式的基础。 过去模型训练时代,主要是卖算力时间。为什么?因为训练是持续性的大工程,需要大量算力协同工作。这种规模的投入,有资本的大厂基本都会选择自购,毕竟可控性最强,但对于没有能力一次性投入大量资金的团队来说,出于对稳定性的要求,也会倾向选择租赁模式,包下一整段时间的独占使用权,榨干这段时间内算力的所有价值,是一种占用的逻辑。 但随着主流大模型开始进入商用阶段,AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题,这些本质上都是在跑推理,每一次调用,都在为你做一次推理和计算。 而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业,仍然会采用租赁或自购的模式来跑推理,但对于广大中小开发者和应用方来说,他们对算力独占性的要求并不高,因而额外衍生出了按消耗计费的模式,这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的,衡量每次计算消耗了多少资源的那个单位,你付的钱,就是对这次计算的补偿,本质是消耗逻辑。 所以训练和推理是完全不同的生意形态: 训练时代,商业模式是卖 GPU 时间。 推理时代,商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性? 卖Token (词元),就是卖服务! Token (词元) 经济,本质是服务经济! 为什么? 一个比较直接的原因是 Token (词元)不能被预先生产出来,而是产出后就被消耗掉了,并作为衡量你这次推理服务所消耗资源的参考,来给你计费。 且Token (词元) 的一些特性,也和大宗商品的逻辑不像: - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化 你在Claude的100万Token额度,和你在Minimax的100万Token额度,两者本身是没有可比性的,模型不同,性能不同,定价完全可以不一样。 而大家愿意接受价格差异的原因,也是因为 Token (词元) 本质上计量了一种非标准化的服务,而不同用户对服务的诉求是不同的,有的人看重性能,所以愿意支付溢价,有的人看重成本控制,所以觉得国产开源模型也够用了。 而整个模型市场占有率,并没有出现几家独大,本身也是其服务属性的体现。如果 Token (词元) 是资产,那资产的流动性、网络效应,一定会引发所有资源最终向一个市场集中,形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务,而服务市场天然是分层的、多元的,不同的服务商满足不同的需求,所以才构成了 AI 经济百花齐放的基础。 我想通这点后,就不再纠结模型厂商只有哪家笑到最后了。 因为未来必将是多模型共存、多层级并行的格局,Token(词元)也将会被计入到企业的会计成本之中,并反映到企业的产品和服务之中。 比较值得关注的一点是,AI时代Token所代表的服务经济和传统的人力服务经济,成本曲线可能是完全反过来的。由人所提供的服务,长期要求的是报酬上升,这也是为什么服务业占比高的经济体,服务更贵。但 Token 服务恰恰相反,价格长期只会下降,当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作,这部分成本不但不会随时间上升,反而会持续走低。 这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖? - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1)闭源模型厂商:直营为主,分销为辅 最直接的模式。OpenAI 卖 GPT 的 Token,Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里,产品和渠道都是自己的,跟品牌直营店一个逻辑。当然作为最顶级的模型,难免会被接入像一些API中转站,或者Open Router这样的大模型聚合平台被动分销。 2)开源模型厂商:开源也挺赚钱的 开源模型谁都可以拿去用,很多人不想自己本地跑,因此催生出了一批开源模型托管商,他们可以帮你跑模型,并按 Token 收费。但这就引出一个问题:Token 的钱都让模型托管商这些中间商赚了,开源模型的开发者自己怎么赚钱?这一点,至少中国的开源模型厂商,走的很灵活。 像Minimax,Kimi,Zhipu,它们都有自有的 API 直售,更多面向开发者群体,并且也都有自己的 Coding Plan 订阅包,把按 token 计费玩出了订阅制,完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满,各自推出了品牌化的 Claw 产品,帮用户把 OpenClaw 部署好,底层跑自家模型,Token 消耗从自家 API 走。 3)开源模型托管商:帮别人跑模型,赚差价 对于那些没有能力或意愿自己卖 Token 的开源模型来说,托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费: - Together AI / Fireworks:自有 GPU 集群 + 极致推理优化,核心竞争力是翻台率,同样的卡单位时间能吐出更多 Token。 - Groq:自研 LPU 推理专用芯片,不用传统 GPU,核心竞争力是极致速度,跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI:全球 300+ 边缘节点,跑 Llama、Mistral、Qwen,最近还加了智谱 GLM 和 Kimi,核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台,跑 Llama、Mistral 等主流开源模型,核心竞争力是客户的数据和基础设施已经在这些云上了,迁移成本低 4)大模型聚合器:一个入口管所有模型 闭源和开源的大模型越来越多,而不同场景适合不同模型,不同模型的优劣势不同,对开发者来说,一个个去接不同厂商和托管商的 API,管理起来很痛苦。于是催生了 OpenRouter 这类聚合器,可以接几十个模型,开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利,各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增,前十名 Token 消耗量中,中国模型占了 61%,前五有四个是中国的。 而围绕这条 Token (词元) 产业链,也衍生出了一些其他的参与者和新需求: 第一是一些推理优化引擎,vLLM、SGLang 这些开源项目,在大家对效率极致追求的当下,通过对硬件算子层面(更高效地利用 GPU 计算单元,减少内存碎片和带宽瓶颈)以及 LLM 算法层面(让多个请求共享已经算过的内容,更聪明地管理显存)的优化,提升同一张卡在同一时间内的 Token 吞吐量。 它们自己不面向终端用户收费,但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者,会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。 第二是对Token消耗的优化需求,当 Token 消耗逐渐常态化,自然就会有人开始琢磨怎么省钱,也有不少人早就抱怨OpenClaw高昂的Token消耗,那么,帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品,就很有市场了。 ---------------------------- 4、AI经济时代,真正的机会在哪? 我觉得 Token 经济的红利,属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1)如果你有能力,就做一个模型,哪怕是微调的 你不需要从头训一个 GPT,在开源模型基础上针对某个垂直场景做微调,只要在某个细分领域效果够好,就有人愿意按 Token 付费调用你的模型。前面说了,Token 是服务,服务市场天然分层,通用大模型吃不掉所有场景,垂直微调的模型在自己的领地里反而更有定价权。 2)做一个新时代的产品,开放 API 你的产品底层消耗 Token,但你的产品本身也可以对外输出能力,你开放 API,让别的开发者和 Agent 来调用。你买入底层模型的 Token,加上你的产品逻辑和数据,产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3)写 Skill,做 Agent 每一个被广泛使用的 Skill 和 Agent,背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用,你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token,但你是这条产业链上的分销渠道。 而不管你选哪条路, 你的护城河在我看来最终都会归结为三样东西: 算力、算法、数据。 算力影响你的吞吐量 算法影响你的效率和成本 数据决定你是不是不可替代
显示更多
铭文龙头概念一览 BTC铭文龙头: $ORDI 金融属性龙头: $SATS 动物MEME龙头: $RATS AI 概念龙头: $AINN 矿工概念龙头: $NEWU L2 龙头: #Merlin# Depin概念龙头: $DEPD 应用铭文龙头: $ROUP 潮玩铭文龙头: $AMB EVM 概念龙头: $ETHS 线下CX龙头: $PIIN 跨链桥龙头: $MUBI
显示更多
依据英伟达报告我们对未来Ai硬件产业的一个推断 增长指标基于Rubin平台拆解估算。 展望与风险我们预计2026-2027年AI资本开支将保持强劲,Rubin出货将催化供应链新一轮上行。光通信与先进基板的技术切换有望延长本轮AI硬件周期。超大规模云厂商的垂直整合及美国本土化制造(英伟达-康宁工厂等)进一步增强韧性。 主要风险:资本开支阶段性暂停、新技术(玻璃/CPO)良率爬坡、被动元件商品属性波动,以及亚洲供应链的激烈竞争。 目前板块估值已有所扩张,需保持选择性。 投资建议:超配与英伟达紧密绑定且技术壁垒较高的供应链标的(例如 $TTMI在PCB领域,$COHR/$LITE/ $GLW在光通信与玻璃领域)。 建议重点跟踪2026年二季度财报对Rubin放量进度的验证。 英伟达向Vera Rubin(VR200)平台的过渡,标志着AI基础设施复杂度和成本的显著提升。 根据摩根士丹利对下一代Rubin机架的详细BOM拆解,机架总成本较GB300增长近一倍,达到约780万美元(GB300约为400万美元)。 这一增长并非仅来自GPU/CPU本身,下游供应链各环节均出现显著重估。下游核心零部件价值增幅亮点如下: PCB 内容价值 +233%,增幅最大; MLCC +182%; ABF基板 +82%; 电源 +32%; 液冷组件 +12%。 这些升级与AI规模化趋势高度一致:800G/1.6T光模块快速放量,玻璃基板等新技术加速导入,超大规模数据中心运营商持续优先考虑性能、能效与散热管理。我们预计2026下半年至2027年,Rubin驱动的AI硬件需求将保持强劲多年代际增长。 投资主旨:英伟达(NVDA)仍是核心受益者,但供应链提供多元化配置机会。 我们看好先进PCB、高速光通信以及玻璃基板/光互连领域具备直接暴露的公司。 1. PCB:Rubin BOM中价值增幅最为显著摩根士丹利拆解显示,Rubin机架中PCB内容价值较GB300大幅增长233%。这主要源于更高层数、先进材料、更好信号完整性以及更大板尺寸,以满足AI服务器更高的功率与互连密度需求。美股代表公司: TTM Technologies (TTMI) —— 美国领先的PCB制造商,在数据中心/AI高复杂板领域具备强势地位。公司已积极扩产,重点布局高密度互连(HDI)和高多层PCB,以充分捕捉AI驱动的需求。 2. MLCC:密度驱动的显著增长英伟达VR200 NVL72服务器预计使用约60万个MLCC,较现有GB300平台高出30%以上。结合BOM中+182%的价值增长,凸显高容量、高可靠性MLCC在AI加速器电源交付与去耦领域的供应紧张态势。暴露说明:MLCC市场主要由亚洲厂商主导(村田、Samsung Electro-Mechanics、国巨等),美股直接纯正标的有限,可通过电源方案等生态公司间接关注。需持续跟踪产能利用率收紧对定价和出货量的支撑。 3. 光通信:800G/1.6T放量加速中际旭创2026年Q1净利润同比增长262%,公司明确表示一季度800G和1.6T产品放量,全年需求预计显著增长。这反映行业整体向更高速度光模块切换的趋势,以降低大规模AI集群的延迟与功耗。英伟达在光子集成(CPO)领域的投入进一步验证了这一方向。 美股代表公司:Coherent ( $COHR) 与 Lumentum ($LITE):光器件与收发器核心供应商,英伟达已通过重大股权投资锁定产能。 Corning (GLW):通过光纤、连接器及玻璃技术成为重要受益者(详见下文)。 4. Micro-LED/玻璃基板与光互连:战略合作加速落地2026年5月20日,京东方与康宁公司签署合作备忘录,双方将在玻璃基封装载板、可折叠玻璃、钙钛矿玻璃基板以及光互连等重点领域开展深度合作。 这与行业向玻璃芯基板转型的趋势高度吻合——玻璃基板在平整度、热稳定性和集成度上具备显著优势,有望突破有机基板的性能瓶颈。 美股代表公司:Corning ($GLW) —— 英伟达光互连战略的核心伙伴,已在美国新建多个光纤工厂,并通过多十亿美元级合作实现关键领域产能10倍以上增长。
显示更多
Bitwise 首席投资官 Matt Hougan 表示,在 AI 概念股持续吸引资金、加密市场结构法案 CLARITY Act 前景仍存在不确定性的背景下,加密资产正从依赖市场动量的交易转向更具逆向投资属性的资产类别。
显示更多
顶级机构背书 + 可验证AI算力网络,OpenGradient 让 AI 告别“黑盒”时代! @OpenGradient是一个去中心化的可验证 AI 专用协处理器网络。 它通过 GPU 与 TEE 节点为 Web3 应用和 AI Agents提供高性能的模型推理服务。 项目三大核心优势: 1️⃣ 顶级背景: 刚宣布累计完成 950 万美元融资,投资方包括 a16z crypto、Coinbase Ventures、SV Angel 等顶级机构。背景直接拉满! 2️⃣ 技术硬核: 它通过 GPU 与 TEE 节点为应用、区块链和 AI 智能体提供模型推理,最牛的是“每次推理都附带加密验证证明”。这就解决了去中心化 AI 最核心的“信任与验证”痛点。 3️⃣ 生态爆发: 目前网络已服务超 200 万用户,处理了数百万次可验证推理,不是空气项目,而是有实打实落地应用的技术底层。 官网: X账号:@OpenGradient 风险提示: 去中心化算力网络的节点网络稳定性仍需长期观察 数字资产有风险,投资需谨慎,非投资建议 目前每枚BNB的累计空投价值$368.15,金铲铲属性持续全开! 深入了解 BNB 生态和赋能: 币安邀请链接(高手续费返佣,金铲铲福利): #BTC# #BNB# #OpenGradient# #AI# #a16z# #OPG#
显示更多