搜索最近伸び悩んでるのでRTしてやってくれませんか相关的推文

1hours ago

最近大模型更新的隐式缓存为什么可以把缓存价格降低，命中率大大提高。传统推理里，你每调一次API，GPU都得把整个输入prompt重新算一遍。固定System Prompt、历史对话、RAG知识库，这些重复内容每次都重新预填充，按全价收费。隐式缓存做了什么？它自动检测本次输入和之前请求的公共前缀。命中了，就把之前算好的KV Cache从SSD硬盘直接加载出来，只对新增部分重新计算。重复劳动，直接砍掉。效果立竿见影。多轮对话、Agent、代码补全这类场景，重复前缀往往占输入Token的70%-90%。命中后，input价格直接打到一折。对长文本多次对话的推理的成本和内存的压力都大大降低。但这里有个关键问题：之前为什么不行？ KV Cache太大了。传统Multi-Head Attention架构下，百万Token的KV可能要上百GB显存。存盘？I/O延迟完全没法接受。GPU必须全程Hold住所有KV，成本根本降不下来。 DeepSeek的MLA架构把KV Cache压缩了10-28倍。百万Token从80-200GB变成4-10GB。这才让硬盘级缓存成为可能，压缩后的KV可以经济地落盘到分布式SSD，需要时再快速加载。本质上，是把最贵的GPU显存从按最大上下文全量占用变成了按实际新增Token动态使用，类似动态更新的模式。这里有个反直觉的点：虽然对高速内存需求大幅下降，但并不是完全转向硬盘。更像是分层存储，GPU只保留热数据，冷前缀卸载到SSD。类似CPU的分页机制，只是这次发生在大模型推理层。 DeepSeek率先把这套机制默认开启，给出极致低价。其他厂商不得不跟进，竞争驱动技术扩散，技术扩散又进一步压低价格。要想最大化缓存命中需要做什么？想最大化省钱，把重复内容尽量放在prompt开头，保持前缀一致性，命中率会更高。API响应里有prompt_cache_hit_tokens字段，直接看命中率。这轮降价潮是真实的架构创新，算法效率优化带来的成本下降。MLA压缩KV、分布式SSD存储、Radix-Tree前缀索引，这些工程突破把原来需要重复劳动浪费的算力，优化到极致尤其是 DeepSeek，降价这么多还能赚钱，还是永久降价，这是真本事，那之前的原价是耍我们玩得吗，第一天用原价 API 的人是有点冤大头了。

显示更多

0

转发到社区

baby 🦅@liuxiaoling933

1hours ago

最近市场迎来一波大跌，体行情起伏大。特别是受美伊地面冲突的影响比特币价格一路往下走，跌破了73000这个关键价位💔💔💔💔 不少拿着以太坊的朋友账户出现了亏损。眼下行情不明朗，我觉得大家心里都挺纠结的 —是打算继续持仓? —还是等着行情回暖？ —也有人担心亏损继续扩大干脆割肉圈子里有些入行多年并且一直看好以太坊的老玩家，大家准备互相凑到一起聊天聊聊: ①现在的市场情况? ②面对大跌行情该调整怎样的心态? ③一起分析讨论一下猜猜接下来行情会往哪个方向走? 作为新粉丝福利，直播会抽奖送一些ETH和BNB奖励出去，最新BTC/ETH现货&策略直播群也建立了，并且群内有一些坚守ETH的老OG，感兴趣的可以加助理，领直播名额和新一轮的抄底策略我这里分享一下加群方式： 1. TG： 2. 双向了的可加TG机器人：@tangjing520bot 3. 直播在safew上，苹果手机切换至香港ID在应用商城下载，安卓手机搭梯子进入官网： 4. 下载之后加我SafewID：tangjing520

显示更多

0

2

3

0

转发到社区

骄骄@jiao_newlife

2hours ago

最近盯了下 @worldcupvip，状态真有点猛。最近 12 场赛前观点，主方向红了 10 场。这波模型优化后，效果确实出来了。看球前没思路的可以跟上，红单节奏别掉队。

显示更多

0

转发到社区

rick awsb ($people, $people)@rickawsb

3hours ago

最近，风华高科因RC/RS系列0402、0603晶片电阻订单激增，暂停部分新订单。虽然只是是贴片电阻吗，但重要的，这是，高端、小尺寸、高一致性被动器件，的供需失衡信号。 0402 / 0603是封装尺寸。它既可以是MLCC，也可以是贴片电阻、电感、EMI滤波器。AI服务器真正需要的，是“小尺寸下还能维持高频、高一致性和长期可靠性”的器件。 AI的VRM复杂度提升、PDN越来越复杂。于是系统开始大量消耗：高频MLCC、小尺寸电阻、高频电感、钽电容、HSC。这些器件单价不高，但属于“缺一个，整机就无法出货”的东西。 AI服务器里的需求本身是分层的。最核心的位置，比如GPU核心供电、HBM附近、ASIC substrate附近，仍然高度依赖：Murata Manufacturing、TDK Corporation、Taiyo Yuden。因为这里要求极低ESL、极低ESR、高频响应和长期可靠性。但AI服务器并不只有核心位置。PSU、BBU、NIC、SSD、光模块、交换机，同样会消耗海量0402/0603。重要的是，AI正在先抽紧最顶级MLCC产能，然后压力开始向中高端0402/0603扩散。最近大火的MLCC和0402电阻看起来是不同器件，但背后共享的是“小尺寸精密制造能力”。包括精密印刷、烧结、AOI检测、高频测试、超小尺寸良率控制、精密材料处理。这和HBM产业链很像。最开始缺的是HBM，后来CoWoS、ABF、substrate、电源、散热、测试一起开始紧张。MLCC现在也开始出现类似现象。真正最容易缺货的，往往不是最顶级料号，而是“能量产、能过验证、还能部分替代”的中高端规格。 2018年被动器件超级周期就是典型案例。当时车规MLCC先缺，高频小尺寸规格先涨，随后0402/0603全面涨价。因为一旦高端规格开始缺货，客户就会提前备货、长单锁产能、替代采购、超额下单，最后整个产业链一起紧张。现在AI行业，可能正在重复这个过程。更重要的是，这种紧缺会向二线供应商传导。当Murata Manufacturing、TDK Corporation、Taiyo Yuden 优先保障AI服务器和车规客户后，订单开始向：Vishay Intertechnology、Yageo Corporation、Bel Fuse Inc.、Fenghua Advanced Technology 溢出。 AI数据中心，正在把整个电子产业重新拉回“工业品逻辑”。从GPU，到HBM，到光模块，到电源，再到0402电阻，整个链条都在同时变紧。这可能意味着，被动器件行业，正在进入新一轮量价周期。甚至可能是超级周期。免责声明：本人持有文章中提及资产，观点充满偏见，非投资建议，dyor

显示更多

0

转发到社区

比特币总裁@chairbtc

3hours ago

最近孙哥在布局AI，一姐上了福布斯杂志封面，V神却在写科幻小说，目前已完成第一章和第二章，看看以太坊都跌成啥样了，V神能不能按正常套路出牌一次

显示更多

0

1

0

转发到社区

暴富锦李@Cryptobaofu

3hours ago

最近真的有点沉迷在玩 Gate 的预测市场，从比特币价格到热门时事都能直接参与，现在连电竞都能玩了像最近看到的 IEM 科隆 2026 冠军预测，市场目前对 Vitality（维塔利蒂）呼声最高，大概接近五成机率，Spirit 也有一定支持度。IEM 科隆一直都是 CS 大赛里含金量超高的一场，这次热度也很高，很多人开始提早布局冠军预测我自己这次是直接下注 Vitality 夺冠，赢的话可以拿到 2.13 倍本金而且 Gate Polymarket 的玩法真的很多，不只加密货币涨跌、热门时事、体育赛事，连电竞、政治、话题事件都有，各种你平常想不到的东西几乎都能找到市场最近我也开始越玩越上头，有兴趣的真的可以自己去玩玩看，说不定会找到自己擅长预测的方向

显示更多

0

1

0

转发到社区

Old two sis💜@pcobidco

3hours ago

最近在忙家里的事没怎么刷推，打开推发现前阵子满屏的小龙虾不见了，之前推特上全是小龙虾的教程我也试着安装操作过，最后都不了了之，看别人写的挺简单，到自己亲自动手操作发现有很多的问题，根本不是那么简单，还的不停的训练优化！对于我这种普通人来说根本不想成为 AI 专家，我更希望的是让AI帮我更简单直接的处理问题，比如我一句话说完，你帮我把事情做完，而不是研究怎么使用AI 但现实是很多 AI 产品，已经复杂到像在学编程。尤其做图片和视频的时候特别明显，对于普通用户是真的不友好，同一句需求，不同 prompt 能跑出完全不同的结果，很多时候需要不停调 prompt，改半小时，最后 AI 还是没理解你真正想表达什么我感觉这才是现在 AI 最大的问题：模型越来越强，但普通人的使用门槛也越来越高最近看到@dappOS_com 做的 xBubble ，我反而觉得它思路挺对的，对于普通用户更友好 @xBubble_ai 是 @dappOS_com 做的一个 AI Agent 产品，它想解决的就是普通人不会写提示词的问题。大多数人应该都不想天天去研究：哪个模型写代码更强、哪个模型做图更好、哪个参数该怎么调。比如我的需求就是最后能直接给我结果就行我去刚试了一下，用xBubble 做了一个任务，也理解了它和普通 AI Agent 的区别在哪，不需要给他很多指令，不需要懂广告语，直白的说你想要什么，指令输出就能给你满意的图文我就丢给他一句话：帮我生成一张图特朗普为主的东方特饮的广告图正常情况下，这种需求需要自己选模型、写提示词、调参数，甚至反复重做。但在 xBubble 里，我只负责提需求。Bubble Pilot 会先理解我的目标，自动判断这是一个图片创作任务，然后把任务分发到最合适的 SOP 和执行链路。而且它不会固定使用某一个模型，而是自己判断当前任务更适合什么模型、什么工作流，以及哪些工具组合成功率更高。如果没有现成方案，它还会自动生成多种执行路径，持续测试和验证结果，最后选择效果最好的那个输出而那些验证过、成功率高的流程，又会被沉淀成可复用的 SOP 同样的指令其他AI根本无法生生你所需要的内容，差距一目了然！ xBubble 就做到了，会聊天就能用 AI 先说 Bubble Pilot。我现在使用AI 遇到最大的问题除了不会问，还有就是是不会选模型、不会写提示词、不会拆任务 Pilot 类似一个总调度，你把需求说出来，它会自动去匹配对应的 SOP 技能，自己判断该怎么做、调用什么能力、需要走哪条流程。如果没有现成方案，它还会切到通用 Agent 接着执行，尽量把事情做完另一个是 Bubble Engine 可以说就是AI 在自己训练自己，同一个任务，它会同时生成好几套执行方案，再去测试、筛选，最后把效果最好的那套沉淀成 SOP。后面再碰到类似问题，处理速度会越来越快，结果也会越来越稳定除了智能调度，它现在还有两种运行模式 Bubble Computer 更偏云端，像写研究、做设计、生成图片、剪视频这种复杂任务，直接交给云端多 AI 协同处理，用户只负责提需求 Bubble Personal 是本地模式，可以直接操作你自己的文件、浏览器、应用和日程，但前提是经过授权。很多高风险操作也不会留在本机，而是在云端沙箱执行完直接销毁，安全性这块考虑得挺细现在很多 Agent 每次都像临场发挥，结果很不稳定但 xBubble 是提前把很多任务训练成成熟流程，下次类似需求直接调用所以它做出来的东西，会更稳定，也更接近普通人真正能用的状态现在越来越觉得，AI 后面真正拼的，可能不是谁模型参数更大，是怎样更简单的使用，不是让用户学习 AI，而是让 AI 自己学习 AI，从而让普通人更简单的使用AI。 @BTC_Alert_

显示更多

0

37

18

1

转发到社区

大宇@BTCdayu

3hours ago

最近几位创始人都清仓了ETH，并写了长文《我为什么清仓了ETH》。而V神并不受影响，未来将不再写相关技术，而是将精力转为创作科幻小说。同时，著名的网站创始人大宇闻言也紧急割肉了最后的3.8个ETH。

显示更多

0

28

40

3

转发到社区

加密小象@cryptoxiaoxiang

5hours ago

最近包括SpaceX和chatgpt等超级巨无霸都在准备IPO吃最后一波红利. 在预测市场上也有几个有意思的市场 @Polymarket 的这两个ipo相关的市场: 1⃣ 预测2027年前会ipo的公司，这里面几家AI的公司应该都会ipo。普通的ipo对散户的参与门槛实在太高, 直接买他们会ipo也是一个赚钱的好路子。比如chatgpt预计9月上市, 现在胜率才70% 2⃣ 这个市场感觉就是送钱, 预测今年ipo的公司里哪家市值最大, 这里面SpaceX绝对是断崖式领先，谁能比首富还有钱？使用链接注册polymarket获得30%返佣欢迎进群讨论

显示更多

0

40

18

0

转发到社区

女技师@nvjishi

7hours ago

最近看到好多后面带个这种是啥意思

0

31

5

0

转发到社区