搜索 Streaming 相关的推文

yetone@yetone

2026.05.07 12:22

虽然 CodeX UI 看起来很好，但是据我所知，市面上只有 Claude Desktop app 和 Alma 做到了 Streaming rendering 的时候没有任何的 Render Stall。

0

33

173

11

转发到社区

0xAA@0xAA_Science

2026.01.06 04:05

刚测试的币安钱包的推特监控速度我发推瞬间就监控到了，感觉延迟 <300ms。应该是用的 X API v2 的 streaming 端口，其他方法延迟都会更高。在币安钱包网页版的监控面板就能配置，挺方便链接: @BinanceWallet @cz_binance @heyibinance

显示更多

0xAA@0xAA_Science

2026.01.06 03:57

测试一下

0

45

124

8

转发到社区

Macro_Lin ｜市场观察员@LinQingV

2026.05.13 15:20

$CBRS 假设 Cerebras 跟 CPO 结合起来，能否成为一台为极致推理而生的性能巨兽？ Cerebras WSE-3 的片上 SRAM 带宽是 21 PB/s，这个数字只对已经在片上的数据有效。一旦模型大到装不进单台 CS-3 的 44GB SRAM，就需要多台 CS-3 协同，activation 在机器之间流动。这段片间互联走的是 SwarmX 以太网 fabric，12 条 100GbE 链路，总带宽约 150 GB/s，跟片上 21 PB/s 差了超过十万倍。这是 Cerebras 部署 frontier model 时性能出现断崖的根本原因，也是 OpenAI 选择蒸馏小模型而不用 weight streaming 跑完整 GPT-5.3 的底层逻辑。如果把 CPO引入 CS 系统，把光引擎直接封装到 WSE 的 package 上，片间互联带宽有望从现在的 150 GB/s 跳到几十 TB/s，提升两个数量级。电信号不用走长距离 PCB trace 再到外挂光模块，直接在芯片旁边完成电光转换，延迟更低，功耗更低，信号完整性更好。跑一个万亿参数模型可能需要 20 到 30 台 CS 系统，权重全部常驻在各台机器的片上 SRAM 里不动，activation 通过 CPO 在机器之间高速流动。每台 CS 内部是 21 PB/s 的片上带宽处理几十层计算，跨机传一个几 MB 的 activation tensor 在几十 TB/s 的 CPO 下只需要亚微秒级延迟，基本可以被藏在计算延迟后面。系统的有效带宽会非常接近"全部在片上"的体验。这种配置下 Cerebras 对 GPU 方案的带宽优势是碾压级的，NVIDIA 再怎么升级 HBM 也追不上 SRAM + CPO 的组合。对比 NVIDIA 刚收购的 Groq 多芯片方案也有数量级优势，Cerebras 每个节点是 44GB、21 PB/s 的整片晶圆，Groq 每个节点只有 500MB、150 TB/s 的标准芯片，跨节点通信频率差两个数量级。工程难度非常大。在一整片 300mm 晶圆上集成 CPO 跟在常规芯片上做完全不同。光引擎的物理位置（晶圆没有传统意义上的 package 边缘）、WSE 本身 23kW 功耗旁边怎么保持激光器的温度稳定、CPO 光通道的良率怎么管理（WSE 的 compute core 可以靠冗余核补偿缺陷，光通道没有这个机制），每一个都是全新的封装工程问题。这条路如果走通了，Cerebras 的 wafer-scale 架构就到了终极形态。片上 21 PB/s SRAM 带宽负责计算，CPO 负责多机扩展，权重常驻不动，activation 光速流转，一台专为推理而生的性能巨兽。这套系统在 decode 吞吐上可能没有理论对手。推理是 AI 产业链里离收入最近的环节，谁的 token 更快更便宜，谁就吃到最大的商业化红利。尤其是高频交易、实时 Agentic 工作流、自动驾驶决策链这类对推理速度有确定性要求的场景，够用和极致之间的差距就是能做和不能做的区别。

显示更多

0

28

125

19

转发到社区

qinbafrank@qinbafrank

2026.05.09 10:20

SpaceX之前最重磅的IPO估计就是下周这个超大晶圆制造商Cerebras Systems的上市了，Cerebras是一家专注于AI加速器的美国公司，总部位于加州Sunnyvale，成立于2016年。公司以“晶圆级集成”（Wafer-Scale Engine，简称WSE）技术闻名，核心产品是将整个300mm硅晶圆直接做成一颗超级大的AI处理器，而不是像传统GPU那样切成小芯片再封装。这解决了AI训练/推理中常见的内存带宽和芯片间通信瓶颈问题，被誉为“世界上最大的AI芯片”。树立了下关于Cerebras几部分关键信息。 1、核心技术和产品 1）晶圆级引擎（WSE）传统AI芯片（如NVIDIA H100/B200）采用多芯片模块（MCM）或小型die，通过NVLink/HBM等外部互联扩展。但Cerebras的WSE把整个晶圆做成单一die，避免了芯片间通信延迟和带宽损失，实现了“片上”海量并行计算。 WSE-3采用“Weight Streaming”架构，将计算和内存解耦，支持外部MemoryX扩展（1.5TB、12TB、120TB甚至1.2 PB），单系统即可训练高达24万亿参数的超大模型。 2）CS-3系统单台15U机柜，内置1颗WSE-3，支持水冷。通过SwarmX互联可扩展至2048台集群，峰值达256 exaFLOPS。单台CS-3就能在不到1天内从零训练Llama 2 70B模型（Meta GPU集群需约1个月）。 3）性能优势 Cerebras强调“消除数据移动瓶颈”：比上一代CS-2（WSE-2）：性能翻倍，功耗和成本不变（CS-2用7nm，2.6万亿晶体管，40 GB SRAM）。比NVIDIA H100/B200：在内存密集型大模型任务中优势显著。CS-3单系统内存容量远超10,000节点GPU集群；推理速度可达GPU云的数倍（尤其是长上下文/大模型）。公司声称在Llama/Falcon等模型上tokens/second提升2倍。实际基准：Condor Galaxy 3（64台CS-3集群，8 exaFLOPS）已于2024年Q2上线，与G42合作。集群编程像“单芯片”一样简单，无需复杂分布式框架。优势：极致内存带宽 → 适合万亿/十万亿参数模型训练与推理。扩展性强 → 集群像单机一样编程，开发效率高。能效/成本在特定 workloads 上优于GPU（同功耗下性能翻倍）。挑战：单系统功耗高（25kW），部署门槛高（需专用数据中心基础设施）。晶圆级制造良率和缺陷容忍技术虽成熟，但整体成本高（单系统硬件估算数百万美元）。生态不如CUDA成熟，主要针对AI训练/推理大模型，不如GPU通用。总体上Cerebras是“垂直优化”的AI超级计算机方案，适合追求极致规模和速度的 hyperscaler、主权AI项目、国家实验室，而非通用GPU替代品。 2、发展历程 Cerebras从“卖硬件”转向“AI超级计算平台”，已从早期科研验证走向商用落地（Condor Galaxy等主权AI项目）。从SeaMicro老兵到AI晶圆级先锋 Cerebras成立于2015-2016年（官方多以2016年计），总部位于加州Sunnyvale。创始人团队全部来自SeaMicro（2012年被AMD以3.34亿美元收购），早期处于stealth模式四年，专注解决“晶圆级集成良率难题”。 1）2019年：发布首代WSE-1，开启晶圆级AI芯片时代。 2）2020-2022年：推出CS-1/CS-2系统，完成从“芯片”到“系统+软件栈”的闭环，与TSMC深度绑定实现量产。 3）2024年：WSE-3及CS-3系统落地，性能翻倍；同期首次递交S-1（后因业务优化于2025年10月撤回）。 4）2025-2026年：转向云推理服务+混合模式，与OpenAI签署巨额合作； 5）2026年2月完成Series H，4月重启S-1，5月启动路演，计划Nasdaq上市（代码CBRS）。 3、核心团队及融资 1）核心团队 Andrew Feldman（CEO、联合创始人）：连续创业者，曾任SeaMicro CEO、Force10 Networks产品VP（后被Dell收购）、Riverstone Networks营销VP。斯坦福MBA背景，擅长产品化与资本运作。 Gary Lauterbach（联合创始人、前CTO）：Sun Microsystems UltraSPARC首席架构师，58项专利，曾主导AMD数据中心业务。 Sean Lie（联合创始人、现CTO）：MIT本科+硕士，AMD高级架构师，29项专利。 Michael James（首席架构师）：SeaMicro软件架构师，后任AMD对应岗位。 Jean-Philippe Fricker（首席系统架构师）：DSSD/SeaMicro资深硬件架构师，30项专利。团队优势在于“系统思维”而非单纯芯片设计：他们深谙数据中心功耗、互联与软件优化，曾用fabric架构重塑服务器。这正是Cerebras能解决晶圆级缺陷容忍与Weight Streaming架构的关键。 2）融资历程累计融资约29-37亿美元（含多轮），估值从早期数百M美元飙升至IPO前230-266亿美元：早期：Series B/C/D（2016-2018）累计约1.7亿美元，投资者包括Foundation Capital、Eclipse、Sequoia、Benchmark。中后期：2019 Series E（2.72亿美元，估值24亿美元）；2021 Series F（2.54亿美元，估值41亿美元）。 2025-2026：Series G（11亿美元，估值81亿美元）；Series H（10亿美元，估值230亿美元，Tiger Global领投，Benchmark、Fidelity、AMD等跟投）。 4、业务模式与财务表现 Cerebras早期卖硬件（CS-2/CS-3系统），后来转向云服务（Cerebras Inference，云端提供超快AI推理）和混合模式。客户包括CSP、 hyperscaler、企业、主权AI项目（如G42）、研究机构。 2025财年财务：收入5.1亿美元（同比+76%，2024年2.9亿美元，2023年0.787亿美元，2022年0.246亿美元，20倍增长）。硬件收入约3.58亿美元，云及其他服务1.52亿美元。 GAAP净利润：约0.879亿美元（2024年净亏损4.85亿美元），首次实现盈利（不过非GAAP仍有亏损）。剩余履约义务（backlog）：246亿美元（OpenAI等多年前期大单贡献），2026-2027年预计确认15%。客户集中度：2025年G42占24%（此前曾高达87%），另一UAE客户占62%，但已显著多元化；OpenAI签署超100-200亿美元多年前期合作（含1亿美元贷款+认股权证）。公司定位从“卖芯片”转向“AI基础设施平台+云”，并与Qualcomm等合作加速边缘部署。 5、IPO相关信息： IPO 基础发行2800万A类普通股，超额配售420万A类普通股，核心管理层和投资人不卖股。纯公司发行新股用于募资，无大量旧股套现。 IPO定价$115–$125/股，因需求超20倍，已计划上调至$125–$135/股（可能进一步调整）。高区间（$125）募资约35亿美元（基础28M股），含超额配售最高约40.25亿美元。高估值下（$125/股）对应市值约266亿美元IPO后总流通股本约 2.13亿百万股（包括Class A、B、N等）。其中： Class A（上市交易股）为IPO发行的28M股 + 超额部分；其余Class B（高投票权，创始团队/早期投资者/优先股转换后）和Class N（非投票权，如OpenAI认股权证相关）。 ipo后解禁期前的流通比例标准锁定期： 180天或提前至Q3 2026财报发布后两个交易日（取较早者）。解禁前初始流通股（Initial Float）：仅IPO发行的 28百万股（基础）或最高 32.2百万股（含超额）。锁定期内真实流通比例：约 13.1%–15.1%（28M / 213M ≈ 13.1%；32.2M / 213M ≈ 15.1%）预期定价日：下周三5月13日，预期上市交易日：5月14日（周四），代码CBRS。整体而言估值虽高，但增长潜力和技术壁垒值得关注本条由@bitget_zh赞助，「Bitget 买美股：秒级入场，丝滑交易」

显示更多

0

16

364

86

转发到社区

Macro_Lin ｜市场观察员@LinQingV

2026.05.10 07:40

OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的，1 月份报道的合同价值超过 100 亿美元，后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元（包含到 2030 年的扩展选项）。第一个产品 2 月 12 日就上线了，叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单，可以从几个方面做具体判断。吞吐方面，Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上，标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒，速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒，是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比，同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距，跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间，还有几百倍的 gap，被软件栈、工作负载、batch 处理这些系统级因素吃掉了。延迟方面，1000 tokens/秒对应每个 token 1 毫秒生成间隔，这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写，每次客户端服务端往返开销减少 80%，per-token 开销减少 30%，time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的，跟 Cerebras 1 毫秒每 token 的硬件能力对不上，软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层，硬件能力升级倒逼软件栈重构。成本方面，Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放，API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价，意味着单位推理成本仍然显著高于普通 GPU 推理服务，需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU，OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事，可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考，Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens，GPT-4o 的 API 售价是 $10/M 输出 tokens，但两者模型规模和能力差距很大，不能直接对比。但 Cerebras 的这套东西有几个关键的约束条件，框定了它现在能做什么、做不了什么。第一是模型大小限制。Codex-Spark 是蒸馏后的小模型，被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB，frontier model 的参数量远超这个容量，必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力，Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证，OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型，说明前者目前在工程上更可行。第二是容量限制。Codex-Spark 目前是 research preview，OpenAI 明确说明"由于运行在专用低延迟硬件上，使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3，对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因，硬件交付的物理速度限制了营收节奏。总结来说，OpenAI 这笔交易对 Cerebras 是阶段性胜利，但远没到终局。技术验证层面，Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度，这一点产业内已经形成共识。但商业兑现层面，Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制，OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型，说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度，每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程，年产几千台 CS-3 是相当具体的工程瓶颈。对国产推理芯片的同行来说，这件事还有几个很具体的工程信号。端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快，软件栈跟不上的话推理体验仍然受限，专用推理芯片的价值要靠端到端的延迟优化才能完全释放。蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型，说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态，单纯的"通用推理芯片"在竞争中会比较吃亏。 1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化，这个速度天花板对国产推理芯片是一个相当严峻的目标。 Cerebras 当前展示的能力是真实的，但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键，一是看它在 2027-2028 年能不能把 750MW 真的部署完，把 RPO 真的转成营收；二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号，但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖，客户质量在提升，但集中度的风险结构没有改变，只有客户组合真正分散了，估值里的风险溢价才能消化。

显示更多

0

67

306

44

转发到社区

Macro_Lin ｜市场观察员@LinQingV

2026.05.09 10:56

之前做LLM推理芯片架构探索的时候，我把四大AI推理ASIC公司的架构都翻过一遍。Groq、SambaNova、Tenstorrent、Cerebras。前三家的思路虽然各有侧重，但底层逻辑都在同一个框架里：片上大SRAM + dataflow架构 + 确定性调度，核心差异在NoC拓扑、内存层级、编译器抽象这些维度上展开。 Cerebras是里面让我真正被震惊到的一家，而它却这四家里马上第一个拿到IPO结果的。这家公司的选择比其他三家都激进一个量级：不做芯片，直接做整片wafer。单颗WSE-3，21.5cm × 21.5cm的整片晶圆，90万个PE通过scribe-line stitching在物理上连成一片连续的silicon。这个工艺是Cerebras和TSMC联合定制的，把原本用于晶圆切割的窄条改造成跨reticle的金属导线，让所有reticle在物理上拼接成一整块芯片。（配图二展示了单颗WSE-3内部结构：左半边是整片晶圆的reticle网格和scribe-line拼接，右半边放大了单个PE的微架构。）单个PE的结构极简：8-wide FP16 SIMD计算核，48KB本地SRAM直连，没有cache层级，所有数据访问都是确定性的单周期。加上一个5端口路由器（N/S/E/W + loopback），相邻PE之间的通信延迟也是单周期。关键在于，跨reticle边界的mesh在物理参数上和reticle内部完全一致，编译器和runtime完全不需要感知reticle边界的存在。从LLM推理的视角看，这个均匀性的价值非常大。 LLM推理的瓶颈在decode阶段。每生成一个token，模型权重要被完整读取一次，计算量却很小，典型的memory-bound场景。GPU集群在这个环节的核心问题是数据搬运：HBM带宽有限，多卡之间还要经过NVLink → NVSwitch → InfiniBand → Ethernet四层互联，每一层带宽和延迟都差几个量级，编程模型必须显式处理每一层的拓扑边界。 Cerebras的做法完全绕开了这个问题。单片wafer内部fabric带宽27 PB/s，权重从外部的MemoryX存储集群通过SwarmX流入wafer后，在PE之间按数据流模式传播执行，同一套placement和routing算法跑遍整片wafer。（配图一展示了这个系统级架构：MemoryX参数存储集群到SwarmX互联fabric，再到底层最多2048台CS-3节点，权重广播和梯度规约的数据流方向一目了然。） 90万个PE各自带48KB SRAM，合计约42GB片上存储，每个PE对自己本地SRAM的访问是单周期确定性的，PE间通信每跳single-cycle，延迟和曼哈顿距离成正比。对于推理场景，前提是weight streaming的编译器能把权重有效地分配到对应的PE上，这42GB分布式片上SRAM的聚合带宽远超GPU的HBM方案，没有cache层级带来的访问不确定性，没有跨芯片搬运的开销。回到我自己的体感。做推理芯片架构的时候，NoC拓扑和内存层级的权衡花了大量精力，因为芯片边界是硬约束，跨芯片通信的成本和片内通信之间永远存在断层。Cerebras的做法等于从片内通信的角度消除了这个断层，代价是整条制造和封装链都要重新定义。这也解释了Cerebras的工程取舍。所有架构创新集中在wafer内部，scale-out方向直接复用100GbE + RoCE的以太网生态。wafer内27 PB/s对比跨CS-3的SwarmX在Tbps量级，几个数量级的差距全部交给商品化网络承担。推理场景下单wafer内部的带宽和延迟优势可以直接转化成token生成速度。 OpenAI选择和Cerebras合作做推理，从架构层面看逻辑是通的。大规模在线推理需要低延迟、高吞吐、确定性时延，这三点恰好是wafer-scale架构在片上通信均匀性方面的结构性优势。但这套架构也有几个结构性的问题值得正视。良率和成本是绕不开的。整片wafer做单颗芯片，任何一个reticle的缺陷都影响整体。Cerebras靠冗余PE和路由绕行来应对，但冗余比例和良率数据从未公开过。一片wafer的制造成本本身就远高于切割后卖单颗die的模式，叠加23kW、15U的单系统功耗和体积，部署密度和TCO在大规模推理集群的经济性上面临考验。最关键的是KV cache的容量瓶颈。42GB片上SRAM看起来很大，但长上下文推理场景下KV cache随序列长度线性增长。以Llama 70B为参考，FP16下128K上下文的KV cache就要吃掉约40GB，即使做KV cache量化，长序列场景下的容量压力仍然显著。片上放不下的部分必须依赖MemoryX做外部存储，数据要经过SwarmX回传，这条路径的带宽在Tbps量级，和wafer内部27 PB/s的差距意味着长序列场景下decode速度会被外部带宽卡住。这可能是Cerebras在推理场景面临的最核心的架构约束。

显示更多

0

45

270

47

转发到社区

qinbafrank@qinbafrank

2026.05.02 02:46

Agent代理经济基础设施和稳定币全栈布局，支付巨头如何把“影子银行”变成标配？关注AI代理经济和稳定币发展，就不能不关注这次StripeSessions的2026大会。必须说这次发布会信息量极大，其对AI代理商务和稳定币的全栈布局是最具战略意义的。这次大会意味着Stripe从传统支付玩家向AI+Crypto原生基础设施提供商的彻底转型。稳定币部分尤其全栈化——从发行、托管、转账、收益率、卡片消费到 onramp/offramp，全都封装进单一 API 层。传统企业不用懂链上细节，就能直接用稳定币做全球即时金融；AI Agent 也能像人类一样自主支付。这波布局一旦落地，稳定币就真从“小众交易工具”进化成全球金融的默认基础设施。一、Sessions 2026 核心主题：构建 AI 经济基础设施核心是Agentic Commerce（代理商务）。Stripe 宣布让AI代理成为独立经济主体，能自主发现、购买、支付，同时保持人类可审计。 1、Agentic Commerce Suite：一次集成就能让产品在 Google Gemini、Meta 等 AI 应用内被销售和支付。代理购物不再是科幻。 2、Link Agent Wallet + Issuing for Agents：AI代理可代表用户生成一次性虚拟卡、Shared Payment Token，支持限额审批、实时监控。2.5 亿 Link 用户基础直接复用。 3、Streaming Payments + Projects：适配 token 微支付，开发者工具开放 32 家伙伴，让代理“vibe deploying”自动部署产品。 4、其他全局升级：Managed Payments GA、Radar 风控针对 token 欺诈、Treasury 多货币账户、Atlas 10 万家公司里程碑（solopreneur 收入暴增 5 倍）。 Patrick 说得很清楚：AI 转型需要新的经济原语和抽象层，Stripe 就是在把这些原语产品化。传统企业适应 AI、AI 企业加速增长、欺诈者被挡住——三赢。但我个人最兴奋的还是稳定币部分。这次 Stripe 直接把之前收购的Bridge和 Privy的能力彻底打通，形成了闭环“影子银行”系统。二、Stripe 稳定币全栈布局：从碎片化到“一站式 API” 以前企业要做稳定币业务，得拼 custody + ramp + yield + cards + compliance。现在 Stripe 把所有环节封装好，企业像接普通支付一样接入。这才是真正让稳定币主流化的关键——支付巨头用自己的合规和分发优势，把加密变成基础设施。 1、Digital Asset Accounts（数字资产账户）——全栈核心原语 Stripe + Privy 推出单一 API，支持多链稳定币余额、转账、支付、fiat on/off-ramp、链上 FX、Morpho DeFi 自动收益率、卡片发行。 托管/非托管灵活切换，已有 Ramp、Deel、DoorDash 等客户在用。 意义：以前碎片化集成要好几家供应商，现在一天内就能上线。非 crypto 团队也能玩转稳定币。 2、Treasury 稳定币扩展——全球即时金融账户 新增 41 个市场，覆盖 150+ 国家和地区。 企业余额同时支持 fiat + 稳定币，美国/英国年底前更多货币；网络内即时免费转账；闲置稳定币赚奖励。 AI Agent 可查余额、付账单、开卡（关键操作人工确认）。 Atlas 创始人直接收 SAFE 进 Treasury。Payout 支持 160 个国家。 3、Bridge 基础设施升级——自主发行与跨链 Open Issuance 增强：企业可自己发行、管理稳定币（USDG、CASH 等）。 新增 COP、GBP onramp/offramp，跨链扩展到 Tempo、Plasma、Celo、Sui。 托管 USDC + 自发 USDB（1:1 现金+货币市场基金，BlackRock 管理）。 开发者直接在平台完成 KYC、储备、费用设置。Bridge 成立不到两年，支付量曲线已超越早期 Stripe。 4、Stablecoin-Backed Cards——消费闭环 Issuing + Bridge/Privy 集成，私测推出稳定币背书借记卡。 支持托管/非托管钱包，即时扣款（webhook 验证）。从30拓展100多个国家 完整 Issuing 功能：虚拟/实体卡、消费限额、Apple Pay 等。 5、稳定币支付接收 + Agent 支持 32 个新增市场自动结算为法币。 PaymentIntents 一键开启，Agent 通过 Machine Payments Protocol 用稳定币支付。 Streaming Payments 结合 Tempo 实现 AI 原生微支付。 6、Crypto Onramp 预览 美国企业无界面部署，自定义稳定币发行；<500 美元简化 KYC。 SDK 让加密 App 的入金体验接近 Apple Pay。三、战略意义把上面模块连起来，就是一套完整闭环：这套系统让稳定币真正“傻瓜化”：传统企业获得加密速度 + 法币合规； AI Agent 原生微支付； fintech 在单一平台打造全球产品。 Stripe的动作，本质上就是在为代理经济和链上美元体系搭建“像信用卡一样简单”的底层管道。更深层看： 1、对 AI 经济：代理将成为主流交易主体，稳定币提供即时、低成本的结算层。 2、对 Crypto：支付巨头主导大规模采用，KYC、合规、Gas 全封装，稳定币从 DeFi 玩具变成企业标配。 3、其实还有一层地缘纬度：美元通过稳定币数字延伸，新兴市场企业无需本地银行账户就能全球运转。 Stripe正在把“AI 代理 + 稳定币”变成下一代经济默认基础设施。再结合前两天A16z发布的全球金融的新技术栈，更值得关注。

显示更多

qinbafrank@qinbafrank

2026.04.29 00:25

全球金融的新技术栈，金融系统正在被新基础设施快速重建，稳定币是最大催化剂。已从“小众交易工具”进化成全球金融的基础管道，正在成为新一代金融产品（支付、外汇、信贷、投资等）的底层基础设施。A16Z这篇文章值得看看稳定币正催生新型 BaaS（Banking-as-a-Service）： 1）上一代是 fintech 租银行牌照、接老系统； 2）这一代是链上原生，用自托管钱包降低摩擦，直接把账户、支付、外汇、信贷原语组合成端到端产品。  传统机构（Stripe 收购 Bridge/Privy、Mastercard 收购 BVNK）已在按这张地图布局，转型已过不可逆点。新型金融体系六大技术栈，六大层级拆解 1. 区块链层：三大类别已分化 1）通用链（Solana、以太坊及其 L2）：主战场仍是加密资本市场（交易、借贷、DeFi）。 2）支付专用链（Stripe Tempo、Circle Arc）：专为金融服务优化，强调稳定币原生 gas 费、隐私、可预测交易成本——对处理百万级支付的 fintech 至关重要。 3）机构网络（Canton 等）：专为受监管机构设计，提供可编程性+隐私+合规框架。 2. 银行层：卡点正在松动 一批加密友好银行正搭建法币与链上基础设施的桥梁，入金/出金难题显著缓解。 3. 稳定币发行层：牌照争夺战 GENIUS Act 通过后，发行商疯狂抢 OCC National Trust Charter（国家信托牌照）。 短期拿合法性，长期目标是接入美联储通道，成为数字金融体系核心玩家。 4. 流动性层：最后一公里难题（新兴市场） 稳定币已解决跨境支付“中间里程”，但本地法币流动性仍薄。 解决路径：稳定币兼容 FX 提供商 + 区域交易所（Bitso、Yellowcard、Coins）+支持稳定币结算的银行。 5. 银行连接层：最不性感但最关键的翻译层 稳定币基础设施与传统银行核心系统不兼容，需要专门的“连接层”让银行无需大换系统即可支持稳定币。 6. 应用层：融合 + 新原语 1）fintech 新银行 ↔ 加密钱包正在快速融合，最终会变成统一金融超级 App。 2）企业级采用：在拉美、非洲、东南亚等美元银行基础设施差的市场，稳定币已成为公司银行业务（支付、收款、资金管理）的实际解决方案。  账户只是入口，后面是信贷、投资、财富管理、保险等全套产品。第二幕：信贷才是大戏支付是第一幕，信贷是第二幕且影响力更大。万亿美元稳定币浮存将催生真正生产性链上信贷市场（不是早期 DeFi 的加密套加密投机，而是借贷真实资产、应收账款、企业营运资金）。类比过去十年私募信贷的爆发：银行退出→新结构填补空白，这次底层是开放、可编程、全球化的链上基础设施。地缘政治维度 1）对个人/企业：美元实际赋权——无需美国银行账户即可持有、交易、存储美元，规避本地货币贬值。 2）对美国：稳定币是美元霸权的数字延伸，GENIUS Act 实质上是押注稳定币巩固美元全球主导地位。全球金融正在经历一次“批发式系统升级”。新栈具有开放、可编程、默认互操作的特点，能服务到传统系统从未覆盖的人群和场景。现在不是“会不会发生”的问题，而是“谁来定义新规则”的问题。传统机构只能选择拥抱，否则将被甩在身后。具体公司和分类会演变，但结构性转变已经发生。

显示更多

0

3

43

7

转发到社区

0xWizard@0xcryptowizard

2026.03.16 02:02

看着 agent 很弱智又很努力想搞好交易的样子： “`RWA Tokenization`叙事在`Spreading`状态下6笔交易全败，平均亏损-99.79%，风险极高。” 看着它的挣扎求生，有点好笑。被叙事和各种垃圾币坑的样子，像极了你我。继续努力吧，虽然现在很傻，但只要持续进化，我相信有一天你能成为交易高手。

显示更多

0

30

65

3

转发到社区

品质东乡（互fo）@pinzhidobgxiang

2026.05.18 08:02

🏛️5月18日国际博物馆日你为哪个IP买单？#文博消费火出圈# # 文化自信藏在博物馆里 Happy International Museum Day! May 18th — which cultural IP are you supporting? museums are stealing the show! 🔥 #MuseumEconomy# #CulturalConfidence# #MuseumDayVibes#

显示更多

0

1

0

转发到社区

彭博商業周刊 / 中文版@BloombergBWCN

2026.05.18 06:00

【英國政治】施卓添表示若工黨舉行領導人競選他將參選施卓添（Wes Streeting，圖）表示，如果工黨舉行領導人選舉，他將參選。他早些時候已辭去衛生大臣職務，表示工黨在地方選舉中的慘敗是「前所未有的」，同時警告稱，民族主義者如今已「在英國的每個角落」掌權。

显示更多

0

转发到社区