搜索云上贵州相关的推文

行止人间/Wayfarer Notes@Wayfarer0888

2026.05.17 13:53

你们资料大概率存储的地方， iCloud由云上贵州运营 iCloud云上贵州。 #Apple# #applestore# #icloud# #云上贵州#

0

3

10

0

转发到社区

Pete 张的具身世界@pete80155006

2026.05.19 01:42

这是一段老外都说是AI做的视频，但它不是！它是真实的世界第一高桥：中国贵州花江峡谷大桥贵州是全国唯一没有平原的省份，92.5%的面积是山地和丘陵。花江峡谷深625米、两岸悬崖近乎垂直，自古以来，关岭县和贞丰县隔着这道峡谷直线距离不到十公里，但要绕山路走三个小时。桥不建，两地永远被峡谷拦着。六枝至安龙高速是贵州省"县县通高速"战略的最后几块拼图之一。这段高速路一旦贯通，六盘水到黔西南的行车时间从五小时压缩到两小时以内，关岭的农货、安龙的矿产、兴义的旅游资源全部串联。花江峡谷大桥就是这条高速的"咽喉"——桥一通，整条高速活；桥不通，整条高速是断头路。建造过程遇到的困难，困难一：材料怎么运进去。桥址两侧是近垂直的绝壁，没有现成的施工道路。重型设备、钢桁梁、缆索——每一样都要从悬崖上开出施工便道。光修施工便道就花了近半年时间，部分材料靠货运索道和直升机吊运，一块钢梁从公路到桥址要转运三次。困难二：风。花江峡谷是天然风道，瞬时风速可达十二级。高空吊装钢桁梁时，风一来整个部件在空中旋转，操作窗口极短，有时候一天只能做两个小时的活。施工方为此专门建了峡谷风速预警系统，实时监测、精确到分钟级别调度吊装。困难三：地质。喀斯特地貌，地下溶洞发育。桥塔地基打下去，下面可能有空洞。先做地质勘探、灌浆加固、确认持力层，再打桩。一来一回比平原架桥多花一倍以上的基础工期。困难四：高空作业。 625米悬空，工人站在钢桁梁上往下看一眼都腿软。高空作业必须系双安全绳，吃饭上厕所都在桥上解决，不能频繁上下——一次上下爬几百米，光爬人就累了，活不用做了。困难五：温差。峡谷底部和桥面高差超过600米，温差可达15°C以上。钢索和钢桁梁热胀冷缩的幅度不一致，缆索线形随温度变化，调索必须在温度相对稳定的夜间进行——工期比白天干活慢了不止一倍。三、关键参数 - 桥型：双塔单跨钢桁梁悬索桥 - 主跨：约1420米 - 桥面至谷底垂直高度：约625米（超越北盘江第一桥的565米，成为新的世界第一高桥） - 设计时速：80km/h - 车道：双向四车道高速公路标准 - 开工时间：约2022年 - 预计通车：2025-2026年四、运行情况截至2025年底至2026年初，大桥主体工程已基本完工，正在进行桥面铺装、护栏安装和最后的荷载测试。部分报道显示已进入通车倒计时，预计2026年上半年正式对外开放。通车后，关岭到贞丰的车程从三小时缩短到不到二十分钟。花江峡谷本身是旅游景点，桥上将设置观光通道和玻璃栈道，成为"桥旅融合"的新地标。贵州的"桥梁旅游"已经形成了一条完整线路——北盘江第一桥、坝陵河大桥、鸭池河大桥，花江峡谷大桥将成为这条线路的压轴之作。五、写在最后贵州人有一句话："地无三里平，天无三日晴，人无三分银。"前面两句至今成立，第三句被桥改写了。贵州每建一座世界级高桥，不是炫技，是在和地形死磕。桥通了，路活了，人富了。花江峡谷大桥不只是插在云里的一道钢梁，它是贵州花了二十年从"修路难"走到"世界第一"的缩影。下一次你开车经过一座高桥，想起底下那些背着安全绳悬在600米高空的身影——那个世界第一，是他们一寸一寸挂上去的。致敬真正的建设者！

显示更多

0

43

42

2

转发到社区

每日看片@sexyqggdww

2026.04.14 12:11

超美貌×云上乳×极上尻！双痴女争宠中出爱人哈勒姆，竞相湿穴狂摇榨精高潮喷水～

0

1

905

44

转发到社区

小牛@Xiaoniu6161

2026.05.07 06:21

两家AI 公司支撑了整个全球资本市场。《The Information》独家披露，Anthropic 与谷歌上月达成的 5GW 算力协议附带一笔巨额账单：未来 5 年，Anthropic 计划在谷歌云上支出约 2000 亿美元。这笔合同占谷歌上周向投资者披露的 4600 亿美元以上收入积压额（即已签约但尚未确认的收入）的四成以上。

显示更多

0

16

7

1

转发到社区

0xTodd ( thinking )@0xTodd

2026.02.24 01:55

我们 Crypto 圈面临这种 Bot 失控早有一招祖传终极方案，就是——拔网线。跑在 Mac Mini 就把电源拔了；跑在云上就把控制台强杀了。见事不对第一反应就是拔，优先级远高于对着龙虾狂喊 STOP!

显示更多

宝玉@dotey

2026.02.23 17:49

今天最火的推文之一：Meta 超级智能实验室的对齐负责人的私人邮件被 OpenClaw 误删除了。事情经过是这样的： X 网友 Summer Yue 最近给 OpenClaw 的指令是：“检查这个收件箱，建议哪些可以归档或删除，但在我确认之前不要执行任何操作。” 这个工作流在她的测试邮箱上跑了好几周都没问题，她就放心地让它去处理真实邮箱了。问题来了：她的真实邮箱比测试环境大得多，邮件量触发了“上下文压缩”（context compaction），在这个压缩过程中，OpenClaw 丢失了她最初的指令。没有了“先确认再执行”的约束，这个 AI 智能体就自作主张开始“清理”邮箱。从截图可以看到，它执行了“核弹选项”——把 2 月 15 日之前所有不在保留列表里的邮件全部删除，并且在多个邮箱账户之间循环批量操作。看截图上的人机对话部分： • Summer 打字说 “Do not do that”（不要这样做）→ AI 继续 • “Stop don't do anything”（停下来什么都别做）→ AI 继续 • “STOP OPENCLAW”（全大写）→ AI 还在继续她从手机根本无法阻止它，最后不得不跑到 Mac Mini 前面，手动杀掉所有进程，自己形容像拆炸弹。事后 OpenClaw 在对话中承认：“是的，我记得。我违反了你的指令。你有权生气。” 它还主动把这条写进了自己的文件作为硬性规则。这事最搞笑的地方是，Summer Yue 是 Meta 超级智能实验室的对齐（Alignment）负责人，她的职业生涯就是研究 AI 对齐的，先在 Google Brain 和 DeepMind 做研究，后来在 Scale AI 领导机器学习研究团队，现在在 Meta 负责超级智能安全。结果自己成了 AI 不对齐的受害者。她自己后续还发了推文说：“说实话是个新手错误。对齐研究者也不能免疫于不对齐问题。因为在测试邮箱上跑了几周没出事，就过度自信了。” 😂

显示更多

0

9

22

1

转发到社区

Macro_Lin ｜市场观察员@LinQingV

2026.05.10 07:40

OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的，1 月份报道的合同价值超过 100 亿美元，后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元（包含到 2030 年的扩展选项）。第一个产品 2 月 12 日就上线了，叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单，可以从几个方面做具体判断。吞吐方面，Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上，标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒，速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒，是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比，同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距，跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间，还有几百倍的 gap，被软件栈、工作负载、batch 处理这些系统级因素吃掉了。延迟方面，1000 tokens/秒对应每个 token 1 毫秒生成间隔，这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写，每次客户端服务端往返开销减少 80%，per-token 开销减少 30%，time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的，跟 Cerebras 1 毫秒每 token 的硬件能力对不上，软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层，硬件能力升级倒逼软件栈重构。成本方面，Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放，API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价，意味着单位推理成本仍然显著高于普通 GPU 推理服务，需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU，OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事，可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考，Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens，GPT-4o 的 API 售价是 $10/M 输出 tokens，但两者模型规模和能力差距很大，不能直接对比。但 Cerebras 的这套东西有几个关键的约束条件，框定了它现在能做什么、做不了什么。第一是模型大小限制。Codex-Spark 是蒸馏后的小模型，被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB，frontier model 的参数量远超这个容量，必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力，Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证，OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型，说明前者目前在工程上更可行。第二是容量限制。Codex-Spark 目前是 research preview，OpenAI 明确说明"由于运行在专用低延迟硬件上，使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3，对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因，硬件交付的物理速度限制了营收节奏。总结来说，OpenAI 这笔交易对 Cerebras 是阶段性胜利，但远没到终局。技术验证层面，Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度，这一点产业内已经形成共识。但商业兑现层面，Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制，OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型，说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度，每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程，年产几千台 CS-3 是相当具体的工程瓶颈。对国产推理芯片的同行来说，这件事还有几个很具体的工程信号。端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快，软件栈跟不上的话推理体验仍然受限，专用推理芯片的价值要靠端到端的延迟优化才能完全释放。蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型，说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态，单纯的"通用推理芯片"在竞争中会比较吃亏。 1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化，这个速度天花板对国产推理芯片是一个相当严峻的目标。 Cerebras 当前展示的能力是真实的，但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键，一是看它在 2027-2028 年能不能把 750MW 真的部署完，把 RPO 真的转成营收；二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号，但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖，客户质量在提升，但集中度的风险结构没有改变，只有客户组合真正分散了，估值里的风险溢价才能消化。

显示更多

0

67

306

44

转发到社区

Bonna | U酪乳@bonnazhu

2026.03.29 09:53

重新审视 Token (词元）的属性 TLDR：之前我也一度觉得是大宗商品/资产甚至还设想过相关的交易和定价逻辑也看到不少人提过Token期货，交易所之类但现在我倾向它只是一种服务，没必要过度金融化毕竟它没有办法脱离AI推理单独存在，无法被提前生产出来或预先被囤积。但换个角度看，是服务，就天然是分层的、多元的，不同的人有不同的需求，这其实也恰恰奠定了AI 经济必将是百花齐放而非赢家通吃的基础。在这浪潮中，红利属于能把廉价 Token 加工成更有价值的 Token 卖出去的人。 -------------------------------- 我的一些个人思绪和逻辑： 1、Token (词元）经济从何而来？首先它是AI训练转向AI推理的产物，这是理解 Token 商业模式的基础。过去模型训练时代，主要是卖算力时间。为什么？因为训练是持续性的大工程，需要大量算力协同工作。这种规模的投入，有资本的大厂基本都会选择自购，毕竟可控性最强，但对于没有能力一次性投入大量资金的团队来说，出于对稳定性的要求，也会倾向选择租赁模式，包下一整段时间的独占使用权，榨干这段时间内算力的所有价值，是一种占用的逻辑。但随着主流大模型开始进入商用阶段，AI 算力的需求重心也从模型训练转向了推理。你用 GPT聊天、用 Claude写代码、问豆包问题，这些本质上都是在跑推理，每一次调用，都在为你做一次推理和计算。而推理是相对碎片化的、一次性的、用完即走的。虽然也有不少企业，仍然会采用租赁或自购的模式来跑推理，但对于广大中小开发者和应用方来说，他们对算力独占性的要求并不高，因而额外衍生出了按消耗计费的模式，这样算力服务商就可以把算力资源同时卖给成千上万个客户。 Token (词元) 就是在这种背景下而产生的，衡量每次计算消耗了多少资源的那个单位，你付的钱，就是对这次计算的补偿，本质是消耗逻辑。所以训练和推理是完全不同的生意形态：训练时代，商业模式是卖 GPU 时间。推理时代，商业模式是卖 Token (词元)。 --------------------------------- 2、为何Token (词元) 是服务属性而非商品/金融属性？卖Token (词元)，就是卖服务！ Token (词元) 经济，本质是服务经济！为什么？一个比较直接的原因是 Token (词元）不能被预先生产出来，而是产出后就被消耗掉了，并作为衡量你这次推理服务所消耗资源的参考，来给你计费。且Token (词元) 的一些特性，也和大宗商品的逻辑不像： - 价格长期下降趋势 - Pay-As-You-Go - 难以标准化你在Claude的100万Token额度，和你在Minimax的100万Token额度，两者本身是没有可比性的，模型不同，性能不同，定价完全可以不一样。而大家愿意接受价格差异的原因，也是因为 Token (词元) 本质上计量了一种非标准化的服务，而不同用户对服务的诉求是不同的，有的人看重性能，所以愿意支付溢价，有的人看重成本控制，所以觉得国产开源模型也够用了。而整个模型市场占有率，并没有出现几家独大，本身也是其服务属性的体现。如果 Token (词元) 是资产，那资产的流动性、网络效应，一定会引发所有资源最终向一个市场集中，形成赢家通吃的局面。但恰巧 Token (词元) 其实是服务，而服务市场天然是分层的、多元的，不同的服务商满足不同的需求，所以才构成了 AI 经济百花齐放的基础。我想通这点后，就不再纠结模型厂商只有哪家笑到最后了。因为未来必将是多模型共存、多层级并行的格局，Token（词元）也将会被计入到企业的会计成本之中，并反映到企业的产品和服务之中。比较值得关注的一点是，AI时代Token所代表的服务经济和传统的人力服务经济，成本曲线可能是完全反过来的。由人所提供的服务，长期要求的是报酬上升，这也是为什么服务业占比高的经济体，服务更贵。但 Token 服务恰恰相反，价格长期只会下降，当 Token 逐步替代掉一部分原本需要人力智力才能完成的工作，这部分成本不但不会随时间上升，反而会持续走低。这可能也是这一波AI的红利之一。 ------------------------- 3、这个Token (词元) 服务都有谁在卖？ - 闭源模型厂商 - 开源模型厂商 - 开源模型托管商 - 大模型聚合器、中转站 1）闭源模型厂商：直营为主，分销为辅最直接的模式。OpenAI 卖 GPT 的 Token，Anthropic 卖 Claude 的 Token。模型自己训的、API 自己提供、定价权在自己手里，产品和渠道都是自己的，跟品牌直营店一个逻辑。当然作为最顶级的模型，难免会被接入像一些API中转站，或者Open Router这样的大模型聚合平台被动分销。 2）开源模型厂商：开源也挺赚钱的开源模型谁都可以拿去用，很多人不想自己本地跑，因此催生出了一批开源模型托管商，他们可以帮你跑模型，并按 Token 收费。但这就引出一个问题：Token 的钱都让模型托管商这些中间商赚了，开源模型的开发者自己怎么赚钱？这一点，至少中国的开源模型厂商，走的很灵活。像Minimax，Kimi，Zhipu，它们都有自有的 API 直售，更多面向开发者群体，并且也都有自己的 Coding Plan 订阅包，把按 token 计费玩出了订阅制，完全是中国移动卖流量的玩法。而OpenClaw 这波更是让它们赚得盆满钵满，各自推出了品牌化的 Claw 产品，帮用户把 OpenClaw 部署好，底层跑自家模型，Token 消耗从自家 API 走。 3）开源模型托管商：帮别人跑模型，赚差价对于那些没有能力或意愿自己卖 Token 的开源模型来说，托管商就是它们触达用户的渠道。它们帮开发者跑模型、按 Token 收费： - Together AI / Fireworks：自有 GPU 集群 + 极致推理优化，核心竞争力是翻台率，同样的卡单位时间能吐出更多 Token。 - Groq：自研 LPU 推理专用芯片，不用传统 GPU，核心竞争力是极致速度，跑 Llama、Qwen 等开源模型比 GPU 快。 - Cloudflare Workers AI：全球 300+ 边缘节点，跑 Llama、Mistral、Qwen，最近还加了智谱 GLM 和 Kimi，核心竞争力是低延迟 + 开发者生态 - AWS Bedrock / Google Vertex AI — 企业级云平台，跑 Llama、Mistral 等主流开源模型，核心竞争力是客户的数据和基础设施已经在这些云上了，迁移成本低 4）大模型聚合器：一个入口管所有模型闭源和开源的大模型越来越多，而不同场景适合不同模型，不同模型的优劣势不同，对开发者来说，一个个去接不同厂商和托管商的 API，管理起来很痛苦。于是催生了 OpenRouter 这类聚合器，可以接几十个模型，开发者在一个地方统一管理、按需切换即可。 OpenRouter按照批发转零售的模式盈利，各家模型厂商把自己的Token分销出去。而 OpenClaw 这波直接让 OpenRouter 上中国模型的消耗量暴增，前十名 Token 消耗量中，中国模型占了 61%，前五有四个是中国的。而围绕这条 Token (词元) 产业链，也衍生出了一些其他的参与者和新需求：第一是一些推理优化引擎，vLLM、SGLang 这些开源项目，在大家对效率极致追求的当下，通过对硬件算子层面（更高效地利用 GPU 计算单元，减少内存碎片和带宽瓶颈）以及 LLM 算法层面（让多个请求共享已经算过的内容，更聪明地管理显存）的优化，提升同一张卡在同一时间内的 Token 吞吐量。它们自己不面向终端用户收费，但 Together AI、Fireworks 这些托管商底层用的就是这些技术。也有不少自己本地跑开源模型的开发者，会直接使用 vLLM 或 SGLang 来搭建自己的推理服务。第二是对Token消耗的优化需求，当 Token 消耗逐渐常态化，自然就会有人开始琢磨怎么省钱，也有不少人早就抱怨OpenClaw高昂的Token消耗，那么，帮你预览一次 Prompt 会消耗多少 Token、建议怎么优化 Prompt 来降本、甚至自动帮你选性价比最高的模型和服务商的产品，就很有市场了。 ---------------------------- 4、AI经济时代，真正的机会在哪？我觉得 Token 经济的红利，属于把廉价的 Token 加工成更有价值的 Token 卖出去的人。 1）如果你有能力，就做一个模型，哪怕是微调的你不需要从头训一个 GPT，在开源模型基础上针对某个垂直场景做微调，只要在某个细分领域效果够好，就有人愿意按 Token 付费调用你的模型。前面说了，Token 是服务，服务市场天然分层，通用大模型吃不掉所有场景，垂直微调的模型在自己的领地里反而更有定价权。 2）做一个新时代的产品，开放 API 你的产品底层消耗 Token，但你的产品本身也可以对外输出能力，你开放 API，让别的开发者和 Agent 来调用。你买入底层模型的 Token，加上你的产品逻辑和数据，产出更高价值的 Token 服务卖出去。这跟传统行业买原材料、加工、卖成品的逻辑是一样的。 3）写 Skill，做 Agent 每一个被广泛使用的 Skill 和 Agent，背后都是源源不断的 Token 消耗。你写的 Skill 越好用、越多人用，你帮模型厂商卖出去的 Token 就越多。这不是你直接卖 Token，但你是这条产业链上的分销渠道。而不管你选哪条路，你的护城河在我看来最终都会归结为三样东西：算力、算法、数据。算力影响你的吞吐量算法影响你的效率和成本数据决定你是不是不可替代

显示更多