搜索 Modeus 相关的推文

People's Daily Overseas-Haiwainet@haiwainet

2026.05.20 14:41

A young girl demonstrated her ability to freely switch her eyelids among three modes: single, double, and one single with one double. It's so cool! 小孩姐展示任意切换眼皮三种模式可单可双还可一单一双太酷了网友：教教我阿姨真的很想学这个！神奇绝活 #单双眼皮切换# #搞笑日常#

显示更多

0

1

转发到社区

李继刚@lijigang

2026.05.05 03:22

日读论文： From Context to Skills: Can Language Models Learn from Context Skillfully? (Ctx2Skill) 互斗写书，越斗越偏 ──────── 医生想用一份刚出的临床指南调整治疗方案。50 页文档，密密麻麻全是术语，规则之间还交叉引用。他真正需要的是把"什么病合什么药"变成几条能照着走的步骤。直接把整份指南扔给 GPT-5.1 让它答题，全 benchmark 平均对率 21%——大模型读完了，用不出来。这不是它"长上下文"不行，是 *它没把规则提炼成可以反复调用的小手册*。老办法是把人类标注员请来给文档画重点：把规则、流程、注意事项提炼成自然语言"技能"，附在 prompt 前面给模型用。但这条路有两个死结：一是*标注成本爆炸*——50 页技术文档，标注员要把整套领域逻辑读到能复述，几小时才标一份；500 份这么搞，人累死也搞不完。二是*没有外部反馈*——如果想让 AI 自动写技能，怎么验证它提炼对了？没有 ground truth、没有执行结果、没有标准答案，它瞎写你都不知道。已有的"自动写技能"方法（AutoSkill、SkillX 等）都需要环境给反馈信号——比如"代码跑出来对不对""任务完成没"——可面对一份纯文档，没人替你判对错。作者说不需要外人。让模型自己跟自己打——一个出题，一个解题，第三方判 pass/fail。每一回合，错题让解题方反省"我漏了什么知识"，过得太轻松的题让出题方反省"我出题不够刁"。两边各自维护一份自然语言的"技能手册"，回合结束之后改写各自的手册。这套循环不依赖人类标注，也不依赖任务本身的对错反馈—— *只用模型互相之间的胜负就能把技能写出来*。 ──────── 按常识，5 个回合互相磨练完，第 5 回合的 Reasoner 手册应该最强吧？错。论文做了固定回合的对照实验（GPT-4.1）：*单调下降*。越练越差。为什么？作者起了个名字： *adversarial collapse*——对抗坍缩。Challenger 越来越凶，开始出"考钻牛角尖"的题；Reasoner 为了应付这些极端题，把手册改得越来越歪——专为对付怪题而存在的条目挤掉了通用知识。两边都在围着一个不代表真实任务分布的"病态点"打转。更阴险的是， *这种崩塌在循环内部察觉不到*——Judge 每一回合只看当前题，没有信号告诉你"之前学会的事是不是被新条目挤丢了"。 ** 怎么找回早期的好手册：Cross-Time Replay 既然不能信"最后一版"，得回头挑。但凭什么挑？办法：在 5 个回合里偷偷攒两套小探针—— - *Hard probe*：每回合败得最惨（评分点通过率最低）的那道题 - *Easy probe*：每回合解得最轻松（评分点最少）的那道题循环跑完，把 5 个版本的 Reasoner 手册*回去重做*这两套探针。每个版本算两个分：在难题集上的解题率 ρ_h、在易题集上的解题率 ρ_e。 *选哪一版？* 让 ρ_h × ρ_e 最大的那一版赢。为什么是乘积不是相加？*乘积惩罚"舍弱保强"*——一个版本如果为了多解几道难题、把易题做塌了，乘积立刻塌（一个 0 拉低全场）；加法只算总分，掩盖短板。消融：换成加法 → -0.6%。 ──────── *你的对手如果只服你一个人，他会变成你的镜子，不是你的镜鉴*。 Self-play 跑久了，Challenger 出的题不再代表真实世界，只代表 Reasoner 当下还不会的边角；Reasoner 的手册也不再是知识，只是这场私局的应试手册。两个人在屋里关久了，一起走进自己造的回音壁。破解的办法不在循环里——*在循环之外保留一份"代表性参照"*，回头挑哪一版没飘走。Cross-Time Replay 是这个论文真正的灵魂，不是某个技术细节。它在说：*对抗优化必须配一个不参与对抗的判别器*，否则一定会塌。这个判别器不一定是人，可以是从对抗自己内部偷出来的、有代表性的小样本——但它必须独立于"当下这一刻在追什么"。

显示更多

0

1

39

1

转发到社区

Y11@seclink

2026.05.29 02:40

机器人世界模型（全新维度，0 去重 = 全新信息）核心项目： - Awesome-WAM（OpenMOSS）：World Action Models 综合论文列表，含 DreamDojo（从人类视频学习的通用机器人世界模型） - awesome-physical-ai：VLA 模型、世界模型、具身基础模型论文合集，含 NVIDIA Cosmos Predict2.5 - π₀/π₀.5（Physical Intelligence）：视觉-语言-动作流模型，通用机器人控制 - GR00T N1（NVIDIA）：通用人形机器人开放基础模型 - InternVLA-A1（阿里巴巴）：统一理解、生成和动作的机器人操作模型仿真环境： Genesis、Isaac Sim、MuJoCo 仍是主流操作策略： LeRobot（Hugging Face）、Octo、Diffusion Policy、ACT 是当前热门

显示更多

0

1

0

转发到社区

币天天-Action@xiaofeilong99

2026.06.02 06:00

别一上来就买 API 额度，先把免费模型入口摸清楚。 OpenRouter 有个 Free Models Router，专门处理免费模型路由。说白了就是：你可以先用免费模型做测试、跑 demo、接小工具，确认项目真的能跑起来，再考虑付费模型。这个对新手特别香： ✅ 做 AI 小工具原型 ✅ 测提示词 ✅ 跑轻量客服 ✅ 做学习项目 ✅ 给 Codex/Agent 测备用模型很多人亏钱不是因为 API 贵，是还没验证需求就开始烧钱。先白嫖测试，再决定要不要升级，这才是正常玩法。 🔗

显示更多

0

1

0

转发到社区

qinbafrank@qinbafrank

2026.05.11 01:04

Cerebras的IPO火爆，官方考虑大幅上调IPO定价区间。看路透社报道，Cerebras正考虑将IPO定价区间从此前的每股115至125美元上调至150至160美元，涨幅高达约28%。与此同时，公司还计划将发行股数从2800万股增至3000万股。若最终以每股160美元定价，Cerebras此次IPO募资规模将达约48亿美元。个人看Cerwbras的核心优势在于：WSE-3推理领域已建立一定优势，tokens/second 可达GPU集群的15-20倍（低延迟场景下尤其突出）。Agentic workflow、reasoning models、长上下文推理正是其优势凸显的领域。也拿到了大客户订单，OpenAI既是其股东也是签署了长期供货协议。而AWS已将CS-3集成到Bedrock，提供混合Trainium+ Cerebras推理方案。相当于技术和产品已经得到了验证、商业化正在落地。这个时机也很好，现在推理正在快速拓展、市场也希望能找到新的潜在英伟达挑战者、也会给更高的定价和预期。个人看未来的空间看WSE-4如果能成功落地，成本/性能比将进一步拉大差距，让Cerebras从“高端替代”变成“主流基础设施”。未来如果WSE-4成功=从“推理利基冠军”跃升为“AI基础设施第二梯队核心玩家”，市场空间进一步打开。看到两篇关于Cerebras的推文，值得细看： @LinQingV 的这篇 @roger9949 的这篇

显示更多

0

29

117

21

转发到社区

leifu _/@leifuchen

2026.05.06 08:08

好策略不一定要更强，但一定要不一样有些趋势跟踪策略的基金夏普比率（Sharpe Ratio）只有 0.3-0.5，也有很多资金认购，主要是因为策略配置时，除了收益以外，策略间的低相关性也很重要，怎么说 Sharpe 0.3 也是盈利策略。组合策略的 Sharpe 有收益线性叠加，波动按 √N 叠加的特点。N 个零相关、Sharpe 各为 S 的策略等权组合，组合 Sharpe = √N × S： - 4 个 Sharpe 1 的独立策略 → 组合 Sharpe 2 - 9 个 Sharpe 1 的独立策略 → 组合 Sharpe 3 - 16 个 Sharpe 1 的独立策略 → 组合 Sharpe 4 独立交易员 Scott Phillips 在 Flirting With Models 的节目公开过他的加密组合策略，包括： - 趋势跟踪（CTA 风格，以 50% 年化波动率作为仓位控制的约束）：过去 4 年 Sharpe 1.7，收益分布正偏（大部分小亏，小部分大赚） - 横截面动量（所有币按波动率标准化后，按过去 N 天收益排名，前几名开多，空后几名开空）：Sharpe 略高于 1.7，收益分布不如趋势偏向单边大赚 - 横截面套息（所有币按资金费率排名，最高的开多，最低的开空）：Sharpe 1.7（与趋势跟踪相近），收益分布是负偏（大部分小赚，小部分大亏），而且这个策略与前两个策略的相关性明显低。 Scott 最后总结：“这三个一起运行，很容易达到 Sharpe 2 ，执行上不需要太精细。” 按之前的公式倒推：N = 3，Sharpe 各 1.7，组合 Sharpe 取决于两两相关度 ρ： - ρ = 0.5 → 组合 Sharpe 2.08 - ρ = 0.3 → 组合 Sharpe 2.33 - ρ = 0 →组合 Sharpe 2.94 可见相关度越低的策略在一起，对组合 Sharpe 提升越大（相关性在极端行情会失效，不过这是另一个话题，这里不展开）。上面这几个策略都是价格方向上的相对排名，机制上有不少同源。要再降低相关性，就需要换一个完全不同的维度。波动率策略做的是隐含波动率和实际波动率之差（波动率风险溢价），与价格方向的相关性显著变低。AQR 在波动率策略的研究里提过，波动率风险溢价策略与动量、套息、趋势的相关性都很低，所以将这类策略纳入组合，能显著降低波动性，从而提升组合 Sharpe。可以试算一下，我们假设当前组合的相关性为 0.5，夏普为 2.08，此时加入一个 Sharpe 1.2 且和其他策略相关性只有 0.1 的新策略，那么新组合 Sharpe 将提升为 2.29。即使新增策略的 Sharpe 略低，依然使得整个组合的 Sharpe 提升了 10%。这是配置层面的杠杆：加入不同源的新策略，等于打开了一个新世界。

显示更多

0

5

54

6

转发到社区

阑夕@foxshuo

2025.10.15 13:35

Grok Imagine的视频能力进步也挺大的，尤其是在NSFW方面，目前我还没有解锁全功率的Spicy模型，但靠通用模型已经能跑出尺度相当宽松的AI视频了，你们可以感受一下。测试下来的总体感受就是，Grok和Sora 2都是在走消费级路线，主打不会写提示词也能抽卡抽出及格线以上的作品，有点类似代码补全的原理，默认的Normal和Fun两款模型，一个负责转化动效，一个负责抽象鬼畜，分工还挺合理的，而且对图片构图的要点get得非常不错，在零提示词或者少量提示词的干预下能够做出符合预期的判断。 Spicy模型虽然没有全量上线，而且被灰度的用户也是时有时无，但其实可以在提示词里加入mode=spicy来实现破甲，原本被系统拦截的图片也可以重新生成视频。（1/n）

显示更多

0

36

562

44

转发到社区

一枝独秀SJ/苏静@sujing110

2026.05.11 23:11

邻居旅行结束回来一周了。始终没有单独时间见他。其实也不是一定要单独见，只是觉得应该说几句两个人之间的话。所以虽然约好晚上大家一起去喝酒，他还是想让我出来，我也觉得应该有哪怕十分钟的独处。所以吃完午饭，擦地洗澡，完了我对徐说我去取货。徐问重不重，要不要他搬，我说不用，袋子拎就可以。他说好吧。一出门我就短信给徐说，其实是去对面的咖啡厅......他说他知道。我说你知道我也得说清楚。不隐瞒是我们彼此的约定。于是，没有负担地，我在午后温暖的阳光里走到"老地方"......邻居坐在室外等我，一样的茶杯，倒满了热茶。我在对面坐下来，虽是深秋，那时却有点热，我脱了外套。他捏了我胳膊几次。喝茶。聊怎么增进大家的感情，以及以后要怎么相处。他也说要磊落，不做偷偷摸摸的事。我同意。邻居好奇徐怎么变了，以前在我的描述里，他似乎并没有太干涉我的个人交往......我说人都是可能会变的，他能坐下来和你喝酒说话，已经很了不得了。和徐分开的几年里，有人对我好，照顾我，他觉得可以接受的。可是在一起了，他可能会变得比原来"贪婪"(他其实一点也不)些，想拥有我全部，也能理解。而且他并没有严格限制我，相反，他可能也在内心说服自己，接受再接受......只因为爱我，希望我更快乐。简单聊了20分钟的样子，我要去取货，他也有事了，就一起去了药店。在药店，他也只是从后面轻轻抱了我一下......那一刻，我想念被拥抱，想念熟悉的体温与气味。但想着晚上也会见面，也就作罢。人不能过于强求。晚上七点半，我和徐去他家楼下时，他的车子已经开了出来。他在等我们。徐坐副驾驶座。我坐后座。本来也是为了他们增进了解，才组的酒局。一上车，邻居说特斯拉澳洲将不卖ModelS和ModelX了......这是个好话题，两人有了比较好的开场话题。到了酒吧，我和邻居过去两年里来过无数次的熟悉的酒吧。他们并排坐下，我坐在对面。这个坐法，是因为他们要看球，要面对着最大的电视屏幕，而我不看也看不懂。徐对美式橄榄球了解得多一些，邻居说澳式的更有趣。所以他给徐谅解了澳式的一些规则，很快，徐就看进去了。而且徐也会虚心地请教邻居问题。一边看球，也聊天，聊房子。聊哪个区好点，聊买哪种房子，他问考不考虑townhouse，我们表示不考虑......其实人就是不知满足，如果不追求 house，不追求投资，有得住，现在就可以过得很好。人啊...... 中途徐去卫生间，他抓住我的手，相互摩挲了几下，也没说什么过分的话，就静静地等徐出来。他们每人喝了三杯啤酒，我喝了一杯鸡尾酒。吃了一盘薯条。 10点的样子，一起回家，临下车的时候，徐说：改天我们请你喝酒。我脑海里竟然是在我家，做几个小菜，大家一起聊天喝酒，或许还可以小暧昧......谁知道呢?一切都得顺其自然循序渐进不是? 各自回到家后，邻居问：你今天想吗?我实话实说：想。

显示更多

0

15

43

0

转发到社区

區塊先生 🐡 ⚠️ (rock #58)@mrblock

2026.04.26 14:19

🦞 如何免費使用 AI ？ Qwen3.6 27B 模型直接在 MacBook Pro 上用 llama.cpp + Pi coding agent 完全本地運行，飛航模式、零網路！😱😱 這樣本地跑（llama.cpp + Pi coding agent），你就完全不用花錢 subscribe 任何雲端 AI了！ • 不用 Claude Pro、ChatGPT Plus、Grok Premium 之類的月費 • Qwen3.6 27B GGUF 模型從 Hugging Face 一次下載就永久免費使用 • Pi coding agent 本身也是完全開源 MIT 免費（npm 安裝就行） • 之後不管跑多少次、做多少 coding 任務，都零 API 費用唯一的小成本只有： ✅ MacBook 要夠力（推薦 32GB+ 記憶體，M 系列 Metal 加速最順） ✅ 第一次下載模型花一點時間跟硬碟空間 ✅ 跑的時候電費會多一點點但之後就是真正零月費、無限使用的本地 AI coding 神器！隱私還 100% 保障，飛航模式也能跑，超爽👍 處理 Hugging Face 真實程式碼庫的複雜任務，表現幾乎追平 Claude Opus！這就是 AI「第二革命」——強大本地模型正式實用化！隱私、安全、資料主權一次到位，早鳥直接起飛 💨 👉🏻👉🏻 想自己馬上開始裝嗎？超簡單上手（Mac 適用）： 1. 安裝並啟動 llama.cpp server（下載 Qwen3.6 27B GGUF 模型，推薦 Q4_K_M 量化，Mac 用 Metal 加速） 2. npm install -g @mariozechner/pi-coding-agent 3. 編輯 ~/.pi/agent/models.json 指向本地 llama.cpp（baseUrl: http://localhost:8080/v1） 4. 在你的專案資料夾直接執行 pi 指令就起飛！詳細文件：（或 Pi GitHub：開源本地 AI，真的要改變遊戲規則了！誰來一起玩？🔥 推薦用 etherfi卡買MacBook 能省3～4%

显示更多

Julien Chaumond@julien_c

2026.04.24 12:03

This is where we are right now. And i’m not gonna lie it feels pretty magical 🧚‍♀️ Qwen3.6 27B running inside of Pi coding agent via Llama.cpp on the MacBook Pro For non-trivial tasks on the @huggingface codebases, this feels very, very close to hitting the latest Opus in Claude Code, or whatever shiny monopolistic closed source API of the day is. In full airplane mode. Most people haven’t realized this yet. If you have, it means you have a huge headstart to what I call the second revolution of AI. Powerful local models for efficiency, security, privacy, sovereignty 🔥

显示更多

0

7

36

5

转发到社区

Kirara🩵@0xKirara

2025.11.12 11:55

我过去花很多时间去“复刻角色”。现在，AI 几秒就能生成一个世界。有人问我：以后你cos还有什么意义？我说：打不过就加入！😘🤖 所以我加入了 Base 最强 AI 项目 @FLock_io，担任 APAC Lead ，新旅程就此开启。 🌐 我印象中的FLock build就像找伴侣、找战友、找目标，首先是靠谱，再次还得是个潜力股。 FLock给我的感觉并不是一个Web3项目，而是一个传统AI大厂。作为一个市值只有4000万的公司，它是 🔹联合国发展署（UNDP）官宣的战略合作伙伴， 🔹通义千问的垂类小模型的官方合作伙伴， 🔹服务7个国家政府部门，全球8家医院的AI服务提供商，顶刊顶会拿到手软， 🔹在纳斯达克和港股拥有两家自己的 $FLOCK 微策略。 🧠 FLock 的原理 FLock是个AI模型训练平台。是首个将联邦学习（Federated Learning ）与区块链融合的 AI 平台。吸引我的，是FLock 在做一件既难、也正确的事：让 AI 能在保护隐私的前提下学习、协作、形成共识。抛开晦涩的技术不谈，给大家举个通俗易懂的例子： FLock就像滴滴🚗，AI训练师就是快车司机，客户就是乘客。作为平台，它提供了一个串联起模型需求和供给两方的界面。至于那些联邦学习、MMRAG啥技术的，回头慢慢教你们！ 🌏 我的角色作为FLock亚洲第一客服，我致力于让更多亚洲的开发者、研究者与项目方体验去中心化智能的新形态，推动更多真实场景（医疗、金融、教育、社交等）接入 FLock 网络。有任何问题欢迎随时私信我。我也会在各大FLock的活动现场回答大家的问题！从我买第一枚比特币起，常说：Not your keys, not your coins. 而在我踏入 AI 领域的此时此刻，是时候加上一句：Not your models, not your AI.

显示更多

0

223

316

7

转发到社区