搜尋 MINI 相關推文 — 推特瀏覽器

NTRWUR0SE@NTRWUR0SS

2026.06.15 10:11

MINI炮机伸缩距离太短不是很推荐女人还是喜欢大且粗的切记

0

3

99

113

轉發到社區

ROSEWU@NTRWUROSE

2026.06.15 04:49

MINI炮机伸缩距离太短不是很推荐女人还是喜欢大且粗的切记 @ToBulaer @ToBuerma @KawasawaSen @BulmaList

0

36

1.5K

65

轉發到社區

Mimi蛋儿@KenyaSean35448

2026.06.13 14:53

#mini蛋儿# 宝宝们问你们一个问题你们会对我打吗😬

0

1

31

1

轉發到社區

龙心盐@ssslumdunk

2026.06.10 01:41

minimax今天的市值是1500亿，但是kimi上轮估值是180亿美金，已经没差太多了，更可怕的是，minimax这才解禁了多少啊。。

0

1

0

轉發到社區

HK•L_牛英俊@abyssofgambling

2026.06.03 09:38

@minimisue2022 @yuxin_pig 跟黄毛名媛也要讲证据？

0

1

0

轉發到社區

ME News@MetaEraCN

2026.06.01 02:57

MiniMax 今日发布 M3 大模型目前唯一同时具备顶尖编程、百万级超长上下文与原生多模态桌面操控能力的开源路线模型（计划 10 天内开源权重）。在 SWE-Bench Pro 上拿下 59.0% 成绩，超越 GPT-5.5 与 Gemini 3.1 Pro，接近 Opus 4.7；Terminal Bench 2.1 也达到 66.0%。首创稀疏注意力 MSA 架构，百万上下文下每 token 计算量降至上代 1/20，预填充加速 9 倍、解码加速 15 倍。实测已能自主复现 ICLR 2025 论文、24 小时内调用工具 1959 次优化 Hopper FP8 算子。MiniMax Code 同步更新，支持 computer use 桌面操控。订阅 Plus 档每月 49 元即可获得 6 亿 token（约 Claude Pro 的 5 倍容量），API 已上线，提供 thinking 与快速模式。

0

轉發到社區

Andy Stewart@manateelazycat

2026.05.27 03:00

MiniMax M3 要来了啊，挺期待的仔细看图，1M上下文没得跑了相比 MiniMax M2 的速度提升巨大就是，为什么不跟 MiniMax M2.7 对比？🤣

0

4

12

0

轉發到社區

思维怪怪@0xLogicrw

2026.05.10 04:19

MiniMax 发布技术博客，披露其 M2 系列大模型无法输出人名「马嘉祺」的根因排查过程。排查从一个个例出发，最终揭示了一个波及整个词表近 5% 的系统性退化问题。根本原因是大模型两个训练阶段的数据覆盖严重脱节。第一阶段（预训练）用海量互联网文本编出了一本约 20 万词的「字典」；第二阶段（后训练）用精选的对话数据教模型说话，但这份对话数据只覆盖了字典里的一部分。字典里有、但对话数据里没练到的词，就会在第二阶段逐渐被遗忘。「嘉祺」就是这样的一个词。分词器（tokenizer，负责把文字切成模型能处理的最小单元）因为在互联网文本中见到「嘉祺」连用的次数够多，就把它合并成了一个独立单元。预训练时模型学会了这个词，但后训练的对话数据里包含「嘉祺」的样本不到 5 条。后训练不断调整模型参数，练到的词越来越准，没练到的词则在参数更新中被带偏。最终，模型仍然「认识」马嘉祺、能准确回答相关信息，丢失的只是把这个名字写出来的能力。退化排名靠前的还有「传奇私服」「无痛人流」等互联网 SEO 垃圾词。这类词在预训练的互联网语料中铺天盖地，分词器给了它们独立编号，但精选的后训练对话数据不会收录这些内容，结果同样被遗忘。团队对完整词表做了全量扫描，发现约 4.9% 的词发生了显著退化。退化最严重的是日语：29.7% 的日语词显著退化，远超韩语 3.3%、俄语 3.7%、中文 3.9% 和英文 3.5%。日语的严重退化还解开了一个旧谜。此前模型在日语对话中偶尔混入俄语或韩语字符，一直找不到原因。这次分析表明，大量日语词退化后，在模型内部的参数空间里「漂」到了其他语言的地盘上，导致模型该写日语时错写成俄语或韩语。修复方案是构造一份覆盖全词表的合成数据，让模型用简单的复读任务把字典里每个词都练一遍。效果立竿见影：日语回答中混入俄文字符的比例从 47% 降至 1%，全词表参数稳定度从最低 0.329 升至全部高于 0.97。

0

16

847

124

轉發到社區