註冊並分享邀請連結,可獲得影片播放與邀請獎勵。

檢索結果 MINI
MINI 貼吧
一個關鍵字就是一個貼吧,路徑全站唯一。
建立貼吧
用戶
未找到
包含 MINI 的搜尋結果
MINI炮机 伸缩距离太短 不是很推荐 女人还是喜欢大且粗的 切记
0
3
99
113
轉發到社區
MINI炮机 伸缩距离太短 不是很推荐 女人还是喜欢大且粗的 切记 @ToBulaer @ToBuerma @KawasawaSen @BulmaList
0
36
1.5K
65
轉發到社區
#mini蛋儿# 宝宝们问你们一个问题你们会对我打吗😬
minimax今天的市值是1500亿,但是kimi上轮估值是180亿美金,已经没差太多了,更可怕的是,minimax这才解禁了多少啊。。
MiniMax 今日发布 M3 大模型 目前唯一同时具备顶尖编程、百万级超长上下文与原生多模态桌面操控能力的开源路线模型(计划 10 天内开源权重)。 在 SWE-Bench Pro 上拿下 59.0% 成绩,超越 GPT-5.5 与 Gemini 3.1 Pro,接近 Opus 4.7;Terminal Bench 2.1 也达到 66.0%。首创稀疏注意力 MSA 架构,百万上下文下每 token 计算量降至上代 1/20,预填充加速 9 倍、解码加速 15 倍。 实测已能自主复现 ICLR 2025 论文、24 小时内调用工具 1959 次优化 Hopper FP8 算子。MiniMax Code 同步更新,支持 computer use 桌面操控。 订阅 Plus 档每月 49 元即可获得 6 亿 token(约 Claude Pro 的 5 倍容量),API 已上线,提供 thinking 与快速模式。
顯示更多
MiniMax M3 要来了啊,挺期待的 仔细看图,1M上下文没得跑了 相比 MiniMax M2 的速度提升巨大 就是,为什么不跟 MiniMax M2.7 对比?🤣
MiniMax 发布技术博客,披露其 M2 系列大模型无法输出人名「马嘉祺」的根因排查过程。排查从一个个例出发,最终揭示了一个波及整个词表近 5% 的系统性退化问题。 根本原因是大模型两个训练阶段的数据覆盖严重脱节。第一阶段(预训练)用海量互联网文本编出了一本约 20 万词的「字典」;第二阶段(后训练)用精选的对话数据教模型说话,但这份对话数据只覆盖了字典里的一部分。字典里有、但对话数据里没练到的词,就会在第二阶段逐渐被遗忘。 「嘉祺」就是这样的一个词。分词器(tokenizer,负责把文字切成模型能处理的最小单元)因为在互联网文本中见到「嘉祺」连用的次数够多,就把它合并成了一个独立单元。预训练时模型学会了这个词,但后训练的对话数据里包含「嘉祺」的样本不到 5 条。后训练不断调整模型参数,练到的词越来越准,没练到的词则在参数更新中被带偏。最终,模型仍然「认识」马嘉祺、能准确回答相关信息,丢失的只是把这个名字写出来的能力。 退化排名靠前的还有「传奇私服」「无痛人流」等互联网 SEO 垃圾词。这类词在预训练的互联网语料中铺天盖地,分词器给了它们独立编号,但精选的后训练对话数据不会收录这些内容,结果同样被遗忘。 团队对完整词表做了全量扫描,发现约 4.9% 的词发生了显著退化。退化最严重的是日语:29.7% 的日语词显著退化,远超韩语 3.3%、俄语 3.7%、中文 3.9% 和英文 3.5%。 日语的严重退化还解开了一个旧谜。此前模型在日语对话中偶尔混入俄语或韩语字符,一直找不到原因。这次分析表明,大量日语词退化后,在模型内部的参数空间里「漂」到了其他语言的地盘上,导致模型该写日语时错写成俄语或韩语。 修复方案是构造一份覆盖全词表的合成数据,让模型用简单的复读任务把字典里每个词都练一遍。效果立竿见影:日语回答中混入俄文字符的比例从 47% 降至 1%,全词表参数稳定度从最低 0.329 升至全部高于 0.97。
顯示更多
0
16
847
124
轉發到社區
MiniMax 回应 M2.7 模型为什么采用非商业许可:主要原因是解决影响声誉的问题。部分平台过度量化、模板错误甚至冒充 M 系列模型,这些问题导致用户认为 M 系列模型就是个水平中等的模型,现在 #MiniMax# 要求商业使用必须授权,可能要求签署相关协议确保提供足量的 M2.7 模型:
顯示更多
.@MiniMax_AI 开源 M2.7 模型,但采用的是非商业许可,禁止任何商业性用途,所以也不能算是开源。M2.7 采用的非商用许可,禁止任何商业性用途,例如 OpenRouter 等平台无法通过托管模型对外提供 API 服务,目前这事儿已经在开源社区引起巨大的争议。查看详情:
顯示更多