搜尋腾讯混元相關推文

2026.05.18 11:52

腾讯混元及 SSV 数字文化实验室联合中科院信工所等机构，正式推出首个覆盖「七体之变」的古文字感知评测基准 Chronicles-OCR。该基准包含 2800 张由专家交叉标注的图像，首次将甲骨文到草书等七种字体的识别难度统一量化。研究团队评测了 28 个主流多模态大语言模型，结果显示它们在古早字体上几乎全军覆没。在跨时代字符检测任务中，GPT-5 和 Gemini 2.5 Pro 的核心指标接近 0，表现最强的模型也仅有 16.5。即使直接在图上画框免除定位步骤，最高准确率也只有 27.1%，其中 Gemini 3.1 Pro 在甲骨文上的准确率仅 14.0%。这证实了现代模型严重依赖规整的现代版式先验。面对无约束、强噪声的古代物理介质，模型的文本分割机制直接失效。字体分类结果进一步表明，模型往往是在识别载体纹理（如龟甲或青铜锈），而非真正的字符笔画。实验还揭示了一个反直觉的现象：开启思考模式反而会导致古文字识别率下降。对照显示，几乎所有支持该模式的模型在开启思考后表现退化。当底层视觉感知缺失时，思维链不仅无法纠错，反而会变成幻觉放大器，输出高自信的错误答案。

0

轉發到社區

PKU Blockchain@PKUBlockchain

2026.06.03 07:53

合作伙伴 | ETH Beijing 黑客松 × 腾讯混元 ETH Beijing 黑客松（6 月 5–7 日）很高兴迎来腾讯混元（Tencent Hy）成为本次活动的合作伙伴。本次合作中，混元团队将来到现场，和参与的同学与 builder 们交流开源模型与前沿技术，分享实践经验，也一起探讨大家在构建过程中遇到的真实问题。我们始终相信，开源社区是技术进步的重要推动力。期待在黑客松的这几天里，为开发者们创造更多面对面交流与共创的机会。黑客松举办在即，点击官网了解日程安排： #ETHBeijing# #Hackathon# #腾讯混元# #开源#

0

8

0

轉發到社區

Andy Stewart@manateelazycat

2026.05.07 03:29

在“无人关注”的角落，腾讯混元发布了一个离线翻译模型，仅440MB。号称用 1.8B 的参数翻译效果比 Tower-Plus-72B、 Qwen3 35B 的效果都好。微信自带翻译不会就是这个吧？感觉翻译很快也比较准啊。🤔

0

54

719

72

轉發到社區

阑夕@foxshuo

2026.01.07 11:31

一财放了点姚顺雨的料「腾讯混元3年变形始末」，开始对外传递腾讯在大模型上的组织变化了，这是一个很明确也很有看头的信号，腾讯去年在AI上投了很多钱，但取得的成效我猜内部是不太满意的，所以要在场外做点找补。而且自从张小龙之后腾讯也不太喜欢以人为主体来建立叙事，满打满算十年来就游戏线的马晓轶和香港帮的汤道生会出镜比较多，这次开始给一个刚入职的新人包装造势，可以说是排面拉满了，也符合AI行业小登为王的趋势。还是给这篇文章里一些有价值的信息划划重点： - 姚顺雨27岁，是国内大模型团队里最年轻的「一号位」，他在OpenAI只工作了一年，说不上特别核心，但负责的推理模型技术，让他很适合承接从ChatBot到Agent的业务升级，腾讯重金挖他过来，也是急于让他来主导下一个Agent模型的训练； - 腾讯对大模型的反应在国内属于相对落后的那一批，所以人才储备非常薄弱，之前负责大模型业务的两个Leader都没有自然语言处理的背景，团队构成非常「不对口」，去年开始给出薪酬翻倍的条件到处挖人，字节的2-2跳来腾讯就给T12或者T13，相当于直接上涨1-2个职级，再往上T14差不多就是首席科学家了； - 人才流动主要还是在「BAT」三家里内循环，2024年是字节在从阿里撬人，2025年是腾讯开挖自己的墙脚，而年底我们又看到了字节大幅涨薪的通知，内部信里明确表示要保持待遇领先于头部水平，最新的消息是，「腾讯只看来自DeepSeek、月之暗面、字节和阿里这4家基座模型团队的候选人，其他公司是不看的」； - 马化腾对大模型存有误判，他曾打比方说，在工业革命时期，早一个月还是晚一个月把灯泡拿出来，其实没有那么重要。而腾讯错过了很多实验先机，包括浑元大模型如今有些过于路边——在大多数基准测试里，浑元连一个对比项都当不上——所以去年开始着急，很大程度上是在补落下的课； - ChatGPT出来的那一轮周期，正好叠加了腾讯在搞降本增效，对各种「不必要」的花费卡得非常死，AI Lab的员工想去参加学术会议，公司不给钱，继续想办法蹭高校的预算，而AI部门为了完成创收指标，也需要去服务游戏和广告业务，由此结算经济价值，留在基础研究上的人力很少； - 在把姚顺雨放到「一号位」之前，腾讯在大模型上的态度更接近于「调门大、行动少」，既缺少资源，也没有领头人，公司在危机意识层面依然被抖音牵制，以致于总办最关注的业务始终是视频号，而腾讯擅长的赛马机智，在大模型这种「集中力量办大事」的行业不管用了，微信也训练过自己的模型，然后还是放弃了； - 直到去年，腾讯终于开始效仿字节Seed，重新组建符合大模型研发标准的组织架构，设立更符合前沿科学原理的岗位，再去为一个个的坑找萝卜，并逐步淘汰掉旧技术线的人力，当姚顺雨空降落地之后，管理上的障碍基本上也都已经打扫干净了； - 今年会是姚顺雨的大考，他需要为腾讯训练出一个足以回到牌桌上的领先模型，只有高分答卷，才能让他坐稳在腾讯这家大厂AI一把手位置，好在前人的肩膀够多，相比GPT-4和o1时代大家都不知道怎么实现的盲目，现在的大模型行业已经少了很多「秘方」，头部模型的能力更是高度对齐，留给腾讯的时间，不多但也不少。

0

48

213

15

轉發到社區

阑夕@foxshuo

2026.01.30 06:21

晚点发了「BAT」（字节、阿里、腾讯）开启中国AI决赛圈的深度报道，完成度太太太高了，目测同题无人可敌，牛了个逼的。我还是来划划重点，贡献一点尾气： - 三大巨头虽然都开始在AI应用层较劲，但各自遇到的问题都不一样，这和公司文化、管理风格、资源禀赋等因素有关，更关键的是，在AI赛道，从模型到产品，「一号位」的影响都太大了，回头再看这波澜壮阔的一年，无论是产生问题还是解决问题，都和「一号位」高度绑定，充满了人类群星闪耀时的英雄史观； - 在找来姚顺雨之前，腾讯混元大模型的两任负责人都不是自然语言专业出身，而在训练混元时，由于对打榜过于看重，于是有意识的选择在数据集上做训练——行业里其实还有很多刷分模型都这么干——以致于虽然分数能上去，却在真实场景失去了稳定性，姚顺雨作为外力，同时承担着拨乱反正的使命，为腾讯训练出对齐行业第一梯队的基模；阿里突然发力千问是马云意志的落地执行，这个已经不是秘密了，千问单日投放峰值超过1500万人民币，相当于把单日利润的接近1/10都砸出去了，同时阿里还要把去年制定的3年花掉3800亿的AI预算加码到4800亿，目前已经在用卡车来运GPU，甚至一度跟游戏玩家抢4090这种消费级显卡，就怕算力不够； - 腾讯模型还在整顿，阿里产品起早赶晚，相比之下字节更加均匀，豆包和豆包大模型——注意区分二者——去年的表现都是MVP级的，豆包日活率先破亿，豆包大模型的日均消耗Tokens和谷歌相差无几，但字节其实是三家里起步AI最迟的一家，全靠「大力出奇迹」的组织效率完成了超车，只能说整个过程都很字节：（1/N）

0

17

380

69

轉發到社區

Y11@seclink

2026.05.26 03:26

Marvis（马维斯）是腾讯（应用宝团队）推出的操作系统层级AI助手，2026年5月20日正式上线，官网可直接下载（Windows/Mac/Android已开放，iOS预计6月中旬）。它不是单纯的聊天机器人，而是能深入系统底层、真正“干活”的AI，像钢铁侠的Jarvis一样，用自然语言操控电脑/手机。核心定位：把整台电脑变成可对话的智能对象。整合系统、文件、应用、算力、跨端连接。架构：1个主Agent（PM）+ 5个副Agent（File文件、Computer系统、App应用、Browser浏览器、Search搜索），并行协作拆解执行复杂任务。两种模式：效率模式：端云协同（DeepSeek V4、混元等），又快又准。隐私模式：纯本地大模型，文件0上传，断网可用，适合财务/法务/HR等敏感场景。每日免费：1000万Token，日常够用。

0

轉發到社區

0xTodd ( thinking )@0xTodd

2026.03.20 03:00

没想到腾讯居然真的给我发了 QClaw 的邀请码😆。于是乎我把它装在了我的 Mac mini 里面。一个直观的体会是，至少在国内吧，所谓代安装龙虾、代卸载龙虾，这些产业链，随着邀请码的放开，看起来马上就要凉了。腾讯这个 QClaw 安装实在是太太太太太太简单了。以 Mac 为例，下载了一个 DMG 文件，输入邀请码马上就能启动，不用配置任何的 API。大模型的 API 也有开机默认使用的免费版，不过，我手动地把 QClaw 的大模型改成了 Kimi。 PS：为什么没用 MiniMax 呢？因为它这里面居然只支持 MiniMax 国内版😅，也就是 MiniMaxi。和我的那个海外版不互通。说回正题，这个安装可以说是非常非常简单。而且，毕竟是腾讯的产品，微信扫个码，就相当于装上 Gateway 了。你通过微信（注意不是企业微信，就是正常版本的微信）就可以直接控制你的 QClaw 了。我测试了一下，对着微信说：“你帮我打开我电脑上的哔哩哔哩找视频给我播放。” 它大概思考了几秒钟，真的就打开浏览器，开始给我放起了视频，这个还是比较可用的。最后，你要问 OpenClaw（也就是正版龙虾）和腾讯的 QClaw（Q 版龙虾）有什么区别呢？区别主要是安装体验层面，它比腾讯毕竟还是做这种产品起家，整个的安装体验非常良好。实现的功能也大差不差，只不过这里面目前只有国产模型（比如里面还有元宝、混元之类的）。另外对于国内的用户来说，毕竟下一个 TG 或者 Discord 还不是很方便；飞书和企业微信呢又班味儿太重。所以最好最好呢，就是微信，毕竟每一个老中人都离不开微信嘛，直接在微信里指挥 QClaw 干活，还是蛮有意思的。

0

45

65

9

轉發到社區

杰克船长宏观策略@macrotradecn

2026.01.15 02:37

《能帮你办成400多件事的AI来了，阿里开启了新纪元》1月15日，千问App深度接入支付宝政务服务与“AI付”功能，实现签证、户口等50项民生服务的“一句话办理”，还完成了跨App的服务调度与支付闭环——这不仅是中国第一款真正打通多个App的AI智能体，更印证了唯有阿里具备突破行业壁垒的生态硬实力，腾讯、字节短期内难以复制。 AI智能体的核心价值，在于打破“应用孤岛”实现自主执行，而这需要底层技术、生态资源与商业闭环的三重支撑，恰恰是阿里的独家优势。千问此次并非简单跳转链接，而是Agent级别的深度调用：用户一句“周末去杭州订高性价比行程”，即可触发飞猪查机酒、淘宝选用品、闪购备补给、支付宝完成支付的全流程协同，后台无需用户手动切换任何App，真正实现“一个智能体管理所有服务”。这种能力的背后，是阿里沉淀几十年的生态协同基因——从电商、支付到本地生活，阿里旗下各业务早已实现数据互通与接口标准化，而千问作为“超级大脑”，正是激活这一生态的关键钥匙，目前能够帮用户办理400多件事情。反观腾讯与字节，其布局基因决定了难以突破跨App协同的核心瓶颈。腾讯的AI布局聚焦社交生态，混元大模型虽接入近700个业务，但核心围绕微信、游戏等自有场景，对外生态的开放性不足，且缺乏统一的支付与服务闭环，难以实现跨平台的无缝调度。字节跳动则主打数据驱动与多模态技术，豆包等产品虽覆盖广泛场景，但企业服务生态不完善，缺乏电商、支付等核心执行环节的支撑，更难以撬动外部政务服务资源，只能停留在“问答助手”阶段，无法落地“自主办事”的智能体能力。二者的短板本质上是生态布局的结构性缺失，短期内难以弥补。千问的突破性，更在于攻克了智能体时代的“三道墙”：设备墙、应用墙与接口墙。通过阿里统一的技术中台与数据标准，千问实现了不同App间的协议转换与数据同步；依托支付宝的政务服务资源，打通了政府部门与商业平台的信息壁垒；凭借标准化的API网关，将各业务功能拆解为可自由调用的“乐高积木”。这种从底层基建到上层应用的全栈布局，正是阿里独有的优势——腾讯依赖外部底层技术，字节缺乏完整的服务生态，均无法构建如此全面的协同体系。作为中国首款真正意义上的跨App AI智能体，千问的落地标志着阿里在AI竞赛中实现了维度领先。当其他巨头还在聚焦模型参数与单一场景优化时，阿里已通过生态协同，让AI从“会说话”进化为“能办事”。这不仅是技术创新的胜利，更是生态布局的必然结果——唯有阿里，能将分散的服务资源拧成一股绳，通过千问智能体交付给用户。未来，随着更多场景接入这一生态，千问将持续拓宽智能体的能力边界。而腾讯与字节若想跟上步伐，不仅需要技术迭代，更需重构生态布局与开放理念。但至少目前，阿里千问已凭借独家生态优势，成为中国AI智能体时代的绝对领跑者，其开创的跨App协同模式，将定义未来数字服务的新范式。

0

1

24

8

轉發到社區

喵爸有毒@Tresmort

2026.06.02 05:49

我一直没有说“侵权”，说“抄”也只是说抄创意和思路。我在出版业和广告业好歹瞎混过几年，不用认为，可以明确地告诉你，你没有法律意义上的侵权。正如腾讯这个“天下第一抄”如今也可以用来做被抄的样例一样，可能反直觉，但复制功能和创意并不触犯版权法。我看不上的并不是你的开发和开源行为，这也没有什么不好。我在意的是你明知道老王连续几个月推广时说很多客户冲着这个功能来买懒猫，即使这不是产品的主要功能，至少也是一个销售卖点。然后你一边说买不起的走这边，一边给同类nas产品递刀子，还要再利用他的名气宣传自己。这就好比什么呢？比方你在一家饭店隔壁开了个摊，只是自己买菜也就罢了，偏偏要白送人家招牌菜同样的原配料，又站人家店门口说“客人们你们吃不起他家可以去别家或自己做”，顺便白送上一份菜谱。老王为什么只要求注明创意出处？注明了也就作罢了？因为在他的立场上他也知道不可能真的去告你，但他又不好说或不认为真的动了他多大的利益。但是至少有一点，他事先写好的关于云微信这个卖点的推广文案从此都被你废了，然后还要夸奖你做得好不成？你既然也知道会对懒猫的销售产生或多或少至少不为零的影响，那至少一开始就在readme中说明帮人挽回一点名气而不是借用名气往自己项目引吧？再退一步，既然你欣赏这个团队，应该也知道他们提供的是硬件加服务，以及产品本身的概念价值，至少不用提“买不起走这边”暗示懒猫产品贵而误导潜在消费者吧？

0

1

2

1

轉發到社區

龙心盐@ssslumdunk

2026.04.10 03:26

反努力 1 最近一个新闻很有意思，郭帆说采访了1000多个新时代的年轻娃们，都表示不愿意努力了，这也让他去思考了一下流浪3的主题，可能不能完全用宏大叙事来构成了，需要关注新一代人的虚无感。 2 很多人说网络放大了人们的焦虑，让女人认为年入百万很容易，滋生嫉妒，让男人认为成功是极小概率事件，从而放弃当前的吃苦而原地躺平，以前那些成家立业全部抛开，反而一身轻。就好像你刷一下x到处都是财富密码和一天百倍的永赚博主，你还能看的上年化10%的策略吗？可能还不够付你的资金费率。 3 如果我们拿身边的人去统计，你会出现大量的幸存者偏差，比如你走进市中心的星巴克，你会觉得全是帅哥美女商务范，但是大多数人其实电瓶车和公交地铁，那边才是颜值均值。而如果你看你的同班同学总有混的很不错的，但有没有可能哪怕是同学在离开学校后本身也形成了一个所谓的中产圈才能让大家加的上微信？ 4 去伪存真，某种意义上，ai解决这个问题你只需要把你的择偶标准告诉ai，就能立刻帮你筛选出来到底你所在的地区有多少人复合要求，哪来那么多年入百万有钱有闲的成功人士天天给你发私信···还不都是杀猪盘➕嘴炮的影分身··· 5 随着豆包的dau超过1亿，我对腾讯更加悲观了，所谓社交里面的多少无效沟通可以被豆包接管，再叠加有1亿人不断的帮助豆包去迭代模型，以后字节做任何产品都拥有了全天下最强的共享大脑。至于老外的ai，最有价值的应该是grok，因为自带了x的数据产出能力。恒生科技我目前估计会再跌20%，持仓太重的要考虑一下了。 6 卖token不是一个好生意，虽然glm和minimax都在狂涨，核心原因是大量的技能在早期探索阶段会很烧钱，但是一旦进入蒸馏模式后，你会发现大家不重复造轮子就马上减少了消耗，最经典就是app时代变成小程序时代，维护成本全部指数级降低。 7 继续看多，加密这次破圈成为伊朗的首选过路费太振奋人心了··以后各大国家不储备点都不行了。哪怕是稳定币也得多备着，但是需要去中心化的，不然伊朗高官小金库被泰达锁了就乐呵了。。顺便利好btcfi，虽然好像已经快凉了。 8 最近沉迷一个新游戏，沙盘战争三国，太强了，国人之光，把钢4做成三国了。目前demo可以玩了，但是还没正式发售，不过demo也很完整了，不耽误爽。 9昨天有朋友问我机器人能不能带来共同富裕，我笑着说，这东西要是做成士兵那普通人一点统战价值都没了 “通往地狱的路都是用建设天堂的口号来建造的”

0

2

1

轉發到社區