搜尋基俊介相關推文 — 推特瀏覽器

2026.03.04 05:31

关于Qwen基模负责人林俊旸离职，我要说句不意外，肯定有人又要说我马后炮，但其实我这几个月来在上播客和写稿子里不止一次的提到过一个细节：清华大学那场AI-Next峰会上，林俊旸邀请观众体验Qwen，用的是模型干模型的，产品干产品的，这当然是模型团队的舒适区了，只投身研究、不负责市场，Qwen在开源社区里的究级口碑就是这么打下来的，但产品团队就难受了，做什么事情都需要和自己平级的模型团队配合，只能协调，不能统筹。产模分离是阿里过去几年里最奇怪的地方，在千问App还没有被独立出来发展的时候，还可以说且行且珍惜，现在千问App要直接和豆包元宝打消耗战了，还让模型团队保持例外论，这肯定行不通。最新的形势就是，大厂在做DAU，豆包现在还在发红包你敢信，小虎在冲ARR，月暗智谱MiniMax三家给洋人卖Tokens卖疯了，那么Qwen的位置在哪里呢，你总得沾个边吧？事实上，AI一号位工程的调整，是这一年来几乎所有国内互联网大厂都在做的事情，字节和腾讯都干了，轮到阿里大家觉得很奇怪，主要还是Qwen模型本身没出太大问题，突然换将有些刺激。还是那句话，组织的方向很重要，不认同组织的判断，就会很麻烦，这和你是不是一个好人、你做的工作是不是很优秀，关系不大。就像没人会不尊重杨立昆的学术成就，没有他老人家的贡献，AI的发展指不定还要晚多少年，但大家也都心知肚明，继续让他带Meta的AI实验室，那Meta就真完蛋了，你不可能让一个不相信Transformer的人去带领大模型⋯⋯ 前段时间，因为诉讼披露，微软的CTO有一封2023年底发给老板的邮件被曝光，里面是他但是作为对接人看到并汇报的OpenAI宫斗事件，说以Ilya Sutskever为首的研究团队讨厌需要和产品团队争夺资源，how dare you，竟敢让我们排队等GPU！微软的CTO在此批注，表示自己内心都是崩溃的：「OpenAI的研究团队根本没有明白，如果没有Applied的商业成功，他们根本不可能拥有现在这么多GPU。」所以，从国内到海外的实践经验都说明，产模分离是一个田园牧歌的理想状态，它可以暂时性的存在，但前提是公司没有市场回报的预期，愿意千金买马骨，Qwen这几年过的的好日子，都是这么来的。新的剧本就是阿里不愿意了，作风依然很粗暴很阿里，但就目的来说，其实没那么大的争议。再说了，和OpenAI的11个联合创始人里走了9个相比，这才哪到哪啊⋯⋯ 记得马老师曾说阿里要每年定期给社会输送人才，结果都是些年满35岁后被优化出来的P7P8们，给接收方的牛马们带去了一点点阿里味的震撼，连山姆看似牢不可破的名声都差点被打崩了，不过这次林俊旸流入自由转会市场，就没得阴阳了，是真的大牛出圈，大厂们赶紧抢吧。

0

31

423

50

轉發到社區

阑夕@foxshuo

2026.03.05 13:52

看到晚点LatePost也更新了谈千问换帅事件的播客，深度依然是全网无出其右，确实单口播客这种媒介形式也更适合即兴的去跟一些热点选题，比文稿生产的效率要高。总之，光速听完之后，阑心一言咔咔启动： - 简单化的去理解林俊旸的离职，一定会被牵着鼻子走，比如我们看到投放的料五花八门，有把阿里HR挂成万恶之源的，也有对冲说林俊旸在搞独立王国的，这些都是噪音，不是说对错不重要，只是很多时候你很难用对错来评价所有事情，需要接受个人意志和组织生长之间的摩擦必然有概率发展到不相容的地步； - 三个需要厘清的事实是，其一，林俊旸不是被离职的，阿里不可能主动开掉这个级别的Leader，其二，DAU是和千问App的产品团队捆绑，这是吴嘉/智能信息事业群的工作，不太可能牵扯到从属于阿里云的模型团队，其三，今年1月空降的周浩，是接替已经确定要走的后训练负责人喻博文，并不是来管林俊旸的； - 所以林俊旸的离职，更接近于一种「道心破碎」的结果，晚点主播曼琪的用词很微妙——「长期知其不可为而为之的付出」——最后被组织架构调整这根最后的稻草给弄崩了，宣布离职的整个过程，就是没考虑给阿里的管理层留太多反应时间，是铁了心不想干下去了； - 千问的模型团队属于通义实验室，而通义实验室又属于阿里云，最后阿里云再属于集团，这个嵌套关系已经很复杂了，在叠加了千问模型作为阿里全村希望的战略定位，资源匹配问题就很大了，所以才有了连阿里CEO吴泳铭也不知道千问模型团队被卡资源的说法； - 林俊旸这边的人马高度依赖阿里云的Infra支持，但实际上他们觉得阿里云在服务外部团队上甚至好于服务自家千问基模——这也太离谱了——于是去年年底林俊旸绕过阿里云直接找吴泳铭争取了自建Infra的权限，这个越级操作也为后来发生的事情埋下了伏笔； - 还有一个比较难绷的是，去年春节前后，o1带动推理模型开始崛起，千问在后训练方面遇到了瓶颈，然而转用字节开源的强化学习框架veRL来做训练，发现效果有了比较明显的提升，相当于通过控制变量，发现了问题是在Infra上，这才有了林俊旸对Infra一直不满意的根源，要做垂直一体化的建设； - 但阿里云的判断不是这样的，因为混合多模态已经是明显的趋势，把各个模态、预训练和后训练都拆出来搞单元制，是一定要做到事情，但对原千问模型团队来说，这就是在被收窄范围，尤其是时间点卡在Qwen 3.5训练完成后不久，大家都很疲惫，突然又得到了这种不太像是奖励的调整； - 阿里的管理层比较懵逼，或者说被动，也有反思组织变动没有考虑办公室政治的因素，把明明是要扩大对基模投入的事情，干成了让基模团队觉得是要收缩的效果，沟通上没有把控好，现在尽量要去平稳解决矛盾； - 千问在开源社区赢得的名声，到底怎么转化成阿里的资产，这个量尺很难找到，在2B市场，开源意味着很难卖API，在2C市场，开源⋯⋯好像也没啥意义，用户不会因为你开源了就来用你的App，然而林俊旸是一个相当理想主义的Leader，万亿参数的Qwen Max旗舰模型是阿里没有选择开源的，但他也想推动开源； - 千问的模型团队从创建之初就保有着一个相对独立的工作环境，少被拉扯和打断，这种专注力被视为千问模型屡出成果的原因，但是当AI行业进入一场谁也输不起的All In战局后，这种与真实市场保持距离的自驱型团队还能不能存在，既是一个原则问题，也是一个选择问题。

0

23

207

20

轉發到社區

阑夕@foxshuo

2026.05.22 13:00

前几天跟潘乱和老编辑吃饭，登味超标的开了一下怀旧服，把晚点LatePost在2023年写的「还原字节跳动HR体系」那篇稿子重新讨论了一遍，尤以老编辑的评价甚高——我从来没有见到他这么吹过其他媒体和作者——认为文章的非线性写法非常独特，开创了商业报道的新体裁。我对老编辑说法的理解未必准确，但确实也能察觉到小晚整个团队在文本训练方面的优越性，并不是纯粹的基于材料的写作，有非常坚定的内在逻辑，同时具有工程化的结构和人文化的感性，可以无视时效性。昨天更新的「AI抢人大战，批量制造这个时代的流量明星」也是相当具有代表性的例子，AI研究员如同球星那样被开价和交易早就不是新闻了，市面上的同题作文泛滥成灾，但晚点就是能用信息的再组织写出新意、立意，这很厉害。还是总结一下这篇稿子，对我来说也是一种愉快的练笔： - 在中国，真正能靠个人技能年入过亿的群体，少之又少，以明星艺人为例，在娱乐业最鼎盛的时期，也只有十几个人能够达到这个标准，但在这波大模型热浪里，顶级研究员的身价以史无前例的速度被抬到了以亿为单位的年薪级别，而这批人的总数只有几百人，也就是说，大厂的你争我抢，总盘子其实就这么大，中国最贵的几百号人，就是在这么一个供给严重不足的环境里产生的； - 在ChatGPT发布之后的一年多时间里，因为局势尚不明朗，各家公司投入尚且谨慎，国内AI研究员的收入比较稳定，顶薪也就在百万级人民币，直到2023年底，两家公司打破了「规矩」，一个是DeepSeek开始用高于市场价的扩人，另一个是曾被视为落后半步的字节，通过饱和式投入启动追赶，以2倍薪水涨幅为起价，从月之暗面、阿里、百度、智谱等公司挖人； - 其中标志性的事件是2024年下半年阿里Qwen的核心技术负责人周畅带着竞业协议加入字节，职级从P9跳到4-2（实际上对标P11），千万级人民币的总包，而字节也很快得到了回报，周畅入伙之后，在极短时间内提高了豆包的多模态基模能力，这是抢人大战的关键驱动力，只要找到对的人，就能立竿见影的带来技术进步，事半功倍； - 很重要的是，一个靠谱的Infra专家，最多可以提高50%的算力利用率，考虑到大厂每年几百亿的算力投入，这种效率优化创造的经济收益，要远远胜过那笔薪水开支，一个正确的判断，也能决定模型在几个月内拉开巨大差距，「懂得在哪里划线」的知识价值，变得无比稀缺； - 到了2025年，DeepSeek的爆火让全行业都意识到模型质量的差距本质在于人，于是更多的公司开始加入，推动工资水平继续水涨船高，千万级薪酬包下沉到了普通研究员群体，字节甚至能给应届生开出500万年包，而DeepSeek也把内推奖金提高到了20万，猎头行情更是以月为更新周期，「三月给的价四月就不够用了」； - 但是，当其他大厂都相继启用钞能力后，强如字节也会沦为被掠夺的鱼肉，2025年下半年，腾讯开始盯着字节大模型团队挖人，用的是字节本就很熟悉的方式：工资翻倍，来不来？而且腾讯也兼具策略性，会主攻字节内部面临工资倒挂的老员工，因为位置长期不动，他们没能赶上职级膨胀的春风，于是选择投奔腾讯涨薪的为数不少； - OpenAI的姚顺雨和DeepSeek的郭达雅在前后半年的时间分别拿到过亿年薪加入腾讯和字节——这个数字同时被两家否定了——再次引发行业躁动，两人属于完全不同的样本，姚顺雨是标准的精英路线，从姚班天才到普林斯顿博士，履历辉煌，而郭达雅是完全的本土人才，没有镀金过程，但他们都以极为年轻的年龄，打破了大厂原有的年限体系和汇报关系； - 郭达雅意味着用已有成绩倒推价值也是可以成立的，因为DeepSeek的模型牛逼，所以参与制作这个模型的人同样牛逼，这个逻辑被大厂以实际行动买单了，当郭达雅决定离开DeepSeek时，阿里、腾讯、字节都在第一时间去接触了，包括老板亲自去谈，最后因为字节的投入方向和他的发展预期最吻合，成功签下入职合同； - 骨干的持续流失，给了DeepSeek相当大的压力，梁文锋选择启动融资，给员工手里的期权一个定价机会，对内安抚军心，为了留人，字节设计了豆包虚拟股，以及阳光普照的每人每月最低9万元额外津贴，反倒是已经上市的智谱和MiniMax，因为期权暴涨加上解禁期，不必太操心员工的稳定性； - 横向来看，最近一年里，字节和腾讯的饥渴度是最高的，字节愿意因人设岗，从张一鸣到HR，全都奉行「笼络最聪明的头脑」这一原则，腾讯因为自身的进度原因，被迫成为市场上后出价的那个人，虽然要当冤大头，但对于家大业大的鹅厂储备来说，问题也不大，先去拿字节的offer、再用字节的offer去敲腾讯的门要更多的钱，成了一些研究员的财富密码，有猎头说得很透彻，大厂不怕花钱，是为了把对手能用的人，提前从市面上清掉； - 阿里就比较保守了，Qwen以团队氛围优秀著称，90%的员工都是阿里自己培养的校招生，工作自由度很高，但阿里严格的职级体系，还是对Qwen参与人才争夺制造了障碍，2025年下半年，林俊旸曾让Qwen的研究员主动出去面试，以求得涨薪的机会，避免人才外流，可见有多无奈； - 当给够钱已经不具备稀缺性之后，大厂争取研究员的技巧也开始转向软实力，比如扎克伯格会把Meta想挖的人请到自家别墅吃饭，用「真诚」作为必杀技，张一鸣也会亲自去和自己看上的论文作者见面谈话，Anthropic之所以成为研究员离职率最低的AI公司，是因为它被公认为文化建设独树一帜，老板本身就是一种信仰； - 研究员之间的竞争必然激烈，以前抬高身价的方式是发论文，后来各家公司发现只要发完论文就会让作者接到的猎头电话直线上升，又不太乐意让研究员「抛头露面」了，但是上有政策、下有对策，研究员们也很灵活，不让发论文，那就去上播客、发推特、做小红书，总之就是加强主动「营业」，持续的获取个人流量，确保在需要的时刻能被看见； - 为了对得起高薪待遇，同时防止掉队，这几百个顶级研究员普遍睡眠不足、高压工作，即便没有KPI和OKR，他们也会自己驱动自己，就像从小到大的做题路径，这是天才避免泯然众人的唯一出路，「这个行业最终会变成，前5%的人拿着从前10倍的工资，干着100个人的活。」