注册并分享邀请链接,可获得视频播放与邀请奖励。

搜索结果 diffusion
diffusion 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 diffusion 的推特
何恺明的新模型通过diffusion完成语言推理,最大优势就是不需要海量的kv cache了。存储的故事估计要开始出现裂缝了。
Sequoia Keynote - MAD原则 - Moats 护城河 (对行业的理解,围绕客户打造的全流程服务,积累的场景数据,不可替代的交付能力 etc..) - Affordance 可供性 (使用路径极简,frictionless,强大能力包装成极简) - Diffusion 扩散鸿沟 (模型进步速度远远大于社会采纳的速度)
显示更多
这几天读的最有趣的东西,包括里面的x讨论。然后我第一个感觉是这套逻辑非常适合 diffusion llm,因为它天生就是多路并行的。
AI焦虑的本质是中老年焦虑。 一个精力无限、有好奇心的年轻人,开着3个claude code,使用goal driven一次跑100小时,同时开着ChatGPT、claude,零散时间刷刷推特,每天上手两三个新工具, 一个彻底失去欲望、没有精力、睡眠不足、学习能力为0、油盐不进的滚刀肉中老年人,已经几乎被AI斩杀了, 中老年人既不接触任何AI工具,也没办法高强度使用AI Agent,没办法摸清能力边界,没办法每天高强度学习新的Agent或者diffusion model新工具, 中老年人唯一能看懂的,就是抖音、youtube、公众号、小红书上无穷无尽的AI焦虑大水逼文章,挨个自己往里套, 跟每天上百度百科搜癌症高血压糖尿病的老年人一样,越看越焦虑,越看越觉得自己马上要死了。 AI工具的爆发,本质上是个人学习能力的最大平权, 无论你是清华在职EMBA,压榨学生吃红利的院士长江学者,还是吃资源人脉红利的地方律所合伙人,还是常年吃政企关系饭接微信小程序和php外包的小包工头,还是民办三本、英国澳洲商科水硕进外企管培生一路吃市场经济红利, 在AI平权时代,一切不学习、不懂技术、不学计算机、不看源代码、不摸技术能力边界、不思考产品、不关注行业的人,一律会被公平斩杀淘汰。
显示更多
0
21
172
19
转发到社区
先进封装的”耗材接棒”叙事最近很热,逻辑链也确实成立。但要理解为什么材料战场会从underfill转向CMP slurry,得先搞清楚一个更底层的技术拐点。 Micro bump方案同时撞上了三面墙。第一,bump pitch缩到25μm以下时solder bridging风险飙升,良率断崖。第二,JEDEC对HBM封装高度有硬限制,每层die加上micro bump加上underfill要吃掉40-50μm,堆到16层已经是物理极限,往20层走厚度预算根本不够。第三,underfill的thermal conductivity只有0.2-0.5 W/m·K,铜是401 W/m·K,差了三个数量级。每多堆一层die,中心层的junction temperature就更难控制。三个约束的共同解指向同一件事:取消solder和underfill,让copper直接做diffusion bonding。 Hybrid bonding解决了pitch、高度、散热三个问题,但代价是把容错率压到了atomic level。Micro bump时代表面粗糙度几十纳米就能工作,hybrid bonding要求Ra降到sub-0.5nm,任何一颗纳米级的particle都会在bonding interface形成void,后续thermal cycling会把void扩展成crack。这就是CMP slurry和Cu plating additives变成新咽喉的根本原因,配方质量直接等于bonding yield,bonding yield直接等于HBM产能。 但问题是,这条耗材链上谁真正有定价权。台厂的强项一直在设备和通路端。弘塑做ECP设备、辛耘做wet process清洗、中砂做pad和diamond disc,全部围绕化学品消耗量做文章,本身不掌握配方。崇越和华立是代理通路,帮信越、Fujimi把材料送进产线。真正自研CMP slurry配方的只有达兴和长兴,体量跟Fujimi、Entegris完全不在一个量级。化学配方的壁垒跟设备不一样,设备可以逆向工程迭代追赶,配方是几十年经验数据的堆叠,一款slurry打进台积电标准制程通常五到十年不会被替换。达兴说它的CMP slurry已经应用于N2并供货Arizona,如果属实,至少过了初步验证。但”应用于”和”规模化供货”之间的距离,有时候比技术本身还远。 资金从CoWoS设备capex转向耗材opex,方向没问题。但耗材链上真正有定价权的那一段在谁手里,市场似乎还没想清楚。
显示更多
0
18
132
28
转发到社区
究极"拼好模"出现了! 字节跳动 Lance! 字节跳动刚发布了一个开源模型 Lance, 激活参数量只有 3B. 但是这个模型可以接受文本, 图片, 视频输入, 然后同时可以输出文本, 图片, 视频! 所以这一个模型就能完成像图片理解, 视频理解, 文生图, 图生图, 图片编辑, 文生视频, 图生视频, 视频编辑等任务. 而训练团队在技术报告中透露, 训练成本仅仅是 128 涨 A100 显卡 (按照大厂算力来说纯纯是把冗余算力拿来用了). 那为啥说是"拼好模"呢? 原因是团队并没有完全从0造轮子. 模型的视觉输入模块直接用了 Qwen2.5-VL-ViT (用来看图和视频), 而视觉输出模块是 Wan2.2_VAE (用来画画). 而模型本体是两个: Lance_3B (用来做图片的理解、生成或编辑任务) Lance_3B_Video (用来做视频相关的任务, 比如文生视频、图生视频) 所以, 这完全是一个研究性项目了, 而项目本身的亮点其实恰好是"拼得好". 这个模型不像之前许多自称为全能模型那样直接把大语言模型 (LLM) 和扩散模型 (Diffusion) 硬拼接在一起 (即所谓的 Pipeline 方案) . 而是在一个共享的交错序列 (Interleaved sequence) 中同时处理文本、图像和视频的上下文. 这样做最大的好处是统一了语义空间, 让模型的理解能力和性能更好. (从评测来看3B就接近了许多10B甚至20B模型的水平) 另外还引入了多任务协同. 简单来讲, 理解任务 (图片转向量) 和生成任务 (向量转图片) 在模型内部本身是互斥的. Lance 创新性地在同一个框架内加入了专用专家模块, 成功缓解了这种冲突, 让模型既能做 VQA (视觉问答) , 又能做图像/视频生成和编辑. 期待一波实际应用落地, 这个模型对于端侧和多模态 Agent 来讲意义是重大的, 有很多之前需要多个模型协作的场景都能用单个模型做了. #lance# #全模态模型#
显示更多
0
11
181
18
转发到社区
兄弟们,40个有用的GitHub仓库,强烈建议收藏起来! 1. public-apis — 免费API合集 2. build-your-own-x — 边做边学 3. developer-roadmap — 学任何技术 4. free-programming-books — 免费书籍 5. system-design-primer — 掌握系统设计 6. coding-interview-university — 自学计算机 7. the-art-of-command-line — 精通终端 8. project-based-learning — 项目式学习 9. you-dont-know-js — 深入学JavaScript 10. the-book-of-secret-knowledge — 黑客资源 11. tech-interview-handbook — 面试通关 12. awesome-selfhosted — 自建应用 13. javascript-algorithms — 可视化算法 14. 30-seconds-of-code — 实用代码片段 15. gitignore — 各语言模板 16. ollama — 本地运行AI模型 17. langchain — 快速构建AI应用 18. n8n — AI自动化工作流 19. openclaw — 本地AI助手 20. dify — 可视化创建AI代理 21. langflow — 拖拽式AI管道 22. mem0 — AI代理记忆层 23. browser-use — AI控制浏览器 24. ruflo — Claude代理编排 25. crewai — 多代理AI团队 26. hermes-agent — 开源AI代理 27. markitdown — 文件转Markdown 28. maigret — 3000+网站OSINT 29. open-webui — 自建ChatGPT界面 30. aider — 终端AI编程助手 31. agency-agents — 完整AI代理机构 32. tradingagents — 交易多代理框架 33. browserbase-skills — Claude网页SDK 34. autogen — 微软多代理框架 35. metagpt — AI代理软件公司 36. lobe-hub — 可视化多代理平台 37. huggingface-transformers — 现代AI基础 38. cocoindex — 长文本代理引擎 39. freeCodeCamp — 免费编程学习 40. stable-diffusion-webui — 本地AI画图
显示更多
0
22
798
237
转发到社区