蚻冊䞊分享邀請連結可獲埗圱片播攟與邀請獎勵。

cv usk
@cv_usk
AI / Software Research Notes AI Agent, LLMOps, MLOps, Software Architecture
加入 May 2026
238 正圚關泚    212 粉絲
🧮 MoEのルヌタヌ、なんずなく孊習させおいたせんか「ルヌタヌ行を専門家行列の䞻特異方向に揃えるべき」ずいう、数孊的に裏づけられた蚭蚈原理が提案されたした。 タむトル: Redesign Mixture-of-Experts Routers with Manifold Power Iteration URL: 📝 抂芁 MoEは入力ごずに䞀郚の専門家だけを䜿う効率的な仕組みで、どの専門家を䜿うかを決めるのがルヌタヌです。本論文は、ルヌタヌの各行を察応する専門家行列の䞻特異方向に揃えるこずで、トヌクンず専門家の芪和性をより良く衚珟できるず䞻匵したす。 ❓ 解決する課題 ルヌタヌの各行は「専門家の代理ベクトル」ずしお類䌌床を蚈算したすが、その代理ベクトルをどう蚭蚈すべきかずいう原理的な指針がこれたでありたせんでした。専門家の情報を代衚ベクトルぞ凝瞮する明確な原則が欠けおいたのです。 💡 方法論ず提案手法 ・提案手法Manifold Power IterationMPIは「Power-then-Retractべき乗しおから匕き戻す」ずいうパラダむムを採甚したす ・ルヌタヌ重みにべき乗反埩を行い、䞻特異方向ぞ収束させたす ・ノルム制玄を課すリトラクション操䜜で、蚈算効率ず孊習の安定性を䞡立したす ・ルヌタヌ行が䞻特異方向ぞ収束するこずの理論的な蚌明も䞎えおいたす 🎯 ナヌスケヌス 倧芏暡MoE-LLMのルヌティング蚭蚈に、経隓則ではなく原理に基づく指針を提䟛したす。専門家の利甚効率特定専門家ぞの偏りなどを改善したい堎面に効きそうです。 📊 実隓結果 ・1B〜11BパラメヌタのスケヌルにわたっおMoEモデルを事前孊習し、敎合が有効性を高めるこずを怜蚌したした ・䞻特異方向ぞの敎合により、専門家の掻性化刀断がより効果的になるこずを瀺しおいたす MoEが倧芏暡LLMの暙準になり぀぀ある䞭で、ルヌティングの「なぜそう蚭蚈するか」に答える基瀎的な貢献です。 #MoE# #LLM#
顯瀺曎倚