登録して招待リンクを共有すると、動画再生報酬と紹介報酬を獲得できます。

cv usk
@cv_usk
AI / Software Research Notes AI Agent, LLMOps, MLOps, Software Architecture
参加 May 2026
240 フォロー中    207 ファン
RAGの「精度を上げると遅くなる」ジレンマに、トピックを“方位磁針”として使う発想で挑む研究です🧭 タイトル: MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval URL: 🧭 概要 トピックレベルのシグナルを「意味的なコンパス」として使い、関連する根拠を段落(パラグラフ)レベルで選び出す、メタデータ誘導型の検索フレームワークです。精度と効率を同時に高めることを狙います。 ❓ 解決する課題 RAGには、検索の精度と効率のトレードオフがあります。 ・細かいチャンクは精度が上がるが、候補が増えてレイテンシとコストが増大します ・大きいチャンクは候補が減るが、複数トピックの混在で意味的ノイズが生まれます 特に大規模データへの高速・高精度検索が要るディープリサーチで顕著です。 💡 方法論と提案手法 ・チャンクの表現を、同一の埋め込み空間内でトピックメタデータによって強化します ・LLM教師蒸留で、軽量なリトリーバーを訓練します ・これにより、推論時に追加のLLM呼び出しなしで「トピックを意識した検索」を実現します メタデータと密な埋め込みを組み合わせ、軽量リトリーバーに蒸留するのが核心です。 📊 実験結果 ・情報効率:6つのベンチマークで平均8.24%改善 ・レイテンシ:最も強力な効率重視RAGベースラインより5倍以上低い ・コードは公開リポジトリで提供 推論時の追加LLM呼び出しなしで、この精度と速度を両立しています。 #RAG# #検索#
もっと見る