RAGの「精度を上げると遅くなる」ジレンマに、トピックを“方位磁針”として使う発想で挑む研究です🧭
タイトル: MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval
URL:
🧭 概要
トピックレベルのシグナルを「意味的なコンパス」として使い、関連する根拠を段落(パラグラフ)レベルで選び出す、メタデータ誘導型の検索フレームワークです。精度と効率を同時に高めることを狙います。
❓ 解決する課題
RAGには、検索の精度と効率のトレードオフがあります。
・細かいチャンクは精度が上がるが、候補が増えてレイテンシとコストが増大します
・大きいチャンクは候補が減るが、複数トピックの混在で意味的ノイズが生まれます
特に大規模データへの高速・高精度検索が要るディープリサーチで顕著です。
💡 方法論と提案手法
・チャンクの表現を、同一の埋め込み空間内でトピックメタデータによって強化します
・LLM教師蒸留で、軽量なリトリーバーを訓練します
・これにより、推論時に追加のLLM呼び出しなしで「トピックを意識した検索」を実現します
メタデータと密な埋め込みを組み合わせ、軽量リトリーバーに蒸留するのが核心です。
📊 実験結果
・情報効率:6つのベンチマークで平均8.24%改善
・レイテンシ:最も強力な効率重視RAGベースラインより5倍以上低い
・コードは公開リポジトリで提供
推論時の追加LLM呼び出しなしで、この精度と速度を両立しています。
#
RAG# #
検索#