高価なニューラルインデックスを毎回作り直さずに、定番のBM25検索を賢くする——クエリ書き換えをトークン1個ずつ最適化するという、面白いアプローチです🔎
タイトル: STORM: Stepwise Token Optimization with Reward-Guided Beam Search
URL:
🔎 概要
STORMは、検索の良し悪しに導かれてクエリ書き換えモデルを訓練する枠組みです。トークンを1つ生成するごとに、候補となる拡張語をBM25インデックスに照らして評価し、検索を実際に改善する語彙だけに探索を集中させます。
❓ 解決する課題
現代の検索は密ベクトルや学習済みスパースのニューラルモデルに依存しますが、BM25のような語彙検索は高速な反面、同義語や言い換えに弱いです。
・密ニューラル検索器は、モデルを変えるたびに高コストなインデックス再構築が必要です
・LLMによるクエリ書き換えは、「整った表現だが検索に効かない、あるいは有害な用語」を生みがちです
・訓練では系列レベルの遅延フィードバックしか得られず、どの個々の単語が効いたかが見えにくいです
💡 方法論と提案手法
・検索性能に導かれたビームサーチ(reward-guided beam search)で自己教師あり訓練を行います
・トークン生成ごとに候補拡張語をBM25で評価し、性能の低い候補を枝刈りします
・これにより、検索指標をトークンレベルの信号に変換し、探索を有効な語彙へ集中させます
・BM25インデックスを使うため、ニューラルインデックスの再構築が不要で、インフラが軽量です
📊 実験結果
・0.6B〜8Bパラメータのモデルが、競合するLLM書き換え器と同等以上の性能を達成しました
・BM25の速度的な優位性を維持しています
・8B版は、はるかに大きな商用システムに匹敵しました
・18言語(MIRACL)へのゼロショット転移で、専用の多言語密検索器を平均で上回りました
🌍 ユースケース
インデックス再構築のコストを避けたい検索基盤や、多言語検索を低コストで強化したいシステムに向きます。既存のBM25パイプラインを活かしつつ性能を底上げできるため、検索を本番運用するチームにとって採用しやすい現実解です。
#
検索# #
BM25#