🧠 「コンテキストを読む」から「コンテキストからスキルを身につける」へ。人手の注釈も外部フィードバックも使わず、自己対戦だけでLLMが文脈固有のスキルを獲得する手法です。
タイトル: From Context to Skills: Can Language Models Learn from Context Skillfully?
URL:
📝 概要
LLMは事前学習にある知識は得意ですが、新規で専門的な文脈には弱いです。本論文は、人手注釈や外部フィードバックなしに、文脈固有のスキルを自律的に発見・洗練するCtx2Skillを提案します。
❓ 解決する課題
長く専門的な文書ではアノテーションのコストが高すぎます。さらにコーディングと違い、コンテキスト学習には実行フィードバックのような検証信号がなく、自動的なスキル構築が困難でした。
💡 方法論と提案手法
・凍結したLMによる5役割のマルチエージェント自己対戦を、M=5タスクにN=5回反復します
・Challengerが弱点を突くタスクとルーブリックを作り、Reasonerが解き、Judgeが合否を判定します
・ProposerとGeneratorが失敗を診断してスキル更新を合成します
・Cross-Time Replayで、難問と易問の性能の積を最大化し、反復をまたいで最も汎化するスキルセットを選びます
🎯 ユースケース
専門領域の長文ドキュメントを与えて、その場でモデルに必要なスキルを獲得させる用途に向きます。ドメイン固有の知識へ素早く適応させたい実務に直結します。
📊 実験結果
・CL-Bench(500コンテキスト、1,899タスク)で、GPT-4.1の解答率が11.1%→16.5%に向上
・GPT-5.1は21.1%→25.8%、GPT-5.2は18.2%→21.4%
・強いモデルのスキルが弱いモデルへ転移し、GPT-5.1のスキルをGPT-4.1に適用すると16.1%
・適用後のGPT-4.1(16.5%)は、拡張なしのGemini 3 Pro(15.8%)を上回りました
#
LLM# #
InContextLearning#