cv usk(@cv_usk):🧠 「コンテキストを読む」から「コンテキストからスキルを身につける」へ。人手の注釈も外部フィードバックも使わず、自己対戦だけでLLMが文脈固有のスキルを獲得する手法です。タイトル: From Context to Skills: Can Language Models Learn from Context Skillfully? URL: https://t.co/c3KWuIh7l6 📝 概要 LLMは事前学習にある知識は得意ですが、新規で専門的な文脈には弱いです。本論文は、人手注釈や外部フィードバックなしに、文脈固有のスキルを自律的に発見・洗練するCtx2Skillを提案します。 ❓ 解決する課題長く専門的な文書ではアノテーションのコストが高すぎます。さらにコーディングと違い、コンテキスト学習には実行フィードバックのような検証信号がなく、自動的なスキル構築が困難でした。 💡 方法論と提案手法・凍結したLMによる5役割のマルチエージェント自己対戦を、M=5タスクにN=5回反復します・Challengerが弱点を突くタスクとルーブリックを作り、Reasonerが解き、Judgeが合否を判定します・ProposerとGeneratorが失敗を診断してスキル更新を合成します・Cross-Time Replayで、難問と易問の性能の積を最大化し、反復をまたいで最も汎化するスキルセットを選びます 🎯 ユースケース専門領域の長文ドキュメントを与えて、その場でモデルに必要なスキルを獲得させる用途に向きます。ドメイン固有の知識へ素早く適応させたい実務に直結します。 📊 実験結果・CL-Bench（500コンテキスト、1,899タスク）で、GPT-4.1の解答率が11.1%→16.5%に向上・GPT-5.1は21.1%→25.8%、GPT-5.2は18.2%→21.4% ・強いモデルのスキルが弱いモデルへ転移し、GPT-5.1のスキルをGPT-4.1に適用すると16.1% ・適用後のGPT-4.1（16.5%）は、拡張なしのGemini 3 Pro（15.8%）を上回りました #LLM #InContextLearning

2026.06.14 17:50

🧠 「コンテキストを読む」から「コンテキストからスキルを身につける」へ。人手の注釈も外部フィードバックも使わず、自己対戦だけでLLMが文脈固有のスキルを獲得する手法です。タイトル: From Context to Skills: Can Language Models Learn from Context Skillfully? URL: 📝 概要 LLMは事前学習にある知識は得意ですが、新規で専門的な文脈には弱いです。本論文は、人手注釈や外部フィードバックなしに、文脈固有のスキルを自律的に発見・洗練するCtx2Skillを提案します。 ❓ 解決する課題長く専門的な文書ではアノテーションのコストが高すぎます。さらにコーディングと違い、コンテキスト学習には実行フィードバックのような検証信号がなく、自動的なスキル構築が困難でした。 💡 方法論と提案手法・凍結したLMによる5役割のマルチエージェント自己対戦を、M=5タスクにN=5回反復します・Challengerが弱点を突くタスクとルーブリックを作り、Reasonerが解き、Judgeが合否を判定します・ProposerとGeneratorが失敗を診断してスキル更新を合成します・Cross-Time Replayで、難問と易問の性能の積を最大化し、反復をまたいで最も汎化するスキルセットを選びます 🎯 ユースケース専門領域の長文ドキュメントを与えて、その場でモデルに必要なスキルを獲得させる用途に向きます。ドメイン固有の知識へ素早く適応させたい実務に直結します。 📊 実験結果・CL-Bench（500コンテキスト、1,899タスク）で、GPT-4.1の解答率が11.1%→16.5%に向上・GPT-5.1は21.1%→25.8%、GPT-5.2は18.2%→21.4% ・強いモデルのスキルが弱いモデルへ転移し、GPT-5.1のスキルをGPT-4.1に適用すると16.1% ・適用後のGPT-4.1（16.5%）は、拡張なしのGemini 3 Pro（15.8%）を上回りました #LLM# #InContextLearning#

커뮤니티로 전달