マルチエージェントを X で検索

1hours ago

マルチエージェントの協調、毎回テキストでやり取りするのは高コストでした🔄 協調そのものを「潜在空間の再帰」でスケールさせる発想が新しいです。タイトル: Recursive Multi-Agent Systems URL: 🔄 概要複数エージェントの協調を、逐次的なテキスト交換ではなく、統一された潜在空間上の再帰的計算として捉える枠組みRecursiveMASの提案です。異種のエージェントをRecursiveLinkモジュールで接続し、潜在的な思考の生成と状態転送を可能にします。 ❓ 解決する課題マルチエージェントシステム（MAS）は通常テキストベースの通信に依存します。・エージェント同士が自然言語でやり取りすると、トークンを大量に消費し計算コストが高い・「協調そのものを再帰でスケールできないか」という問いが出発点でした 💡 方法論と提案手法・システム全体を潜在空間上の再帰的計算として定式化します・RecursiveLinkモジュールが異種エージェント間を軽量に接続し、再帰ラウンドをまたいだ勾配ベースの貢献度割り当てを行います・最適化は内側・外側のループ学習で実施し、理論的な安定性も保ちます 📊 実験結果数学・科学・医療・検索・コード生成にまたがる9ベンチマークで、4つの協調パターンを検証しました。・平均精度が8.3%向上・推論が1.2倍〜2.4倍に高速化・トークン使用量を34.6%〜75.6%削減精度を上げながら、速度とコストを同時に大きく改善しています。 #マルチエージェント# #LLM#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.13 10:30

🧩 「エージェントを増やせば速くなる」は本当か？マルチエージェントLLMを分散システム理論のレンズで分析したら、アムダールの法則も通信オーバーヘッドもそのまま効いていました。タイトル: Language Model Teams as Distributed Systems URL: 📝 概要本論文は、LLMのマルチエージェントチームを分散システムとして捉え、協調・整合性・スケーラビリティの理論で設計・評価する枠組みを提案します。試行錯誤ではなく、分散コンピューティングの蓄積を直接活かす発想です。 ❓ 解決する課題チーム性能はタスク依存性が高く、通信オーバーヘッドや一貫性の衝突、誤りの増幅といった弊害もありました。「いつチームが個を上回るか」を予測する原理的枠組みが欠けていました。 💡 方法論と提案手法・LLMチームと分散システムが共有する4性質（独立性・通信・並行性・可謬性）を起点に分析します・アムダールの法則、集中型vs分散型、整合性の衝突、O(n²)の通信、ストラグラー、コスト効率の原理を適用します・協調コーディングで2実験（集中型/分散型）、チームサイズ1〜5、並列/混在/直列タスク、複数モデルで検証します 🎯 ユースケースマルチエージェントのコード生成・レビュー、データ分析の並列分解、そして「マルチエージェントが有益か有害か」を実装前に予測する設計判断やコスト予算化に役立ちます。 📊 実験結果・並列タスクは中央値2.0倍超で高速化、直列タスクは約1.2倍止まり（アムダールの法則を実証）・高速化の中央値は集中型1.36倍に対し分散型0.88倍と、分散型はむしろ遅くなりました・テスト失敗の中央値は分散型19件 vs 集中型4件と、一貫性の衝突が顕著でした・直列タスクではトークン5.83倍に対し高速化1.13倍と、コスト効率の悪化も定量化されました #MultiAgent# #DistributedSystems#

0

1

0

コミュニティへ転送

cv usk@cv_usk

2026.06.16 21:38

AIエージェントの回答を「検証可能で説明できる事実」に根拠づける——ナレッジグラフ＋GraphRAG＋エージェントのフルスタックをまるごとオープンソースで提供する基盤です🕸️ タイトル: trustgraph-ai/trustgraph URL: 🕸️ 概要 AIエージェントのためのオープンソースのセマンティック・デプロイメント基盤です。コアは「コンテキストグラフ」（ドメイン知識を構造化しクエリ可能にした表現）。コンテキストグラフ・メモリ・検索・オーケストレーション・推論を、決定論的なエージェント向けにフルスタックで提供します。 ❓ 解決する課題 LLM単体では、なぜその答えになったのかを辿りにくく、ハルシネーションのリスクもあります。・エージェントの回答を、検証可能で説明可能な事実に根拠づけるのが難しい・TrustGraphはナレッジグラフ構築とGraphRAGを組み合わせ、意味的に豊かで検証可能なコンテキストにアクセスできるようにします・しかも主権的に管理できるプライベート環境で実現します 💡 主な特徴・マルチモデルDB（表・KV・ドキュメント・グラフ・ベクトル）とマルチモーダル対応、エンティティ/関係の自動抽出・DocumentRAG・GraphRAG・OntologyRAGのパイプラインと、3D GraphVizによる可視化・単一/マルチエージェント、ReAct・Plan-then-Execute・Supervisorパターン、MCP統合・Context Cores：スキーマ・グラフ・埋め込み・エビデンス・検索ポリシーを束ね、コンテキストをコードのようにバージョン管理 🌍 技術スタック / 使い方ストレージはCassandra・Qdrant・Garage、メッセージングはPulsar等、LLMはAnthropic/OpenAI/Google等＋ローカル推論（vLLM/Ollama等）に対応。npx @trustgraph/configで構成し、ポート8888のUIから利用できます。Apache 2.0ライセンスです。 #GraphRAG# #ナレッジグラフ#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.17 02:49

# AIエージェントをソフトウェアに組み込むプラクティス # 階層化メモリ 🎯 「全部コンテキストに詰め込む」設計は、ウィンドウ溢れとハルシネーションの永続化を同時に引き起こします。メモリを3層に分けるだけで、コンテキスト効率と記憶の信頼性を両立できます。 🔥 解決する課題エージェントが複数ターンに跨がるタスクを扱うとき、すべての情報をコンテキストウィンドウに詰め込む「フラット記憶」では2つの問題が同時に起きます。会話履歴・ユーザ属性・中間結果・外部知識が混在するとウィンドウが溢れ、古い情報から押し出されて文脈が断絶します。さらにLLMが生成した推測をそのまま永続化すると、ハルシネーションが長期記憶に定着し、以降のセッションを汚染し続けます。 💡 提案パターンメモリを作業記憶（ターン内の中間状態）・短期記憶（セッションストア、TTL付き）・長期記憶（ベクトルDB/KVS）の3層に分離します。作業記憶は自由に読み書きし、コンテキストリセットで消えます。短期記憶には信頼度タグを付与し、ユーザ発話由来は高信頼、LLM推測由来は低信頼とマークします。長期記憶への昇格には反復確認やユーザ承認を要求し、ハルシネーションの永続化を防ぎます。failure_costが高い領域ほど昇格閾値を厳しくし、TTLを長めにとって安全側に寄せます。 ✅ 選定条件使うとき： - 複数セッションにわたって情報を引き継ぐ必要がある - 中間結果の量がコンテキストウィンドウの30%を超える見込みがある - 確定事実と推測の区別が必要で、誤った記憶の波及影響が大きい使わないとき： - 1ショットで完結しセッション間の引継ぎが不要な場合 - コンテキストウィンドウに全情報が収まる場合 - メモリの書込制御だけが課題で、階層分離自体は不要な場合 ⚠️ 落とし穴 - 作業記憶と短期記憶の境界が曖昧になりがちです。外部ストアへの書込を境界線にし、LLMの内部状態に頼らないでください - 長期記憶のエントリ数が増えると無関係な記憶がコンテキストに混入し、ハルシネーションの原因になります - マルチエージェント構成で各Workerが直接長期記憶に書き込むと整合性が崩れます。長期記憶はSupervisorが一元管理しましょう 🔧 実装方針 - 作業記憶（dict/インメモリ）・短期記憶（Redis等TTL付きセッションストア）・長期記憶（ベクトルDB）の3層を明確に分離し、外部ストアへの書込を境界線とします - recall時はコンテキスト予算内で3層から関連情報を想起し、関連度と信頼度でランク付けして注入量を制御します - 短期→長期への昇格には信頼度スコアの閾値チェックと承認状態の検査を設け、未検証情報の永続化を防ぎます - 記憶種別ごとにTTLを設計し（リアルタイムデータは分単位、ユーザ嗜好は週単位、不変属性は無期限）、failure_costが高いほど短めに設定します #AIエージェント# #ソフトウェアアーキテクチャ#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.13 15:24

企業でAIエージェントを動かす鍵は「賢さ」より「統制」。女王蜂と働き蜂のアーキテクチャが答えを示します🐝 タイトル: Queen-Bee Agents: A BeeSpec-Centered Architecture for Governed Enterprise MCP Orchestration URL: 🐝 概要中央の「女王（Queen）」制御プレーンが実行を統率し、専門の「働き蜂（Bee）」が制約付きアクセスで動くマルチエージェントシステムです。ガバナンスを効かせた企業向けのMCPオーケストレーションを実現します。 ❓ 解決する課題企業がエージェントを導入するとき必要なのは生の能力だけではありません。LLMを社内ツールやMCPに繋ぐ際、ポリシーの強制、テナント単位の分離、明示的な運用境界を越えない実行という統制が不可欠でした。 💡 方法論と提案手法・核心はBeeSpec：Queenがコンパイルする構造化仕様で、各Beeのタスクスコープの実行パラメータを定義・テナント分離されたMCPコネクタで分離を担保・監査に裏付けられた実行時ガバナンス・検索駆動の能力付与で、必要な能力を動的に付与・複数バックエンドをサポート 📊 実験結果・検索駆動バリアントは59の企業タスクで成功率0.964 ・ガバナンス違反ゼロ・単一エージェントや静的ベースラインよりスコープ付き実行の品質が優れる・承認ゲートを伴う複数Beeのワークフロー協調を実証 #AIエージェント# #MCP#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.12 06:58

🌐 強いAIエージェントを作る鍵は、実は「エージェントが動く環境の設計」かもしれません。環境エンジニアリングという視点を体系化した、全63ページのサーベイです。タイトル: Agentic Environment Engineering for Large Language Models: A Survey of Environment Modeling, Synthesis, Evaluation, and Application URL: 📝 概要 LLMエージェントは単独でなく、相互作用する「環境」の中で動きます。本サーベイは、その環境そのものを工学的に設計・構築する「環境エンジニアリング」という観点から、研究の全体像を体系化しています。 ❓ 解決する課題これまで「環境の作り方」は断片的に語られてきました。エージェント能力の向上が良い環境設計に大きく依存するにもかかわらず、それを統一的に整理する枠組みがなかったのです。 💡 方法論と提案手法環境を開発ライフサイクルに沿って4つの柱で分類します。・環境モデリング：代表的な環境の特徴づけとコア能力の評価・環境合成：シンボリック合成とニューラル合成の2パラダイム・環境評価：合成パラダイムに整合したドメイン固有の評価・環境応用：記憶中心・ワークフロー中心・軌跡中心・探索中心という、エージェントと環境の共進化4経路 🎯 ユースケースエージェント研究者が自分の取り組みを地図上に位置づけ、抜けている観点を見つける指針になります。環境合成・評価・自己進化の設計を考える際の出発点としても有用です。 📊 トレンドと展望・進化のアプローチを、ニューラル駆動・難易度駆動・スケーリング駆動の3系統で整理しています・8つの属性と8つの応用ドメインを軸に分析しています・今後の方向性として、Environment-as-a-Service、マルチエージェント、ニューラル・シンボリック統合を挙げています #AIエージェント# #LLM#

0

2

0

コミュニティへ転送

cv usk@cv_usk

2026.06.18 02:56

🔬 「50人のチームが手元にいて、1日で全部やってくれる感覚」。Geminiベースのマルチエージェントが科学仮説を生成・討論・進化させ、肝線維症の瘢痕応答を91%ブロックする薬剤候補まで導きました。タイトル: Co-Scientist: A multi-agent AI partner to accelerate research URL: 📝 概要 Co-Scientistは、Geminiを基盤とする協調型のマルチエージェントAIで、新規の科学仮説を生成・批評・洗練します。仮説の生成と評価のサイクルを自動化することで、ブレイクスルーの発見を加速する「AI研究パートナー」として機能します。 ❓ 解決する課題研究者は、情報過多とますます複雑化する課題の中で、ブレイクスルーとなる仮説を立てるのに苦労します。膨大な文献にまたがる断片的な事実を結びつけ、有望な研究方向を特定するのが難しいのです。 💡 方法論と提案手法 3つのフェーズに専門エージェントを配置します。・生成フェーズ：Generationエージェントが文献とデータに基づき新規仮説を提案し、Proximityエージェントが仮説をクラスタ化して多様な探索を確保します・討論フェーズ：Reflectionエージェントが「仮想ピアレビュア」として批判的に評価し、Rankingエージェントがペアワイズ比較とEloベースのトーナメントで優先順位付けします・進化フェーズ：Evolutionエージェントが上位仮説を継続的に洗練・結合し、Meta-reviewエージェントが最終的な研究提案を統合します・計算資源の大半を「検証」に充て、主張をChEMBLやUniProt、Web検索、AlphaFoldなどの専門ツールと突き合わせます 🎯 ユースケース抗菌薬耐性、植物免疫、肝線維症の治療発見、ALSの機序探索、細胞老化の逆転、感染症タンパク質の特定、代謝疾患、老化生物学など、幅広い生命科学領域に応用されています。 📊 実験結果・肝線維症で、瘢痕に関連する応答の91%をブロックする薬剤候補を特定しました・細胞老化では、実験室で細胞を若返らせる遺伝的リードを生成し、スクリーニング解析を数ヶ月から数日に短縮しました・100以上の研究機関がテストし、Stanford、MIT、Cambridge、Calicoなどが協力しています・第一三共やBayer Crop Science、米国の国立研究所にエンタープライズ版が展開されています #AIforScience# #AIエージェント#

0

1

0

コミュニティへ転送

cv usk@cv_usk

2026.06.17 09:33

📚 ReActもRAGもTree of Thoughtsも、論文ごとにバラバラだったエージェント設計を、同じAPIで動かして比較できたら最高だと思いませんか？それを実現した「35パターン全部入り」のリポジトリです。タイトル: FareedKhan-dev/all-agentic-architectures URL: 📦 概要本リポジトリは、プロダクション品質のエージェントAIパターンを35種類実装したPythonライブラリ兼「生きた教科書」です。すべてのアーキテクチャが同じ.run(task)メソッドを持ち、同一形式の結果を返すため、下流のコードを変えずにパターンを差し替えられます。 ❓ 解決する課題エージェントの設計パターンは論文ごとに散らばっていて、実装も様式もバラバラでした。これを統一インターフェースの下に集約し、横並びで試せるようにしたのが最大の価値です。 💡 中核の工夫と提案手法中心にあるのが「決定論的ピッカーの規律」です。・LLMのスコアリングに丸投げせず、まずLLMに真偽値や列挙型などカテゴリ的な特徴をコミットさせる・最終判断はPythonのロジックで合成するこれにより、スコアが平坦に潰れる「LLM-as-Scorer」の病理を緩和します。35アーキテクチャ中13で採用されています。 🎯 カバー範囲とユースケース推論・内省（Reflection、Self-Discover）、探索（Tree of Thoughts、LATS）、RAG（Corrective/Self/Adaptive/GraphRAG）、メモリ（MemGPT、Voyager）、ツール・行動（ReAct、SWE-Agent）、マルチエージェント（Debate、STORM）など8系統を網羅。各パターンに実行済みのJupyterノートブックが付き、本物のLLM出力に基づく再現可能なリファレンスになっています。 📊 注目ポイント・コアはLangGraph。NebiusやOpenAI、Anthropic、Ollamaなど主要プロバイダーに対応し、切り替えは環境変数1つ・pytestで283件のテストがパス・17タスクのベンチマークで直近42問中33問正解（成功率78%）。ReflectionやSelf-Consistencyが好成績でした #AIエージェント# #LangGraph#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.15 08:51

🏛 要件仕様書を入れると、4+1ビューのアーキテクチャ図から本番品質のドキュメント、ATAM相当の評価レポートまで自動生成。4つの専門エージェントが要件と設計の橋渡しをします。タイトル: Bridging Requirements and Architecture: Multi-Agent Orchestration with External Knowledge and Hierarchical Memory URL: 📝 概要 MAADは、ソフトウェア要件仕様（SRS）からアーキテクチャ設計までを、役割特化の4エージェントでオーケストレーションするフレームワークです。外部知識（RAG）と3層の階層メモリで、一貫性とトレーサビリティを担保します。 ❓ 解決する課題アーキテクチャ設計は複雑で知識集約的なため、アーキテクトに大きく依存していました。単一LLMは出力が一貫せず要件カバレッジが不完全で、既存のマルチエージェントもアーキ固有のワークフローや知識統合を欠いていました。 💡 方法論と提案手法・Analystが要件（FR/NFR/ASR）を抽出し、Modelerが4+1ビューのUML図へ、Designerが本番品質ドキュメントへ変換します・EvaluatorがトレーサビリティとATAMベースの分析で各段に品質ゲートを設けます・ISO/IEC/IEEE 42010などの標準や定番書籍をベクトルDBに埋め込み、クエリごとに上位3件を参照します・作業記憶・エピソード記憶・意味記憶の3層メモリで、反復的な洗練と知識再利用を支えます 🎯 ユースケース要件からの素早いアーキテクチャ設計、要件変更に追従する一貫性維持、暗黙知に頼らない知識移転、自動検証によるレビュー負荷削減などに使えます。 📊 実験結果・実世界のSRS 10件で、MetaGPTより完全・モジュール性が高く・トレーサブルなアーキテクチャを生成・結合度や凝集度など7つのアーキテクチャ指標で評価し、Evaluatorが品質レポートを自動生成・評価LLMではGPT-5.2とQwen3.5が多くの設定で他を上回りました・現役アーキテクト6名が「原則に整合し実開発に適する」と評価しました #SoftwareArchitecture# #AIエージェント#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.14 17:50

🧠 「コンテキストを読む」から「コンテキストからスキルを身につける」へ。人手の注釈も外部フィードバックも使わず、自己対戦だけでLLMが文脈固有のスキルを獲得する手法です。タイトル: From Context to Skills: Can Language Models Learn from Context Skillfully? URL: 📝 概要 LLMは事前学習にある知識は得意ですが、新規で専門的な文脈には弱いです。本論文は、人手注釈や外部フィードバックなしに、文脈固有のスキルを自律的に発見・洗練するCtx2Skillを提案します。 ❓ 解決する課題長く専門的な文書ではアノテーションのコストが高すぎます。さらにコーディングと違い、コンテキスト学習には実行フィードバックのような検証信号がなく、自動的なスキル構築が困難でした。 💡 方法論と提案手法・凍結したLMによる5役割のマルチエージェント自己対戦を、M=5タスクにN=5回反復します・Challengerが弱点を突くタスクとルーブリックを作り、Reasonerが解き、Judgeが合否を判定します・ProposerとGeneratorが失敗を診断してスキル更新を合成します・Cross-Time Replayで、難問と易問の性能の積を最大化し、反復をまたいで最も汎化するスキルセットを選びます 🎯 ユースケース専門領域の長文ドキュメントを与えて、その場でモデルに必要なスキルを獲得させる用途に向きます。ドメイン固有の知識へ素早く適応させたい実務に直結します。 📊 実験結果・CL-Bench（500コンテキスト、1,899タスク）で、GPT-4.1の解答率が11.1%→16.5%に向上・GPT-5.1は21.1%→25.8%、GPT-5.2は18.2%→21.4% ・強いモデルのスキルが弱いモデルへ転移し、GPT-5.1のスキルをGPT-4.1に適用すると16.1% ・適用後のGPT-4.1（16.5%）は、拡張なしのGemini 3 Pro（15.8%）を上回りました #LLM# #InContextLearning#

0

コミュニティへ転送