アーキテクチャを X で検索

2026.06.15 08:51

🏛 要件仕様書を入れると、4+1ビューのアーキテクチャ図から本番品質のドキュメント、ATAM相当の評価レポートまで自動生成。4つの専門エージェントが要件と設計の橋渡しをします。タイトル: Bridging Requirements and Architecture: Multi-Agent Orchestration with External Knowledge and Hierarchical Memory URL: 📝 概要 MAADは、ソフトウェア要件仕様（SRS）からアーキテクチャ設計までを、役割特化の4エージェントでオーケストレーションするフレームワークです。外部知識（RAG）と3層の階層メモリで、一貫性とトレーサビリティを担保します。 ❓ 解決する課題アーキテクチャ設計は複雑で知識集約的なため、アーキテクトに大きく依存していました。単一LLMは出力が一貫せず要件カバレッジが不完全で、既存のマルチエージェントもアーキ固有のワークフローや知識統合を欠いていました。 💡 方法論と提案手法・Analystが要件（FR/NFR/ASR）を抽出し、Modelerが4+1ビューのUML図へ、Designerが本番品質ドキュメントへ変換します・EvaluatorがトレーサビリティとATAMベースの分析で各段に品質ゲートを設けます・ISO/IEC/IEEE 42010などの標準や定番書籍をベクトルDBに埋め込み、クエリごとに上位3件を参照します・作業記憶・エピソード記憶・意味記憶の3層メモリで、反復的な洗練と知識再利用を支えます 🎯 ユースケース要件からの素早いアーキテクチャ設計、要件変更に追従する一貫性維持、暗黙知に頼らない知識移転、自動検証によるレビュー負荷削減などに使えます。 📊 実験結果・実世界のSRS 10件で、MetaGPTより完全・モジュール性が高く・トレーサブルなアーキテクチャを生成・結合度や凝集度など7つのアーキテクチャ指標で評価し、Evaluatorが品質レポートを自動生成・評価LLMではGPT-5.2とQwen3.5が多くの設定で他を上回りました・現役アーキテクト6名が「原則に整合し実開発に適する」と評価しました #SoftwareArchitecture# #AIエージェント#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.15 11:51

🛠 MLOpsは「なんとなくその場しのぎ」で進めがち。実務者のブログやホワイトペーパー103件を分析し、アーキテクチャ上重要な25のガイドラインに整理した研究です。タイトル: Architecturally Significant MLOps Guidelines for ML Model Integration and Deployment: a Gray Literature Review URL: 📝 概要本論文は、査読論文ではなく実務者発のWeb情報（ブログ・ホワイトペーパー・ベンダー文書）を分析する「グレーリテラチャレビュー」で、MLモデルの統合とデプロイに関するアーキテクチャ指針を体系化しています。 ❓ 解決する課題 MLOps採用は進んでも、再利用可能な設計判断としての知識統合が乏しく、チームはその場しのぎになりがちでした。経験をプロジェクト間で移転しにくいのが課題でした。 💡 方法論と提案手法・33クエリでGoogleを検索し331件を取得、基準で絞り103件を分析しました・2名が独立にテキストを抽出し、合意会議で不一致を解消しました・3名が実践をガイドラインへ統合し、カードソーティングで5カテゴリに整理しました・CI/CDと自動化、デプロイ戦略と環境、設計と統合戦略、モデルサービングと推論、MLコンポーネント管理の5テーマです 🎯 ユースケース ML統合・デプロイのアーキテクチャ判断の統合リファレンスとして使えます。包括的なMLOpsリファレンスアーキテクチャの構成要素にもなります。 📊 実験結果・25のアーキテクチャ上重要なガイドラインを抽出し、72%（18項目）が4回以上言及され実務者の合意を示しました・最多引用はコンテナ化（27ソース）、次いでCI/CDパイプライン確立（53回言及）でした・デプロイには16ガイドライン、統合には9ガイドラインと、統合側の文書化が手薄なギャップを特定しました #MLOps# #MachineLearning#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.13 15:24

企業でAIエージェントを動かす鍵は「賢さ」より「統制」。女王蜂と働き蜂のアーキテクチャが答えを示します🐝 タイトル: Queen-Bee Agents: A BeeSpec-Centered Architecture for Governed Enterprise MCP Orchestration URL: 🐝 概要中央の「女王（Queen）」制御プレーンが実行を統率し、専門の「働き蜂（Bee）」が制約付きアクセスで動くマルチエージェントシステムです。ガバナンスを効かせた企業向けのMCPオーケストレーションを実現します。 ❓ 解決する課題企業がエージェントを導入するとき必要なのは生の能力だけではありません。LLMを社内ツールやMCPに繋ぐ際、ポリシーの強制、テナント単位の分離、明示的な運用境界を越えない実行という統制が不可欠でした。 💡 方法論と提案手法・核心はBeeSpec：Queenがコンパイルする構造化仕様で、各Beeのタスクスコープの実行パラメータを定義・テナント分離されたMCPコネクタで分離を担保・監査に裏付けられた実行時ガバナンス・検索駆動の能力付与で、必要な能力を動的に付与・複数バックエンドをサポート 📊 実験結果・検索駆動バリアントは59の企業タスクで成功率0.964 ・ガバナンス違反ゼロ・単一エージェントや静的ベースラインよりスコープ付き実行の品質が優れる・承認ゲートを伴う複数Beeのワークフロー協調を実証 #AIエージェント# #MCP#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.18 08:00

📚 リポジトリ全体のドキュメントを、図つきで自動生成。最大140万行・8言語に対応し、DeepWikiを上回る品質を出すAIフレームワークCodeWikiです（ACL 2026採択）。タイトル: FSoft-AI4Code/CodeWiki URL: 📦 概要 CodeWikiは、ソフトウェアリポジトリ全体に対して包括的なドキュメントを自動生成する、AI駆動のフレームワークです。単純なAPIリファレンスにとどまらず、アーキテクチャ図・データフロー図・シーケンス図・散文の説明を含む「システムレベル」の文書を作ります。大規模・多言語のコードベースで、ドキュメントを最新かつ完全に保つという課題に取り組みます。 ❓ 解決する課題従来のドキュメントツールはスケールと文脈の扱いが苦手でした。CodeWikiは、モジュール間の相互依存の文書化、規模を保ったままのアーキテクチャ文脈の維持、孤立した部品ではなくシステム全体の相互作用を捉えること、という3つの核心課題に取り組みます。 🛠 方法論と提案手法 3段階で動作します。・階層的分解：動的計画法に着想を得たアルゴリズム的クラスタリングで、コードベースを一貫したモジュールに分割します・再帰的マルチエージェント処理：複雑なモジュールにはタスクを動的に委譲する適応的なエージェントシステムを使います・マルチモーダル合成：テキストと視覚成果物（Mermaid図）を統合し、図はNode.jsで検証します・Python・Java・JavaScript・TypeScript・C・C++・C#・Kotlinに対応し、Claude# CodeやCodex CLI経由でトークン課金なしに実行できます 🎯 ユースケース大規模・多言語コードの「生きたドキュメント」生成、新メンバーのオンボーディング資料、GitHub Pages互換のインタラクティブなHTML出力などに使えます。 📊 実験結果・独自評価CodeWikiBenchで、高水準言語（Python、JS）が79.14%、マネージド言語（C#、Java）が68#.84%の品質スコアを記録しました・DeepWiki比で+4.73ポイント改善し、22.9万行のOpenHandsプロジェクトで82.45%を達成しました・GitHubスター1.2k、フォーク193、ACL 2026採択で、8.6万〜140万行のコードベースを扱えます・リポジトリ自身のドキュメントもCodeWikiで生成されており、その実力を体現しています #AIエージェント# #DevTools#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.17 21:57

⚙️ 月125兆トークンを捌くLLM推論基盤は、どう信頼性とコストを両立しているのか。リクエスト数ではなく「モデルユニット」でコストを測り、GPUコストを80%削減しつつ安定運用を実現したDatabricksの実戦知です。タイトル: Reliable LLM Inference at Scale URL: 📝 概要本記事は、大規模なLLM推論を信頼性高く・コスト効率よく運用するための、Databricksのアーキテクチャと手法を解説します。GPUインフラの不安定さや、予測困難なリクエストコストといった本番特有の課題に、具体的な仕組みで対処しています。 ❓ 解決する課題・GPUインフラはCPUより本質的に不安定で、prefill/decodeを分離した構成では単一障害が複数ノードに波及します・リクエストコストは事前推定が難しく、出力トークン生成がレイテンシを支配する一方、その時間は予測困難です・高負荷時には、リクエストの組み合わせ次第で健全なサーバが突然不健全状態に陥ります 💡 方法論と提案手法・コストを「α×入力トークン＋β×出力トークン＋γ×マルチモーダル」とモデル化する「モデルユニット」抽象を導入し、係数はモデル/ハードウェアごとの自動ベンチマークで決定します・自動シャーダーDicerが、キュー長でなくモデルユニットで測ったサーバ負荷でルーティングし、ステートフルセッションでキャッシュヒット率を高めます・保留リクエスト数でなく「モデルユニット利用率」でオートスケールし、ピーク閾値に近づくと増設します・ブラックボックスのヘルスチェックでサイレントハングを検知し、ヘルスチェックを最高優先度にして誤検知を防ぎます 🎯 ユースケース Superhumanやコーディングエージェント、サポートボットなど、トラフィックが数時間で急増するマルチテナントのエージェント型アプリを支えます。LLMアプリが単一テナントから共有本番環境へ移る局面に直結します。 📊 実験結果・コスト認識オートスケーリングで、静的なピーク見込みプロビジョニング比のGPUコストを80%超削減しました・ヘルスチェックの誤検知を週数件からゼロへ、サイレント障害の検知・回復は5分未満に収めました・画像処理をTorchvisionへ切り替え、OMP_NUM_THREADSをコンテナ上限に正しく設定し、同じレプリカ・負荷でスループットを3倍超に跳ね上げました・月125兆トークンをマルチテナントで処理しています #LLM# #MLOps#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.17 09:33

📚 ReActもRAGもTree of Thoughtsも、論文ごとにバラバラだったエージェント設計を、同じAPIで動かして比較できたら最高だと思いませんか？それを実現した「35パターン全部入り」のリポジトリです。タイトル: FareedKhan-dev/all-agentic-architectures URL: 📦 概要本リポジトリは、プロダクション品質のエージェントAIパターンを35種類実装したPythonライブラリ兼「生きた教科書」です。すべてのアーキテクチャが同じ.run(task)メソッドを持ち、同一形式の結果を返すため、下流のコードを変えずにパターンを差し替えられます。 ❓ 解決する課題エージェントの設計パターンは論文ごとに散らばっていて、実装も様式もバラバラでした。これを統一インターフェースの下に集約し、横並びで試せるようにしたのが最大の価値です。 💡 中核の工夫と提案手法中心にあるのが「決定論的ピッカーの規律」です。・LLMのスコアリングに丸投げせず、まずLLMに真偽値や列挙型などカテゴリ的な特徴をコミットさせる・最終判断はPythonのロジックで合成するこれにより、スコアが平坦に潰れる「LLM-as-Scorer」の病理を緩和します。35アーキテクチャ中13で採用されています。 🎯 カバー範囲とユースケース推論・内省（Reflection、Self-Discover）、探索（Tree of Thoughts、LATS）、RAG（Corrective/Self/Adaptive/GraphRAG）、メモリ（MemGPT、Voyager）、ツール・行動（ReAct、SWE-Agent）、マルチエージェント（Debate、STORM）など8系統を網羅。各パターンに実行済みのJupyterノートブックが付き、本物のLLM出力に基づく再現可能なリファレンスになっています。 📊 注目ポイント・コアはLangGraph。NebiusやOpenAI、Anthropic、Ollamaなど主要プロバイダーに対応し、切り替えは環境変数1つ・pytestで283件のテストがパス・17タスクのベンチマークで直近42問中33問正解（成功率78%）。ReflectionやSelf-Consistencyが好成績でした #AIエージェント# #LangGraph#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.17 01:34

AIエージェントをエンタープライズシステムに組み込むプラクティス【MCPゲートウェイ / ツール・フェデレーション（MCP Gateway）】 💡 ポイント「エージェント5つ × SaaS 10種 = 50本の個別統合。この掛け算地獄を解消するのがMCPゲートウェイです。」エージェントが増え、接続先SaaSが増えるたびに統合コストが爆発します。ツール定義の乱立、スキーマの不整合、そしてSaaSのサイレント仕様変更による暗黙の破綻。これらをアーキテクチャレベルで解決します。 🔥 解決する課題 - N（エージェント）×M（SaaS）の統合コスト爆発 - 各エージェントが独自にツール定義を持つことによる重複・不整合 - ツール経由の間接プロンプトインジェクション - エージェントに見えるツールが多すぎることによる選択精度の劣化 - SaaSのサイレント仕様変更（APIレスポンス形式変更等）による暗黙の破綻 🏗️ 提案パターン各SaaSコネクタをMCP（Model Context Protocol）サーバとして束ね、ゲートウェイがツールの発見・認可・呼び出し監査・スコープ制御を一元管理します。ツール許可リストを主体（部署×エージェント種別）で動的に絞り、エージェントに見えるツールを必要最小限にします。危険ツール（削除・送金・外部送信など不可逆操作）には承認フックを設置します。さらに、ツール定義/APIスキーマを「契約」としてバージョン管理し、定期的に実APIと突合してドリフト（乖離）を検知します。後方互換のないドリフトを検出した場合は、アラート＋該当ツールの一時無効化で安全側に倒します。 ✅ 選定条件 - 採用する場合：連携SaaSが10種以上。複数エージェントが共通ツールを使う。N×M統合の複雑さに困っている。 - 採用しない場合：ツールが2〜3個固定の単機能エージェント（直結のほうが堅牢でシンプル）。依存APIが安定していて変更頻度が極めて低い環境。 ⚠️ 落とし穴 - エージェントに露出するツールが20〜30を超えると選択精度が低下します。tool RAGで意図に応じて動的に絞るか、役割別サブエージェントに分割してください。 - 契約テスト（ドリフト検知）を導入しないと、SaaS側の仕様変更に気づかず、エージェントが誤ったデータを処理し続けます。Salesforce APIのフィールド変更などは実際に起きる頻度が高いです。 - MCPサーバの認可設計を後回しにすると、全エージェントが全ツールにアクセスできる状態が放置されます。 🛠️ 実装方針 - 各SaaS（Salesforce / ServiceNow / Jira / Slack / Box 等）のMCPサーバを構築します。公式MCPサーバがあればそれを採用し、なければOpenAPI定義からツールを自動生成して自作MCPサーバとして用意します。 - MCPゲートウェイを配置し、ツールレジストリ（カタログ）を構築します。各MCPサーバが提供するツールを一覧化し、部署×エージェント種別でアクセス可能なツールを動的にフィルタリングする許可リストを設定します。 - OAuth 2.1 ベースの認可と承認フックを設定します。不可逆操作（削除・送金・外部送信）を行うツールにはP09（動的認可PDP）と連携した承認ゲートを設置し、人間の承認なしに実行されない構成にします。 - 契約テスト（Pact等）とスキーマレジストリでドリフト検知パイプラインを構築します。週次でツール定義と実APIスキーマを突合し、後方互換のない変更を検出した場合はアラート＋該当ツールの自動無効化を行います。 - tool RAG または役割別サブエージェント分割で、各エージェントに露出するツール数を20以下に制御します。意図に応じて動的にツールを絞り込み、選択精度を維持します。 #AIエージェント# #エンタープライズアーキテクチャ#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.14 12:25

AIの次の10年は「計算量を増やす」競争から「1ジュールあたりの知能」を高める競争へ⚡ 30名の研究者が描く未来図です。タイトル: AI+HW 2035: Shaping the Next Decade URL: ⚡ 概要 AIとハードウェアの統合的な協調設計に向けた、10年間のロードマップを提示するビジョンペーパーです。際限ない計算スケーリングではなく、効率のスケーリング（intelligence per joule）を提唱します。 ❓ 解決する課題 AIとハードウェアの発展はもはや不可分なのに、グローバルな研究コミュニティには協調的で長期的な戦略が欠けていました。ただ計算量を増やし続ける路線の限界に、正面から向き合います。 💡 方法論と提案手法 4つの主要テーマを掲げます。・生の計算量よりエネルギー効率：消費電力を軸にスタック全体を再考・システムレベルの統合：アルゴリズム・アーキテクチャ・システムを横断する最適化・持続可能性：能力と効率のバランスを取る適応的システム・人間中心の設計：倫理原則を開発に組み込む 🌍 10年間のゴール・AIの訓練・推論で1000倍の効率改善・クラウド→エッジ→物理AIをまたぐ自己最適化システム・先進的AIインフラへのアクセスの民主化・人間の価値観をシステム設計に統合 #AIハードウェア# #省エネAI#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.13 01:43

# Claude Agent SDKの便利で実践的な使い方 📡 画像アップロード・割り込み・コンテキスト永続が使えるストリーミング入力モードを使いこなしましょう。ストリーミング入力 vs シングルメッセージは、永続的対話向けのストリーミングモードと、ステートレス環境向けのシングルメッセージモードの使い分けです。 📌 タイトル：ストリーミング入力 🔗 URL： 🧩 概要ストリーミング入力モード（推奨）は画像アップロード・メッセージキュー・割り込み・コンテキスト永続に対応し、リッチな対話体験を提供します。シングルメッセージ入力は AWS Lambda 等のステートレス環境で 1 回限りの応答に最適です。 🛠 使い方ストリーミングモードがデフォルトです。シングルメッセージモードは Lambda 等のステートレス環境で明示的に選択します。 🏗 実践的な使い方・チャット UI で「このコードベースを分析して」の後にアーキテクチャ図（画像）を追加添付してレビューさせる、リッチな体験を実現します。・メッセージキューで外部イベント（CI 結果、Slack 通知等）をエージェントに追加注入し、動的に文脈を拡張します。・AWS Lambda で「認証フローを説明して」を単発実行するサーバーレス関数にはシングルメッセージモードを使用します。 💡 ユースケース 🖼 画像添付付きのコードレビュー 📨 外部イベントの動的注入 ⚡ サーバーレス環境での単発タスク実行 ⚠️ 注意点シングルメッセージモードでは画像添付・割り込み・マルチターンが非対応です。リッチな対話が必要な場合はストリーミングモードを使用してください。 #ClaudeAgentSDK# #AI#

0

コミュニティへ転送

cv usk@cv_usk

2026.06.13 01:02

# Snowflakeの機能と実践的な使い方 🚀 「ストレージとコンピュートが分かれている」とよく言われるSnowflakeですが、その意味を正しく理解すると、コスト・性能・同時実行の議論がすべてスッと腑に落ちます。今回はSnowflakeの土台である3層アーキテクチャを掘り下げます。 📌 タイトルと機能のURL タイトル: Key Concepts and Architecture URL: 📝 概要 Snowflakeはクラウドネイティブに設計されたSQLデータプラットフォームで、ハードウェア管理やソフトウェア導入が不要なフルマネージドサービスです。アーキテクチャはシェアードディスクとシェアードナッシングの利点を組み合わせたハイブリッド構成で、「データベースストレージ」「クエリ処理(コンピュート)」「クラウドサービス」の3層から成ります。この3層が互いに独立してスケールするのが最大の特徴です。 🔧 機能の説明 3層それぞれの役割は次の通りです。・データベースストレージ層: 取り込んだデータを内部最適化された圧縮列指向フォーマットに再編成し、マイクロパーティション(連続したストレージ単位)に分割して保管します。データの物理的な格納方法はSnowflakeが完全に管理し、ユーザーはSQLでのみアクセスします。・コンピュート層(Virtual Warehouse): クエリを実行する計算リソースのクラスタです。各ウェアハウスはMPP(超並列処理)で独立して動き、あるウェアハウスの負荷が他のウェアハウスの性能に影響しません。・クラウドサービス層: 認証・アクセス制御、メタデータ管理、クエリの解析と最適化、インフラ管理など、全体を統括する頭脳にあたります。ストレージは中央に1つ共有され(シェアードディスクの利点)、処理は分散ノードで行われる(シェアードナッシングの利点)、というのが核心です。 🛠 実践的な使い方この分離モデルを前提に、ワークロードごとにコンピュートを分けて設計するのが第一歩です。・ETL用、BIダッシュボード用、データサイエンス用にそれぞれ別のVirtual Warehouseを用意します。ストレージは1つを共有しているため、データを多重化することなく同じテーブルを各ウェアハウスから参照できます。・夜間バッチが重くても、別ウェアハウスで動くBIクエリは影響を受けません。負荷干渉を「構造的に」排除できます。・テーブル種別はSnowflake標準テーブルのほか、外部クラウドストレージ上のApache Icebergテーブル、トランザクション向けのHybrid Tableも選べます。 🎯 ユースケース・夜間ETLバッチでBIダッシュボードが遅くなる問題を、ウェアハウス分離で根本解決する。・データサイエンスチームの探索的クエリを専用ウェアハウスに隔離し、本番分析への影響を防ぐ。・部門ごとにウェアハウスを分けてコストを可視化・配賦する。 ⚠️ 注意点・コンピュートは起動中のみクレジットを消費します。ストレージ課金とは別計算なので、両者を分けて見積もります。・ストレージが共有でも、アクセス権限はクラウドサービス層のRBACで別途制御する必要があります。共有=誰でも見られる、ではありません。・「分離」はあくまで論理設計の話です。ウェアハウスを闇雲に増やすと管理対象が増えるため、ワークロード単位での適切な分割を心がけます。 #Snowflake# #DataWarehouse#

0

コミュニティへ転送