登録して招待リンクを共有すると、動画再生報酬と紹介報酬を獲得できます。

検索結果 オープンソース
オープンソース コミュニティ
1つのキーワードが1つのコミュニティです。
コミュニティ作成
アカウント
見つかりません
オープンソース を含む検索結果
AIエージェントの回答を「検証可能で説明できる事実」に根拠づける——ナレッジグラフ+GraphRAG+エージェントのフルスタックをまるごとオープンソースで提供する基盤です🕸️ タイトル: trustgraph-ai/trustgraph URL: 🕸️ 概要 AIエージェントのためのオープンソースのセマンティック・デプロイメント基盤です。コアは「コンテキストグラフ」(ドメイン知識を構造化しクエリ可能にした表現)。コンテキストグラフ・メモリ・検索・オーケストレーション・推論を、決定論的なエージェント向けにフルスタックで提供します。 ❓ 解決する課題 LLM単体では、なぜその答えになったのかを辿りにくく、ハルシネーションのリスクもあります。 ・エージェントの回答を、検証可能で説明可能な事実に根拠づけるのが難しい ・TrustGraphはナレッジグラフ構築とGraphRAGを組み合わせ、意味的に豊かで検証可能なコンテキストにアクセスできるようにします ・しかも主権的に管理できるプライベート環境で実現します 💡 主な特徴 ・マルチモデルDB(表・KV・ドキュメント・グラフ・ベクトル)とマルチモーダル対応、エンティティ/関係の自動抽出 ・DocumentRAG・GraphRAG・OntologyRAGのパイプラインと、3D GraphVizによる可視化 ・単一/マルチエージェント、ReAct・Plan-then-Execute・Supervisorパターン、MCP統合 ・Context Cores:スキーマ・グラフ・埋め込み・エビデンス・検索ポリシーを束ね、コンテキストをコードのようにバージョン管理 🌍 技術スタック / 使い方 ストレージはCassandra・Qdrant・Garage、メッセージングはPulsar等、LLMはAnthropic/OpenAI/Google等+ローカル推論(vLLM/Ollama等)に対応。npx @trustgraph/configで構成し、ポート8888のUIから利用できます。Apache 2.0ライセンスです。 #GraphRAG# #ナレッジグラフ#
もっと見る
毎日数十億トークンのトレースを、フロンティアLLMで評価するのはコスト的に無理がありました💸 小型オープンモデルのファインチューニングで、同等精度を10〜100倍安く実現した事例です。 タイトル: Building a 100x Cheaper Trace Judge with Fireworks URL: 💸 概要 LangChain LabsがFireworksと連携し、エージェントのトレースに対する「Perceived Error(知覚されたエラー)」検出器を構築した事例です。ユーザーが「間違い」や「修正が必要」と感じたケースを、小型のオープンモデルで検出します。 ❓ 解決する課題 LangSmithは本番トレースを通じて日次で数十億トークンを処理しています。 ・これらをフロンティアの大規模LLMで評価すると、規模が大きすぎてコストが非現実的になります ・「フロンティア級の性能を保ちつつ、全トレースから重要なシグナルをコスト効率よく抽出できるか」が問いでした 💡 方法論と提案手法 ・オープンソースのQwen-3.5-35Bを、Fireworks基盤上でLoRAによる教師ありファインチューニング(SFT) ・訓練データは2つの本番データセット:chat-langchain(技術Q&A・707例)とFleet(ノーコードエージェント・727例) ・「Perceived Error」を学習し、巨大なフロンティアモデルに頼らず評価をこなします 📊 実験結果 ・精度:ファインチューニングしたQwenがフロンティアモデルと同等以上(chat-langchainで96.1%、ドメイン横断のFleetで90.8%) ・コスト:トレース量に応じてフロンティアより10〜100倍安い ・転移性:chat-langchainで訓練したモデルが、再訓練なしでFleetでも全フロンティアモデルを上回る #LLM評価# #ファインチューニング#
もっと見る
1時間級の長尺動画を丸ごと理解し、ツールも検索も使いこなす——総30Bパラメータでも推論時はわずか3Bで動く、効率的なマルチモーダルモデルです🎬 タイトル: Kwai Keye-VL-2.0 Technical Report URL: 🎬 概要 Kuaishou(快手)が開発した、長尺動画理解とエージェント的知能に特化したオープンソースのマルチモーダル基盤モデルです。Mixture-of-Experts(MoE)構成を採用し、総30Bパラメータのうち推論時に活性化するのは3Bのみという効率性を実現しています。 ❓ 解決する課題 時間単位(hour-level)の長い動画を扱うには、膨大な計算が必要になります。 ・フレーム数が多く、長距離の時間依存を捉えるのが難しい ・計算制約に対処しつつ、多様なタスクで高い性能を保つことが課題でした 💡 方法論と提案手法 ・長文脈処理:DeepSeek Sparse Attention(DSA)をGQAベースのアーキテクチャに適応させ、256Kコンテキストのロスレス処理を実現。重要なフレームと長距離の時間依存を捉えます ・インフラ:スケーラブルな動画I/O、異種のViT-LM並列化、カスタムのDSAカーネル ・訓練:マルチタスクのアライメント時に生じる破滅的忘却に対処するため、Cross-Modal Multi-Teacher On-Policy Distillation(MOPD)を、Context-RL・Video-RLと組み合わせます 📊 実験結果 ・同規模のモデルの中で最先端(SOTA)の性能を達成しました ・特に、TimeLensでの細粒度な時間的ローカライズで際立ちます ・Video-MME-v2とLongVideoBenchでの長尺動画理解でも優れています ・Code・Tool・Searchをまたぐマルチモーダルなエージェント協調や、自己修正能力も備えます 🌍 ユースケース 長い動画の理解・検索・モデレーション、動画を扱う自律エージェントの基盤などに向きます。スパースアテンションをこの規模のマルチモーダルに初めて適用した点で、時間単位の動画処理を計算コストを抑えて現実的に回せるのが大きな強みです。 #動画理解# #マルチモーダル#
もっと見る
📝フォントラボ ひとりごこち Inc. 欧文フォント『DM Sans』 ・Google Fontsにおいて、現代のデジタルプロダクトやWebデザインの最前線で「絶対に外さない万能フォント」として不動の地位を築いているのが、この書体 ・イギリスの高名なフォントファウンドリ「Colophon Foundry」によってデザインされ、Googleの資金提供によってオープンソースとして公開された ・デザインの世界観において、DM Sans は「透明感、親しみやすさ、実直な先進性、アクセシビリティ」を演出 ・幾何学由来のポップさと、風通しの良いクリアな空間設計によって、インターフェースに「ユーザーを温かく迎え入れる、オープンで優しい体温」が宿る ・モダンなB2B/B2C SaaS、教育やヘルスケアアプリ、親しみやすさを最優先したいフィンテック、ミニマルで清潔感のあるライフスタイルブランドのWebサイトなどに調和する 和文・タイトルフォント『見出ゴMB31』 ・日本のフォントデザインの歴史、特に出版・広告・グラフィックデザインの領域において、半世紀以上にわたり「強い見出し」の絶対王者として君臨し続けている伝説的な太ゴシック体が、この書体 ・写植時代に誕生して以来、その圧倒的な存在感と完成度から、デジタル化した現代でも新聞のインサイド見出し、書籍の表紙、ポスター、映画のタイポグラフィ、そしてエディトリアルデザインの現場で熱狂的に使われ続けている ・デザインの世界観において、見出ゴMB31は「確固たる信頼感、ジャーナリズム、言葉の重み、男気、泥臭いまでの人間味」を演出 ・思想をアピールしたいグラフィック、あるいはクラフトマンシップや歴史の重みを無骨に伝えたいWebサイトのヒーローコピーにおいて、他の追随を許さない威力を発揮する 和文・ボディフォント『中ゴシックBBB』 ・「見出ゴMB31」が日本の“強い見出し”の絶対王者であるならば、同じモリサワの系譜において、“日本の長文用オールドスタイル・ゴシックの頂点”として半世紀以上デザイン界を支え続けているのが、この書体 ・写植時代に生まれ、デジタル化した現代でもなお、書籍の本文、文芸誌、教科書、製品の取扱説明書、そしてテレビ(特にNHKなどのドキュメンタリーやニュース)のテロップの標準として、日本の「言葉のインフラ」を担い続けている ・デザインの世界観において、中ゴシックBBBは「誠実さ、実直、知的、公共性、不変のスタンダード」を演出 ・過度なトレンドや流行の消費に流されたくないプロダクト。例えば、思想を深く語るWebメディア、学術・教育系のUI、信頼性が100%求められる医療・インフラ系アプリ、あるいはミニマルで誠実な日本のクラフト(工芸・生活道具)を扱うD2Cブランドなどにフィットする
もっと見る
OpenAIもAnthropicもGoogleも、モデル名を1行変えるだけで切り替え——プロバイダーごとのSDKを覚える苦労を消すライブラリです🔌 タイトル: andrewyng/aisuite URL: 🔌 概要 Andrew Ng氏による軽量なPythonライブラリです。複数のLLMプロバイダーを、統一されたOpenAIスタイルのインターフェースで呼び出せます。モデル名を「provider:model-name」の形式で指定するだけで、同じコードのまま各社を横断できます。 ❓ 解決する課題 複数のLLMプロバイダーを使い分けると、それぞれ異なるSDK・API・パラメータ構造を覚える必要があり、開発の摩擦になります。 ・aisuiteはこの断片化問題を解決します ・リクエストとレスポンスを標準化し、SDKの差異ではなくロジックに集中できるようにします 💡 主な機能 ・Chat Completions API:プロバイダー非依存の層(temperature・max_tokens・toolsに対応) ・Agents API:ツール処理・状態永続化・ツールポリシーによるガバナンスを備えた構造化エージェント ・Toolkits:ファイル・git・シェル操作の事前サンドボックス化ツール群 ・MCPサポート:任意のMCPサーバーのツールをネイティブに利用 ・OpenCoworker:aisuite上に構築されたデスクトップAIエージェントアプリ 仕組みはプロバイダーアダプタパターンで、命名規約に従いモデル文字列から自動発見・生成します。 🌍 対応プロバイダー / 使い方 OpenAI・Anthropic・Google・Mistral・Hugging Face・AWS・Cohere・Ollama・OpenRouterなどに対応(拡張可能)。ai.Client()を作り、model="openai:gpt-4o"のように呼ぶだけで、切り替えはモデル文字列の変更のみ。ライセンスはMITです。 #LLM# #オープンソース#
もっと見る
🎼 テキスト・画像・音声・動画が入り混じる難タスクを、専門サブエージェントに分解して並列で解く——巨大単体モデルより「適材適所のチーム」が勝つことを示した研究です。 タイトル: Orchestra-o1: Omnimodal Agent Orchestration URL: 💡 概要 Orchestra-o1は、複数モダリティが同時に絡むタスクを、高レベルのオーケストレーションと低レベルのツール実行に分離して解く階層型エージェント枠組みです。モダリティに応じてサブエージェントを専門化し、並列実行で効率を高めます。 ⚠️ 解決する課題 既存のオーケストレーションは扱えるモダリティが限られ、テキスト・画像・音声・動画が共存して相互作用するシナリオに汎化できませんでした。 🛠 方法論と提案手法 ・バックエンドを「スキルベクトル+コスト/レイテンシ」で表し、コスト考慮で選択 ・知覚系(画像/音声/動画解析)と行動系(検索/閲覧/コード実行)のツールを割り当て ・サブゴールの潜在依存グラフを作り独立タスクを並列実行 ・学習はDA-GRPO:最終回答でなくステップ単位を評価し、decision quality(0.6)を重視した多次元ルーブリック報酬で意思決定を整合 📊 実験結果(独自ベンチOmniGAIA) ・Orchestra-o1-GPT-5が72.8%で、2位のGemini-3-Proを10.3ポイント上回り最高 ・オープンソースのOrchestra-o1-8B(Qwen3-8Bベース)は30.0%でOSS最高 ・精度72.8%をコスト341.6で達成し、低精度な比較手法より安く高精度 ・難易度別はEasy80.3%/Medium75.0%/Hard56.4% #AIエージェント# #マルチモーダル#
もっと見る
オープンまで7日 現在の学参コーナーを動画でご覧くださいませ✨