LLMOps を X で検索 — Twitter ブラウザ

検索結果 LLMOps

LLMOps コミュニティ

1つのキーワードが1つのコミュニティです。

コミュニティ作成

アカウント

見つかりません

LLMOps を含む検索結果

cv usk@cv_usk

2026.06.15 21:36

コーディングエージェントは1タスクで数十回もAPIを叩くので、誰にも気づかれず週に数千ドル溶かしてしまう——LangChainがこの「支出の予測不能性」を社内でどう潰したかの話です💸 鍵は予算管理をオブザーバビリティと同じ場所に統合することでした。タイトル: How LangChain Made Coding Agent Spend Predictable URL: 💸 概要 LangSmithに統合した「LLM Gateway」で、全社のモデル支出を分単位で俯瞰し、予算を中央集権的に管理する仕組みです。外付けプロキシではなく、既存のトレース・評価・ユーザー管理と同じ基盤の上に乗せた点が特徴です。 ❓ 解決する課題モデル利用が一部チームから全社に拡大し、プレミアムモデルの値上げも重なってコストが急増。・コーディングエージェントは1タスクで数十回のAPI呼び出しを発生させます・個々の開発者が気づかぬうちに週数千ドルを使い、月末まで誰も気づけませんでした 💡 方法論と提案手法予算を多階層で設定できます。・組織／ワークスペース／ユーザー／APIキーの単位で上限を設定・月次・週次・日次・時間単位の既定ウィンドウを全従業員に適用し、高負荷プロジェクトには例外を許可・Claude Code・Codex・LangChain Deep Agents経由のエージェントをカバー・MDMで配布し各自のセットアップを不要に・実行はトレースされユーザーとAPIキーに紐づき、超過時は該当トレースを評価データで診断できます 🌍 ユースケースチーム単位で上限を設定しつつ、サプライズ請求の不安なくエージェント利用を許可できます。月末の請求ショックを、リアルタイム監視に置き換えるのが実用的な価値です。 📊 教訓と成果・モデル価格は静的な表ではすぐ陳腐化するため、キャッシュやティア差を含め動的に扱う必要がありました・CursorやClaude DesktopはきれいにルーティングできずGateway捕捉分と提供側設定の差分を計測して補正・ハードリミットだけでは業務が止まるため、早期警告アラートと監査可能な増額申請に進化・社内展開以降、LLMコストは予算内に収まっています #コーディングエージェント# #LLMOps#

コミュニティへ転送

cv usk@cv_usk

2026.06.14 13:21

ログを取るだけでは事故は防げません。問題のあるリクエストを、LLMに届く前に止める「実行時ガバナンス」の登場です🛡️ タイトル: LangSmith LLM Gateway: runtime governance built into the agent lifecycle URL: 🛡️ 概要エージェントとモデルプロバイダーの間に立つ実行時ガバナンスの層です。LangSmithプラットフォーム内の強制ポイントとして、問題を「後から記録する」のではなく「発生源で止める」ことを狙います。 ❓ 解決する課題可観測性（ログ）だけでは問題を防げません。インシデントが起きてから記録するのでは遅く、問題のあるリクエストは外部のLLMプロバイダーに届く前に止めるべきだ、という考えが出発点です。 💡 機能の説明・支出コントロール：組織・ワークスペース・ユーザー・APIキー単位でハード上限。超過時は402エラー・コストの可視化：組織単位のリアルタイム支出追跡・データ保護：モデルに渡る前にPIIや秘密情報を自動リダクション・トレース統合：Gateway経由の呼び出しが同じワークスペースに表示・監査ログと階層的ポリシー設定は最小限で、base_urlをGatewayに向け、キーをシークレットに保存し、UIでポリシーを定義するだけです。 🌍 ユースケース・リトライループによる暴走的な支出の防止・SSNやPIIなど機微データのプロバイダーログ流出の防止・組織的なコストガバナンスとコンプライアンス監査 #LLMOps# #AIガバナンス#

コミュニティへ転送