cv usk(@cv_usk):コーディングエージェントは1タスクで数十回もAPIを叩くので、誰にも気づかれず週に数千ドル溶かしてしまう——LangChainがこの「支出の予測不能性」を社内でどう潰したかの話です💸 鍵は予算管理をオブザーバビリティと同じ場所に統合することでした。タイトル: How LangChain Made Coding Agent Spend Predictable URL: https://t.co/JXWMwPN2S4 💸 概要 LangSmithに統合した「LLM Gateway」で、全社のモデル支出を分単位で俯瞰し、予算を中央集権的に管理する仕組みです。外付けプロキシではなく、既存のトレース・評価・ユーザー管理と同じ基盤の上に乗せた点が特徴です。 ❓ 解決する課題モデル利用が一部チームから全社に拡大し、プレミアムモデルの値上げも重なってコストが急増。・コーディングエージェントは1タスクで数十回のAPI呼び出しを発生させます・個々の開発者が気づかぬうちに週数千ドルを使い、月末まで誰も気づけませんでした 💡 方法論と提案手法予算を多階層で設定できます。・組織／ワークスペース／ユーザー／APIキーの単位で上限を設定・月次・週次・日次・時間単位の既定ウィンドウを全従業員に適用し、高負荷プロジェクトには例外を許可・Claude Code・Codex・LangChain Deep Agents経由のエージェントをカバー・MDMで配布し各自のセットアップを不要に・実行はトレースされユーザーとAPIキーに紐づき、超過時は該当トレースを評価データで診断できます 🌍 ユースケースチーム単位で上限を設定しつつ、サプライズ請求の不安なくエージェント利用を許可できます。月末の請求ショックを、リアルタイム監視に置き換えるのが実用的な価値です。 📊 教訓と成果・モデル価格は静的な表ではすぐ陳腐化するため、キャッシュやティア差を含め動的に扱う必要がありました・CursorやClaude DesktopはきれいにルーティングできずGateway捕捉分と提供側設定の差分を計測して補正・ハードリミットだけでは業務が止まるため、早期警告アラートと監査可能な増額申請に進化・社内展開以降、LLMコストは予算内に収まっています #コーディングエージェント #LLMOps

2026.06.15 21:36

コーディングエージェントは1タスクで数十回もAPIを叩くので、誰にも気づかれず週に数千ドル溶かしてしまう——LangChainがこの「支出の予測不能性」を社内でどう潰したかの話です💸 鍵は予算管理をオブザーバビリティと同じ場所に統合することでした。タイトル: How LangChain Made Coding Agent Spend Predictable URL: 💸 概要 LangSmithに統合した「LLM Gateway」で、全社のモデル支出を分単位で俯瞰し、予算を中央集権的に管理する仕組みです。外付けプロキシではなく、既存のトレース・評価・ユーザー管理と同じ基盤の上に乗せた点が特徴です。 ❓ 解決する課題モデル利用が一部チームから全社に拡大し、プレミアムモデルの値上げも重なってコストが急増。・コーディングエージェントは1タスクで数十回のAPI呼び出しを発生させます・個々の開発者が気づかぬうちに週数千ドルを使い、月末まで誰も気づけませんでした 💡 方法論と提案手法予算を多階層で設定できます。・組織／ワークスペース／ユーザー／APIキーの単位で上限を設定・月次・週次・日次・時間単位の既定ウィンドウを全従業員に適用し、高負荷プロジェクトには例外を許可・Claude Code・Codex・LangChain Deep Agents経由のエージェントをカバー・MDMで配布し各自のセットアップを不要に・実行はトレースされユーザーとAPIキーに紐づき、超過時は該当トレースを評価データで診断できます 🌍 ユースケースチーム単位で上限を設定しつつ、サプライズ請求の不安なくエージェント利用を許可できます。月末の請求ショックを、リアルタイム監視に置き換えるのが実用的な価値です。 📊 教訓と成果・モデル価格は静的な表ではすぐ陳腐化するため、キャッシュやティア差を含め動的に扱う必要がありました・CursorやClaude DesktopはきれいにルーティングできずGateway捕捉分と提供側設定の差分を計測して補正・ハードリミットだけでは業務が止まるため、早期警告アラートと監査可能な増額申請に進化・社内展開以降、LLMコストは予算内に収まっています #コーディングエージェント# #LLMOps#