コーディングエージェントは1タスクで数十回もAPIを叩くので、誰にも気づかれず週に数千ドル溶かしてしまう——LangChainがこの「支出の予測不能性」を社内でどう潰したかの話です💸 鍵は予算管理をオブザーバビリティと同じ場所に統合することでした。
タイトル: How LangChain Made Coding Agent Spend Predictable
URL:
💸 概要
LangSmithに統合した「LLM Gateway」で、全社のモデル支出を分単位で俯瞰し、予算を中央集権的に管理する仕組みです。外付けプロキシではなく、既存のトレース・評価・ユーザー管理と同じ基盤の上に乗せた点が特徴です。
❓ 解決する課題
モデル利用が一部チームから全社に拡大し、プレミアムモデルの値上げも重なってコストが急増。
・コーディングエージェントは1タスクで数十回のAPI呼び出しを発生させます
・個々の開発者が気づかぬうちに週数千ドルを使い、月末まで誰も気づけませんでした
💡 方法論と提案手法
予算を多階層で設定できます。
・組織/ワークスペース/ユーザー/APIキーの単位で上限を設定
・月次・週次・日次・時間単位の既定ウィンドウを全従業員に適用し、高負荷プロジェクトには例外を許可
・Claude Code・Codex・LangChain Deep Agents経由のエージェントをカバー
・MDMで配布し各自のセットアップを不要に
・実行はトレースされユーザーとAPIキーに紐づき、超過時は該当トレースを評価データで診断できます
🌍 ユースケース
チーム単位で上限を設定しつつ、サプライズ請求の不安なくエージェント利用を許可できます。月末の請求ショックを、リアルタイム監視に置き換えるのが実用的な価値です。
📊 教訓と成果
・モデル価格は静的な表ではすぐ陳腐化するため、キャッシュやティア差を含め動的に扱う必要がありました
・CursorやClaude DesktopはきれいにルーティングできずGateway捕捉分と提供側設定の差分を計測して補正
・ハードリミットだけでは業務が止まるため、早期警告アラートと監査可能な増額申請に進化
・社内展開以降、LLMコストは予算内に収まっています
#
コーディングエージェント# #
LLMOps#