米Googleは3月16日(現地時間)、Gemini APIの利用コストを管理しやすくする新機能「Project Spend Caps」を発表、Google AI Studioに導入した。同時に、開発者がより迅速にシステムをスケールできるよう、使用量ティア(Usage Tiers)の刷新も実施した。

生成AIを組み込んだアプリケーションを開発・運用する企業にとって、APIコストの管理は大きな課題であった。利用量はエンドユーザーのアクセス数や入力プロンプトの長さに左右されるため、事前に費用を正確に見積もりにくい。特に複数のプロジェクトを並行して進める場合、プロジェクト単位で予算を細かく管理しづらく、開発チームは予算超過のリスクを意識しながらテストや本番運用を進める必要があった。

加えて、システムの成長に合わせてAPIのレート制限を引き上げる際の手続きや請求状況を確認する方法のわかりづらさや煩雑さも、運用負荷や開発スピード阻害の要因となっていた。

Project Spend Capsは、Google AI Studio上でプロジェクトごとに月間のドル建て上限を設定できる機能である。設定した上限は、利用者が変更または無効化しない限り継続して適用される。

複数のプロジェクトを抱えるアカウントでは、実験環境、本番環境、顧客向け案件など用途ごとに予算枠を分けて制御でき、一部のプロジェクトで想定外のトラフィック増加や実装ミスによる過剰なAPI呼び出しが起きた場合でも、支出の膨張やアカウント全体の予算を使い果たすリスクを防げる。ただし、上限適用には約10分の遅延があり、その間に発生した超過分は利用者側の負担となる点に注意が必要となる。

使用量ティアは、上位ティアに進むための支出条件が引き下げられ、利用実績と支払い履歴に応じて自動かつ迅速にアップグレードできる仕組みが導入された。条件を満たせば、より高いレート制限と月間クオータへ速やかに移行できる。請求アカウント全体に適用されるシステム定義の月間支出上限も設けられた。この上限はティアの上昇に応じて自動的に引き上げられ、ユーザーが設定するProject Spend Capsとは独立して機能する。

Google AI Studioではこのほか、請求や利用状況の可視化も強化された。請求設定は、複数の画面を移動することなく、AI Studio内で直接行えるようになった。さらに、レート制限ダッシュボード、コストダッシュボード、利用状況ダッシュボードが追加され、RPM(1分あたりのリクエスト数)、TPM(トークン数)、RPD(1日あたりのリクエスト数)といった指標や、日次コストの推移、エラー、トークン使用量、生成関連の統計なども確認できる。