人工知能(AI)の活用がPoC(概念実証)から本番運用へ進むにつれ、企業の関心は「どのモデルを使うか」だけではなく「どのくらいのコストがかかるのか」にも向けられるようになっている。特に、「Agentic AI(エージェント型AI)」が業務の中で自律的に推論し、複数のツールやシステムを呼び出すようになれば、トークン消費と処理負荷は大きく増える。
では、企業はクラウドAPIに依存したまま、そのコストと統制を管理し続けられるのか。
米Dell Technologies(以下、デル)が2026年5月に米国ラスベガスで開催した年次イベント「Dell Technologies World 2026」では、AI本番運用で「トークンコスト」をどう管理し、どのワークロードをどこで動かすかという、新たな課題に焦点が当てられた。
エージェント型AIの本番利用で問われる「token FinOps」
デルは今回のイベントで、AIインフラ戦略の核となる「Dell AI Factory with NVIDIA」の大幅な拡充を発表した。中でも目玉となったのが、ワークステーション上でエージェント型AIをローカル実行できる「Dell Deskside Agentic AI」だ。クラウドに依存せず、データを外部に出すことなくエージェント型AIを開発・テスト・運用できる(関連記事:2年ぶりの大型刷新、「PowerStore Elite」が性能・効率の新基準を打ち立てる【Dell Technologies World 2026】、DellがAI Factory戦略を加速。ワークステーションからデータセンターまでシームレスに拡張できるAI基盤【Dell Technologies World 2026】 )。
同社でコンピュート&ネットワーキング・ポートフォリオ管理担当シニアバイスプレジデントを務めるアランクマール・ナラヤナン(Arunkumar Narayanan)氏は、「クラウドAPIに依存したままエージェント型AIの本番利用が拡大すれば、企業はAIのコスト構造を見直す必要に迫られる」と指摘する。
ナラヤナン氏が強調するのは、「token FinOps」の重要性だ。クラウド利用料を可視化して最適化する「FinOps」の考え方を、AIのトークン消費にも適用していく必要があるとし、以下のように説明する。
「AIのトークン消費の仕組みと収支バランスである『tokenomics』はまだ業界全体で確立途上にある。ただ、将来的には企業のP/L(損益計算書)に“token cost”という項目が載るようになるだろう。企業は、LLMの利用で発生するトークンコストを可視化し、どのモデルを使うのか、どのワークロードを実行するのか、クラウドとオンプレミスのどちらで動かすのかを含めて、総合的に管理する必要がある」
現在、多くの企業では、生成AIの利用料はIT費用やクラウド費用の一部として扱われることが多い。しかし、エージェント型AIが営業、開発、研究、バックオフィス、顧客対応などの業務で多用されるようになれば、トークン消費は一部門の実験費用ではなく、事業運営に直結するコストになる。
トークン単価だけでは見えないAI本番運用のコスト構造
では、AIコストは何によって決まるのか。ナラヤナン氏は、モデル単価だけでなく、ワークロードの性質や実行場所まで含めて捉える必要があると説明する。
「エージェント型AIでは、コストの見方が単純なチャットボット利用とは大きく異なる。ユーザーの問いに一度応答して終わるのではなく、推論を重ね、外部ツールを呼び出し、ときには複数のエージェントが連携しながらタスクを進めるためだ。その一つひとつの処理がトークンを消費し、処理負荷を押し上げる」
また、同氏は、ワークロードによって必要なモデルの性能も異なると説明する。
「メールの要約のような用途であれば必ずしも最上位モデルは必要ないが、深いコーディング支援や創薬研究、ゲノム解析のような用途では高度な推論能力を持つモデルが求められる。モデルによって入力トークンと出力トークンの価格構造も異なり、一般に高度なモデルほど出力トークンの単価は高くなる」
AIコスト管理は実行環境の設計まで広がる
さらにナラヤナン氏は、「オープンソースモデルを使えば利用料が単純にゼロになるわけでもない」と警鐘を鳴らす。導入、運用、チューニング、品質確保、セキュリティ対策には別途コストがかかる。
だからこそ、企業はモデル単価だけを見るのではなく、ワークロード、モデル選択、実行場所、運用負荷を含めてAIコストを管理する必要があると強調する。
この視点は、AIインフラの設計にも直結する。AIエージェントの本番運用では、モデルやGPUだけでなく、オーケストレーションやツール呼び出しを担うCPU、低レイテンシーのネットワーク、同時利用に耐えるスループットも含めて設計する必要がある。今回のイベントではどのモデルを使うかだけでなく、どの処理をどこで実行するかまでを含めて設計することの重要性が繰り返し強調された。
-

デルは、AIの実行場所をクラウドかオンプレミスかの二者択一ではなく、ワークロードに応じて使い分けるハイブリッド環境として提示。機密データや規制対応、低レイテンシが求められる処理では、統制の効く環境が重要になる(出典:Dell Technologies)
日本企業が重視するガバナンスとデータ管理
こうしたコスト構造と実行場所の再設計は、日本企業にとっても大きな課題となる。デル・テクノロジーズで代表取締役社長を務めるグレンジャー・ウォリス(Grainger Wallis)氏は、日本市場の特徴について「AIがもはや将来の課題ではなく、経営上不可欠なものになりつつあることを明確に理解している」と話す。一方で、市場全体としては、実証実験から本格運用へ移行している途上にあると指摘する。
ウォリス氏が日本企業のAI活用で特に印象的だと語るのが、ガバナンス、セキュリティ、データコントロールに対する関心の高さだ。グローバルでは「いかに早く導入するか」が議論の中心になることも多い。一方、日本企業は「どうすれば責任ある形でAIを実装できるのか」「企業データをどのように保護するのか」「AIの信頼性をどう担保するのか」といった部分を重視する傾向があるという。
これは、AI導入のスピードが遅いという単純な話ではない。AIを業務の中核に組み込む段階に進むほど、データの所在、アクセス権限、セキュリティ、コンプライアンス、運用負荷を含めた設計が不可欠になる。さらに本番運用では、PoC段階では見えにくかったデータ連携や権限管理、運用品質の課題が表面化する。
ウォリス氏は、「最大の障害は多くの企業がAI導入を『全社的な変革の取り組み』ではなく『技術的な実験』として捉えてしまう点だ。PoCを構築すること自体は比較的容易だが、それをセキュアにスケールさせ、業務ワークフローに統合し、データを適切にガバナンスし、測定可能なROIにつなげることは、はるかに複雑である」と指摘する。
こうした状況で日本企業が求めているのは、個別のAIツールではなく、インフラ、データ、セキュリティ、ガバナンス、運用を一体的にカバーするエンド・ツー・エンドのアーキテクチャだとウォリス氏は語る。「AIの効果は基盤となるデータの品質とアクセスのしやすさに左右されるが、多くの企業は依然としてデータサイロやガバナンスの課題を抱えている。だからこそDellはAIファクトリー、自動化、データ管理、セキュアな展開モデルを含むAIインフラスタック全体に焦点を当てている」
クラウドかオンプレかではなく、ハイブリッドAIへ
では、その基盤はクラウドとオンプレミスのどちらに置くべきなのか。ウォリス氏は「もはやクラウドかオンプレミスかという二者択一の議論ではない。エンタープライズAIは極めてハイブリッドな形になっていく」と語る。
パブリッククラウドは、スケーラビリティや最新技術へのアクセスという点で引き続き重要である。一方で、企業が実証実験から本番運用へ移行するにつれて、データの所在、モデルガバナンス、レイテンシー要件、コンプライアンス、そしてトータルコスト効率を改めて評価するようになっている。機密性の高い企業データを扱うワークロードでは、より高い統制と予測可能性を備えたプライベートAI環境が適する場合もある。重要なのは、ワークロードやデータの性質に応じて、最適な実行環境を組み合わせることだ。
ただし、こうしたハイブリッドなAI基盤は、インフラを整えるだけでは機能しない。業務プロセスへの深い理解や、業界ごとの要件を踏まえた実装力が求められる。ウォリス氏は「日本企業がPoCから本番運用へ進むには、インフラ、データ、セキュリティ、ガバナンスを一体で設計するとともに、SIerや業界スペシャリストなどのパートナーと連携しながら、自社の業務に即したAI活用へ落とし込むことが重要になる」としている。

