Datadogは6月24日、新しい調査レポート「クラウドコストの現状2024」を発表した。同レポートによると、GPUインスタンスを使用する企業は、昨年1年間でインスタンスへの平均支出額が40%増加していることが明らかになった。
レポートは、Datadogが数百の組織から入手したAWSのクラウドコストデータを分析し新世代および旧世代のテクノロジーの使用、クラウドリソースの使用パターン、AWSの割引プログラムへの参加などがクラウドコストにどのように寄与しているかを調査したものとなる。
レポートの概要
GPUインスタンスへの支出が増加している理由は、GPUの並列処理能力はLLM(大規模言語モデル)のトレー二ングやそのほかのAIワークロードの実行に不可欠ための、試用する企業が増えているからだという。
AIプロジェクトに計算能力を費やす企業が増えていることに加え、同レポートではコンテナが浪費の共通テーマであることを明らかにしたとのこと。
コンテナのコストの83%はアイドル状態のリソースに関連し、これらの浪費の約54%はクラスタアイドル(クラスタ・インフラを過剰にプロビジョニングすることによるコスト)であり、29%はワークロードアイドル(ワークロードが必要とする以上のリソース要求によるもの)だった。
これは、企業がAmazon Elastic Compute Cloud(EC2)コンピュートの多くをコンテナの実行に割り当てていることに起因しており、1年前の30%から35%に増加したという。
現在、AWSが提供しているインフラは一般的に旧世代のものを凌駕しているためコストは低いものの、83%の組織がEC2の予算の平均17%を旧世代のテクノロジーに費やしている。また、例えばAWSはAmazon EC2、Amazon RDS、Amazon SageMakerなどの割引プログラムを提供しているが、これらの割引を利用している企業は67%に過ぎず、昨年の72%から減少。
さらに、Armベースのインスタンスを使用している企業は、平均してEC2のコンピュート予算の18%をArmベースのインスタンスに費やし、Armプロセッサをベースとするインスタンスタイプは、同様のEC2よりも最大60%エネルギー消費が少なく、多くの場合は低コストで優れたパフォーマンスを提供しているという。