機械学習(ML)や生成AI(GenAI)がもたらす生産性向上やイノベーションの可能性は計りしれません。しかし、データの基盤が整備されていなければ、そのポテンシャルは十分に発揮されません。Gartnerの予測によると、少なくとも30%の生成AIプロジェクトが、データ品質の低さなどの要因で途中放棄されるといいます。
データの生成量は日々増加し、新たなデータソースも次々と登場しています。その結果、企業はクラウド、エッジ、データセンター、メインフレーム、エンドユーザーのデバイスに分散した重要データを有効活用することがますます困難になっています。
Clouderaが2024年に実施した「エンタープライズAIと最新データアーキテクチャに関する調査」では、ITリーダーの73%が、社内のデータがサイロ化(分断)されており、相互に接続されていないと回答しました。さらに、半数以上が「自社の全データにアクセスするくらいなら歯科治療(根管治療)を受ける方がマシ」と答えており、データ管理の煩雑さが大きな課題であることが示されています。
また、IT部門に限らず、多くの経営層がAIや生成AIへの投資から適切なROI(投資対効果)を得ることに苦戦していることも明らかになっています。その原因の一つが、企業のデータ基盤が十分に整備されていないことにあります。