米Google Cloudは8月2日、Google Cloudのデータベースとデータアナリティクスに関する新サービスを発表した。新サービスの発表に先立ち、メディア向けに同社 プラットフォーム & テクニカルインフラストラクチャ バイスプレジデント兼ジェネラルマネージャー ブラッド・カルダー氏と、同 データベース ジェネラルマネージャー兼バイスプレジデント アンディ・ガットマンズ氏が出席し、説明会を開催した。

データは最も重要なAIの原動力になっているが……

冒頭、カルダー氏は「AIの力によりアナリティクスは新しい時代を迎えた。AIとエンタープライズデータを組み合わせることで、価値を引き出せるということを目の当たりにしている。データは最も重要なAIの原動力になっているが、大半が闇になっている。つまり、見られてはいるが、使われていないということだ。ほとんどのデータは構造化されていなければ、管理もされていないためAIに接続することにより、データインサイトでチームにパワーを与えることができる」と述べた。

  • Google Cloud プラットフォーム & テクニカルインフラストラクチャ バイスプレジデント兼ジェネラルマネージャー ブラッド・カルダー氏

    Google Cloud プラットフォーム & テクニカルインフラストラクチャ バイスプレジデント兼ジェネラルマネージャー ブラッド・カルダー氏

同氏によると顧客からは「データを活用してサイロ化を解消したい」「マルチモーダルなデータ基盤を導入し、変革したい」「AIアシスタンスによる生産性向上を通じて自然言語でデータに容易にアクセスしたい」という声があるとのことだ。

一方、ガットマンズ氏は「生成AIの導入が加速する中、オペレーショナルデータベースは企業の生成AIアプリケーション構築の基盤を提供し、AIユースケースを推進するものだ。精度、関連性が高く、最新の情報を得ることができる」と述べている。

  • Google Cloud プデータベース ジェネラルマネージャー兼バイスプレジデント アンディ・ガットマンズ氏

    Google Cloud データベース ジェネラルマネージャー兼バイスプレジデント アンディ・ガットマンズ氏

今回、同社では「生成AI」「モダナイズ」「開発者」という3つの領域で各種サービスを発表した。

  • Google CloudにおけるAI対応データクラウドの概要

    Google CloudにおけるAI対応データクラウドの概要

生成AI

「BigQuery」と「Looker」にGeminiを搭載

まずは生成AIからだ。エンタープライズ向けDWH(データウェアハウス)の「BigQuery」にLLM(大規模言語モデル)「Gemini」を搭載した「Gemini in BigQuery」がGA(一般提供)となった。同サービスは、SQLコードの生成と説明、Pythonコードの生成、データキャンバス、パーティショニングとクラスタリングの推奨事項を提供するものとなる。

データキャンバスとは、AIによるデータの可視化やモデリング、分析し、BigQuery Studioへの統合やPythonノートブックの自動生成が可能とするもの。BigQueryでデータをクレンジング、変換、準備できるほか、文脈を認識してAIが生成する変換推奨でデータ開発の迅速化が図れるという。

  • 「Gemini in BigQuery」で一般提供を開始したデータキャンバスの概要

    「Gemini in BigQuery」で一般提供を開始したデータキャンバスの概要

BIの「Looker」にもGeminiを組み込んだ「Gemini in Looker」はプレビュー版となっている。AIを活用した数式アシスタントやスライド生成といった新機能が利用可能になり、近日中に会話分析の公開を予定。

  • 「Gemini in Looker」の概要

    「Gemini in Looker」の概要

オープンソースをサポートするAI対応に向けて、GAとなった「Apache Iceberg」「Delta」、プレビュー版として「Apache Hudi」「同Kafka」「同Spark」のBigQueryのサポートにより、データレイクハウスの構築が可能になった。また、ブレピュー版でBigQueryからAI統合基盤の「Vertex AI」に直接アクセスして、チャットや検索、生成、処理、ストリーミングができる。

カルダー氏は「BigQueryは構造化/非構造化データ、オープンフォーマットまで複数のデータタイプをサポートしている。単一で統一されたデータ基盤全体でアクセスを実現する」と力を込めていた。

「Spanner」でグラフ処理とベクトル検索

ガットマンズ氏は分散データベースの「Spanner」について「常に稼働し、グローバルの整合性に加え、実質的に制限のないスケーラビリティを持つデータベースだ。Google検索やGmail、Youtubeを支えるテクノロジー」と話す。

今回、そんなSpannerにおいて、さまざまな新機能がリリースされた。マルチモデル機能を拡張してスケーラブルなグラフ処理を可能とする「Spanner Graph」がプレビュー版となった。グラフクエリ言語(GQL)をサポートし、SQLとの相互運用性を提供することで単一の操作で構造化データと接続されたデータのシームレスなクエリを実行。

また、プレピュー版でSpannerの全文検索とベクトル検索も明らかにした。全文検索機能はScaNN(Scalable Nearest Neighbors:スケーラブルな最近傍探索)アルゴリズムにより、インデックス作成と検索ベクトルの埋め込みが可能となり、セマンティック検索を強化できるようになるという。

さらに、Spannerでは同一国内の2つの異なるリージョンでデータレジデンシーの要件に準拠することが可能な「Spannerデュアルリージョン構成」の一般提供を開始する。

  • 「Spanner」は、さまざまなユースケースにワンストップで対応するという

    「Spanner」は、さまざまなユースケースにワンストップで対応するという

モダナイズ

続いてはモダナイズに関しては、データレイクやDWHのワークロードをオンプレミス、そのほかのクラウドなど、あらゆる場所からBigQuery、またはレガシーアプリを拡張してモダナイズするためのクラウドサービス「Dataproc」に移行するためのサポートを提供し、AI対応を支援。

具体的には、初年度のGoogle Cloudのクレジットを最大100%還元し、最大25万ドルまでのデータ転送料金、移行サービスの実装クレジット、Google Cloudの専門知識とツールを提供する。

さらに、各組織におけるSpannerの利用に際し、ニーズと予算に合わせた段階的な価格設定モデルとして近日公開世手で「Standard」「Enterprise」「Enterprise Plus」の3つのエディションを用意。これらのエディションは上記のSpannerの新機能はStandard以外のエディションでサポートする方針だ。

  • 「Spanner」エディションの概要

    「Spanner」エディションの概要

開発者

最後は開発者向けのサービスだ。今回、NoSQLデータベースの「Bigtable」においてSQLのサポートを発表し、パフォーマンス、柔軟なデータモデル、スケールを活用し、既存のスキルを使用してリアルタイムアプリケーションを構築できるようになる。現在はプレビュー版での提供だ。

これにより、100を超えるSQL関数がBigtableで直接利用でき、生成AIアプリケーション開発のための機械学習アルゴリズムの1つであるkNNやログ処理のためのJSON操作から、リアルタイム分析のためのデータスケッチの使用まで、ニーズに合わせて拡張できるリアルタイムの高性能アプリケーションの構築が容易になるという。

  • BigtableがSQLをサポートすることでクエリが簡素化される

    BigtableがSQLをサポートすることでクエリが簡素化される

また、Bigtableでは分散カウンタの一般提供を開始。分散カウンタは、AI、不正検出、データ メッシュ、レコメンデーションなどのユースケースをサポートするためのイベントストリームの処理など、高スループットの書き込み時間集計用に最適化されている。

Bigtableカウンタを使用すると、毎日のユーザーエンゲージメントの集計、最小のセンサの読み取り値を決定するための最小値の確認、ピーク使用量を特定するための最大値の確認、BigQueryからのバックロードされた履歴データを使用してある程度の個別ユーザー数を追跡したりすることを容易にしている。