2025年6月11日、米国サンフランシスコでDatabricksの年次イベント「DATA + AI SUMMIT」が開催された。Databricks CEOのアリ・ゴディシ氏が「地球上で最大規模のデータおよびAIカンファレンス」と称する本イベントの初日基調講演には、世界150カ国から2万2000人以上が会場に集い、オンラインを含めると6万5000人以上が参加した。講演では、Databricksが掲げる「データとAIの民主化」というミッションを推進するための、さまざまな新発表が行われた。
複雑なデータ基盤の課題に終止符を、新DB「Lakebase」登場
冒頭、ゴディシ氏は企業が直面する課題として、データとAIインフラの複雑さを挙げた。「過去10〜15年間で最も学んだことは、複雑なアーキテクチャが組織の動きを遅らせ、高コストとベンダーロックインを引き起こしていることだ」と指摘。
Databricksはこれらの問題を解決するため、10年ほど前からアーキテクチャの簡素化に取り組み、組織がデータを活用する速度の向上を支援してきたと説明した。
基調講演のハイライトの一つが、AIアプリケーションとエージェントのための新しいデータベース「Lakebase(レイクベース)」の発表だ。ゴディシ氏は、OracleやSQL Serverのような従来のトランザクションデータベースは40年前のアーキテクチャに基づいており、データの固定化、高コスト、ベンダーロックインを引き起こしていると課題を述べた。
これに対しLakebaseは「データベース市場に新たなカテゴリを生み出す、レイクハウスと開発スタックに深く統合された最新のPostgresデータベース」と位置付けられる。生成AIやAIエージェントがビジネスのあり方を再構築する中、多くの企業が古いシステムからの脱却を模索しており、LakebaseはAI時代の要求に応えるデータベースとして提供される。
Lakebaseは、Databricksが2025年5月に買収を発表したサーバレスPostgresプロバイダーであるNeonの技術を基盤とする。
コンピューティングとストレージを分離することでスケーリングを可能にし、10ミリ秒未満の低レイテンシと1万QPS(Queries Per Second)超の高い同時実行性能を発揮するという。また、広く採用されているオープンソースのPostgresを基盤とすることで、豊富なエコシステムと拡張機能も活用できる。
AI時代に特化して設計されたLakebaseは1秒未満で起動し、使用した分だけを支払う従量課金制を採用する。そのため、コスト最適化が容易だとされる。
特に、既存のデータベースと同じデータやスキーマを持つ新しいデータベース(ブランチ)を瞬時に作成する「コピー・オン・ライト」機能は画期的だ。これにより、開発者は低リスクでテストやエージェントベースの開発を行え、AIエージェントが自身のコードブランチだけでなくデータベースも容易に取得できる、革新的な開発体験が提供される。
さらに、LakebaseはDatabricksのレイクハウスと深く統合されており、レイクハウスのテーブルとデータを自動で同期できるほか、Databricks AppsやUnity Catalogとも連携する。フルマネージドで提供され、高可用性、ポイントインタイムリカバリ、企業のセキュリティ機能も統合。同日よりパブリックプレビューとして提供が開始された。
AIエージェント開発を加速する「Agent Bricks」
次に、本番運用レベルの品質とコスト効率を実現する、AIエージェント構築のための統合ワークスペース「Agent Bricks(エージェント・ブリックス)」が発表された。AI統合開発プラットフォームの「Mosaic AI」を基盤として動作する。
Databricksは、AIエージェント開発における、品質評価の難しさ、多様な新技術への追随、コストと品質のバランス調整といった課題を認識している。ゴディシ氏は「Agent Bricksは、企業のデータに基づいて推論を行うAIエージェントを構築・展開するまったく新しい方法だ。これにより、企業は品質とコストのバランスを取りながら、アイデアから本番品質のAIエージェントまでを迅速かつ安心して開発できる」と強調した。
Agent Bricksの主な機能は3つある。第一に、LLM(大規模言語モデル)による自動品質評価「LLMジャッジ」だ。これはビジネス課題に合わせてLLMが評価者となり、エージェントのパフォーマンスを自動で測定する。
たとえば、自動車メーカーの製品に関する質問に対し、競合他社の製品や存在しないモデルを推奨するといったハルシネーション(もっともらしい嘘)を防ぐことができる。この機能は「LLMは作成者よりも優れた評価者である」という知見にもとづき、企業がAIエージェントを安心して活用する上で不可欠な機能と位置付けられている。
第二が、最適化エンジン「TAO(Test-Time Adaptive Optimization)」だ。ファインチューニングやプロンプト最適化、強化学習といったAI技術の中から最適な手法を自動で探索し、品質とコストのバランスを最適化する。これにより、企業は手動での試行錯誤の手間を省き、コスト対品質の最適解を容易に見つけられる。
第三は「継続的な学習機能(エージェントラーニング)」だ。システムへのフィードバックを取り込み、新しいデータに基づいてエージェントを継続的に賢くする技術で、自然言語による指示でエージェントの動作を改善できる。
Agent Bricksは、情報抽出、ナレッジアシスタント、カスタムLLM、マルチエージェントスーパーバイザーなど、多様な企業のユースケースに対応し、すでにβ版として提供されている。
誰でも無料で利用可能に、「Databricks Free Edition」提供開始
「データとAIの民主化」というミッションを象徴する取り組みとして「Databricks Free Edition(フリーエディション)」も発表された。これは、クレジットカード情報や企業メールアドレスなしで、学生など誰もがDatabricksのデータインテリジェンスプラットフォームの全機能を無料で利用できるものだ。
Free Editionでは、Mosaic AIを活用したAIエージェント構築、PythonやSQLによる共同データサイエンスプロジェクト、Genieによるダッシュボード作成、SQLエディタでのデータ分析、Lakeflowによるデータパイプライン構築、Databricks Assistantによるコーディング支援など、プラットフォームの広範な機能が提供される。
さらに、Databricks Academyの全セルフペース学習コンテンツへも無制限に無料アクセスでき、あらゆるレベルの学習者を支援する。
この取り組みは、デューク大学やカリフォルニア大学バークレー校など1200以上の教育機関と10万人以上の学生を支援してきた実績を持つ、Databricks University Allianceプログラムが基盤となっている。Free Editionもパブリックプレビューとして提供が始まり、グローバルなデータおよびAI教育に1億ドルを投資する計画も明らかにされた。
顧客価値の核となる「オープン」なアーキテクチャとエコシステム
プラットフォームの強化策として、アプリケーション開発環境「Databricks Apps」の一般提供(GA)も発表された。昨年11月のプレビュー開始以来、2500以上の顧客が2万以上のアプリケーションを構築し、Databricks史上最速で成長している製品だという。
Databricks Appsは、アプリケーションをデータやAI基盤の近くに配置するアーキテクチャを採用し、データとAIの民主化をさらに加速させる。開発者は認証(SSO)、統制(Unity Catalog)、インフラ管理、監視といった本番運用における複雑な課題から解放される。
新発表のLakebaseともワンクリックで統合でき、Python(Streamlit, FastAPIなど)やJavaScript(Node, Reactなど)といった主要なオープンソースフレームワークをサポートし、開発者に高い柔軟性を提供する。
このほか、サーバレスGPUのサポート、生成AI時代に合わせて再設計されたMLflow 3.0、大規模言語モデルにツールや知識を供給する共通プロトコル「モデル・コンテキスト・プロトコル(MCP)」のサポート開始なども発表された。
Lakebase、Agent Bricks、Free Edition、そしてDatabricks Appsという一連の発表は、DatabricksがデータとAIのアクセス性を高め、企業が直面する課題を解決しようとする姿勢の表れだ。これらの取り組みは、同社のデータインテリジェンスプラットフォームを強化し、「誰もがデータとAIを効果的に活用できる未来」というビジョンを具現化するものと言えるだろう。
今回の基調講演では、一貫して「オープン性」が強調された。Databricksはオープン性を製品アーキテクチャからエコシステム構築、人材育成に至るまであらゆる側面に組み込んでいる。
これにより、顧客のベンダーロックインへの懸念を払拭し、コスト効率、柔軟性、イノベーションの加速といった点で、プロプライエタリなソリューションを提供する競合他社に対する優位性を築こうとしている。