米Databricksの日本法人であるデータブリックス・ジャパンは5月27日、都内でメディア向けに説明会を開催し、直近1年間の日本市場における事業の進捗・成果や今後の戦略について説明した。
Databricksの成長戦略とLakehouseの強み
はじめに、データブリックス・ジャパン 代表取締役社長の笹俊文氏は同社のグローバルのビジネス概況について説明。現在、同社の年間売上ランレートは54億ドル、評価額は1340億ドルに達し、前年比成長率は65%超となっており、好調に事業が推移している点を挙げた。
Databricksは、カルフォルニア大学バークレー校において、CEO兼共同設立者のアリ・ゴディシ(Ali Ghodsi)氏をはじめ、データとAIを研究するOSSの分散処理フレームワーク「Apache Spark」のクリエイター20人により、2013年にサンフランシスコで創業。日本法人は2019年に設立された。
同社は、データとAIの民主化を掲げ、データレイクとデータウェアハウス(DWH)のメリットを組み合わせた、データ管理アーキテクチャ「Lakehouse(レイクハウス)」のパイオニアだ。
Apache Sparkに加え、既存のデータレイクファイルストレージ上に設置されるオープンソースストレージレイヤ「Delta Lake」、データガバナンスの統合データカタログ「Unity Catalog」、機械学習のモデル開発から運用までのライフサイクルを管理するための「MLflow」など数々のオープンソースを生み出している。
笹氏は「引き続き強い成長を継続しており、オープンテーブルフォーマットのDelta Lakeと『Apache Iceberg』の両方に対応し、構造化・非構造化データを利活用でき、プラットフォームの拡張に常に取り組んでいる」と述べた。
日本市場で急拡大するDatabricksの事業とAI需要の高まり
笹氏は2023年に日本法人の社長に就任し、今年で就任から4年目を迎える。日本法人における直近の第1四半期(2026年2月~4月)の成長率は前年同期比100%超となっており、従業員数も200人規模まで増員している。
好調な事業環境を受けて、7月末に東京オフィスを新丸の内ビルに移転し、オフィス面積を1400平方メートルに拡大し、AIトレーニング専用施設やエグゼクティブ・エクスペリエンス・センターを設け、今後5年間で5万人にトレーニングの実施を予定。
同氏は「3年前を振り返ると、データプロジェクトとAIプロジェクトは分離する傾向にあったが、2022年11月にChatGPTが登場したことで自社データの整備に関する重要性が浸透していった。次世代プラットフォームへのデータ移行は“AIレディ”が前提であり、大規模なデータ分析にはAIをフル活用する流れが昨今では進展している。とはいえ、多くの企業で苦戦は続いている」との見解を示す。
苦戦を続ける理由は明確であり、従来から指摘されている組織内におけるデータのサイロ化と断片化だ。SaaS(Software as a Service)や基幹ソフトウェアの台頭により、各プラットフォームにデータが分散している。
本来であれば、AIやBI(ビジネスインテリジェンス)の活用やIoTのストリーミングも考慮しなければならないものの、運用データと分析データがロックインされているほか、セキュリティポリシーもサイロ化している。さらには、生成AIにはセマンティックレイヤを含めたコンテキスト(文脈)を与えてデータを解釈する必要があることに加え、部署ごとに利用するLLM(大規模言語モデル)の利用が混在しているのが実情だ。
このような状況に対し、笹氏は「課題すべてを引き受ける。当社のプラットフォームを使うことでデータとAIを使いやすくする。それを実現していくものが『Lakebase』と『Genie』だ」と力を込める。
Lakebaseが変えるデータ基盤、OLTPと分析を統合
Lakebaseは2025年の同社年次イベント「DATA + AI SUMMIT 2025」で発表し、Genieは2024年の同イベントでアナウンスされた製品だ。両製品に関しては、データブリックス・ジャパン フィールドエンジニアリング本部長の佐藤聖規氏が説明に立った。
佐藤氏は、現状の課題認識として「従来型のDBはセットアップやスケーリング、複雑なアクセスパターン対応に課題があった。また、AIエージェントの普及でステートレス化、サーバレス化、自律的データアクセスが進み、従来型DBの課題が顕在化している」との見立てだ。
Lakebaseは、Databricksが2025年5月に買収を発表したサーバレスPostgresプロバイダーであるNeonの技術が基盤で、同社のLakehouse上で動作するトランザクションデータベース。同氏は「AI時代に特化して設計された次世代のデータベース」と位置付けている。
従来、企業システムでは業務処理を担うトランザクションデータベース(OLTP)と、分析用途のデータ基盤(OLAP)が分断されており、データ連携や同期のために複雑なETL処理や別基盤の運用が必要とされてきた。
Lakebaseは、こうした構造的な分断の解消を狙い、ストレージ層とコンピュートを分離したアーキテクチャを採用。スケーラビリティと可用性を確保しながら、トランザクション処理と分析処理を単一のプラットフォーム上で統合することで、運用データと分析データをリアルタイムに近い形で連携させることが可能となる。
これにより、分離されていた業務アプリケーションとデータ分析、さらにはAIワークロードを一体的に扱えるようになるという。また、Neonの技術を取り込むことで、サーバーレス型のPostgreSQLとしてスケールアウトなどの機能を備え、開発から本番運用までの柔軟性を高めている。
現在、一部の日本企業が米国リージョンで利用しているが、今後は日本リージョンでの一般提供に向けて準備を進めている予定だ。
GenieとGenie Codeで広がるデータ活用
一方、Genieは自然言語で自然言語でデータに問い合わせ、分析結果を得られる対話型AIアシスタント。
これまで、データエンジニアやデータサイエンティスト中心だったDatabricksの活用を、ビジネス部門へ拡張する狙いがあり、企業のビジネス文脈を理解したうえで回答するAIだ。
組織内のガバナンスにもとづき、ユーザー権限に応じてデータへのアクセスが可能か判断するほか、スマートフォンからもアクセスでき、場所を問わずインサイト取得を可能としている。
また、2026年3月に発表した「Genie Code」は、データエンジニアリングや分析、機械学習向けに設計された自律型AI機能で、コード生成やパイプライン構築、ダッシュボード作成などを支援。
Genieがデータを使う側のための機能であるのに対し、Genie CodeはデータやAIを作る側のための機能となり、いずれも日本で一般提供を開始している。佐藤氏は「Genieは、ガバナンスを担保した状態でデータとAIの力をビジネス部門全体に波及させることができる」と強調していた。
Databricksが提示したのは、単なる製品群ではなく、データとAIを一体で扱う新たなアーキテクチャの方向性だ。従来、業務データと分析データは分断され、さらにAI活用も限定的だった。
しかし、Lakehouseを軸にLakebaseによるトランザクションと分析の統合、Genieによる利用層の拡張、Genie Codeによる開発の高度化が進むことで、企業全体でデータ活用を加速させる構図が見えてきた。日本企業が抱えるサイロ化の課題をどう乗り越えるか。Databricksの取り組みは、その1つの解となりそうだ。








