米DataRobotが5月11日、AIプラットフォームの最新版「DataRobot AI Platform 9.0」をリリースしたのは既報の通りだ。5月18日には、同社日本法人によるローンチイベントが開催された。

Keynoteでは、デモを交えた新機能の紹介などが行われたほか、今注目を集める生成AIを活用した取り組みについても言及された。本稿では、その模様をダイジェストでお届けする。

AIへの投資から“目に見える価値”を

登壇した米DataRobot CEO デバンジャン・サハ(Debanjan Saha)氏は、「今、AIは真の転換点にあると確信している」と声を強める。

「最近までAIは目新しい技術と見なされていました。MicrosoftやGoogleなどさまざまな大企業が数百億ドルを投じて、AIを使いやすく価値の高いものにしてきました。本番はこれからです」(サハ氏)

企業は、AIへの投資が目に見えるビジネス価値を生み出しているのかどうか、証明する必要に迫られている。だが、AIへの投資でビジネス目標を達成し、リターンを得るには、技術だけでなく「信頼できるパートナーとのコラボレーションが必要」だとサハ氏は語る。

「AIは新時代を迎えています。バリュードリブンAIの時代です」(サハ氏)

サハ氏曰く、同社が設立以来取り組んでいるのはAIへの投資から“目に見える価値”を生み出すことだ。「AIの可能性を大局的に捉えることで、企業の取引や人々の交流を改善できると考えている」としたサハ氏は、「(DataRobot AI Platform 9.0で搭載された)新機能は、いずれも極めて迅速に、目に見えるかたちでビジネス価値を実現する」と強調した。

本当に役に立つAIとは? 新版が重視した5つのポイント

では、バージョン9.0には具体的にどのような機能が実装されたのか。バトンはDataRobot バイスプレジデント、ジャパンAIエキスパートの小川幹雄氏に渡された。

DataRobotはもともと、「労力のかかる機械学習のモデル作成をいかに自動化するか」という「モデルドリブンAI」の概念からスタートしている。これが達成され、次はモデル作成に必要なデータの収集・作成に着目。「データドリブンAI」として、製品を進化させてきた。

だが、モデルを効率良く作成し、順調にデータを用意できたとしても、実業務において成果を挙げられているとは限らない。PoCの段階で頓挫するというのはよくある話だ。

「そこで私たちとしては、本当に業務で成果を出すためのAIを提供したいと考えました。それが、バリュードリブンAIです。バージョン9.0では、5つの大事なキートピックで製品を進化させています」(小川氏)

挙げられたキートピックは、以下の通りだ。

◆連携可能なモデル構築環境
◆拡大する業務適用における価値創出
◆確実なガバナンスとコンプライアンス
◆柔軟なエンタープライズエコシステム
◆豊富なAIベストプラクティス

「特に重要なポイントは、『MLモデル構築環境』と『MLモデル運用環境』です。MLモデル構築環境では、データの準備から、私たちがもともと強かった自動モデリングの機能、そのモデルの説明性を担保する機能までを提供しています」(小川氏)

一方、MLモデル運用環境では「モデル検証&ガバナンス」「柔軟なインテグレーション」「モニタリング/自動再学習」の3つを主要機能として提供する。

講演では、リードデータサイエンティストの鎌田啓輔氏とシニアデータサイエンティストの山本光穂氏により、MLモデル構築環境/MLモデル運用環境のデモが実施された。

MLモデル構築環境 - 新たなUIとチームによる開発を意識した新機能

AIの利用機会が増え、関係者が増えると使用するデータやモデルの管理に関する問題が生じ始める。たとえ担当者がそれらを把握していたとしても、異動や退職によって担当者が変わった際に引き継ぎが上手くできなかったりして、プロジェクトが中断してしまうケースは少なくない。「AIはチームプレー」だと蒲田氏は言う。

  • 鎌田啓輔氏

    DataRobot社 リードデータサイエンティスト 鎌田啓輔氏

DataRobot AI Platform 9.0では、モデル管理やチームのコラボレーションを円滑に行える新しいUIとして、「Workbench」が追加された。併せてDataRobot内でノートブック(DataRobot Notebooks)も利用可能となったため、GUIベースでもコードベースでも同じプラットフォームを使ってプロジェクトを進行できるという。

  • Workbench

    Workbenchのホーム画面

「従来のDataRobotはモデルごとの管理でしたが、Workbenchではユースケース単位で管理します。今ここで一つ一つ見えているのがユースケースに当たるのですが、最終更新日や、誰がアクセスできるのか、いくつデータセットがあるのか、いくつモデルがあるのかといったことを確認できます」(蒲田氏)

DataRobotの既存ユーザーからするとUIが大きく変わったと感じるかもしれないが、右上部の「DataRobot Classic」から従来のUIを利用することも可能となっている。

ユースケースをクリックすると、その中で使用されたデータセットやモデル、そしてノートブックも確認することができる。ユースケースはアクセス権限を設定した上で、まるごとチームメンバーで共有可能だ。

  • 共有

    共有範囲の設定画面

「デフォルトで全員に共有されることはなく、センシティブなユースケースは守りながら、コラボレーションを進めることができます」(蒲田氏)

また、ノートブックはマネージドサービスであるため、DataRobot内で実行することができる。計算リソースの調整も可能となっており、ビルトインのイメージも用意される。

「DataRobotの中で環境が構築されるので、Pythonを始めたばかりのチームメイトへの共有もスムーズに行えます。また、DataRobot Notebooksではよく使用するコードを『スニペット』と呼ばれるテンプレートのかたちで用意しているので、コーディング時間を大幅に削減可能です」(蒲田氏)

MLモデル運用環境 - 運用負荷を低減し、各種連携を強化

DataRobot AI Platform 9.0において、MLモデル運用環境にはGitHubアクションに代表されるようなモデルの検証、ガバナンス、モニタリング、CI/CD(Continuous Integration/Continuous Delivery)など、多くの機能が追加された。

山本氏はまず、継続的インテグレーションを実現する新しいGitHubアクションプラグインを紹介。プルリクエストの後に、データロボットのGitHubアクションが自動的にモデルを構築し、テスト、デプロイまでを実行するもので、後はモデルを公開するだけでガバナンスに配慮したモデルを運用できるという。

  • GitHub

    GitHubアクションプラグインのデモ画面

デプロイの概要にあるモデル情報からGitHubのコミットにリンクされているため、変更箇所を容易に把握可能だ。

  • GitHub

    デプロイ概要にあるモデル情報からGitHubのコミットへのリンクをたどることができる

また、9.0では、MLflowとの機能連携が実装された。

MLflowは、機械学習のライフサイクルを管理するオープンソースのプラットフォームだ。DataRobotで生成したモデルの学習情報や統計情報をMLflowに同期させることが可能となっている。

  • MLflow

    コマンドラインからMLflowを使ってトレーニングパラメータ、メトリクス、タグ、アーティファクトを可視化した様子

「MLflowに連携したモデル情報をDataRobot AIプラットフォーム内にインポートすれば、モデルのガバナンスが強化され、AIモデルの作成フローをより柔軟に運用することができます」(山本氏)

  • 山本光穂氏

    DataRobot社 シニアデータサイエンティスト 山本光穂氏

さらに9.0では、Snowflakeの内部にDataRobotで作成したモデルをデプロイ可能となった。デプロイしたモデルのパフォーマンスを監視し、入れ替えや再トレーニングを実施できる。Snowflakeのテーブルから過去の予測値や実測値を読み込んで、ドリフト精度やモデルのカスタムメトリクスを追跡することも可能だという。

  • Snowflake

    デプロイ先にSnowflakeを選択可能

「私たちはMLモデル運用環境を通じて、MLエンジニアリングチームの拡大、ビジネスリスクの低減、モデルのROIの追跡、データガバナンスの強化を支援していきます」(山本氏)