日本テラデータは8月2日、オンラインとオフラインのハイブリッドにより、国内におけるビジネス、製品戦略、AI/ML(機械学習)のアップデートに関する記者説明会を開催した。

生成AIはデータ活用を推進する起爆剤

冒頭、日本テラデータ 代表取締役社長の高橋倫二氏は同社がIDCに委託して実施した生成AIの可能性に関する調査結果について触れた。

  • 日本テラデータ 代表取締役社長の高橋倫二氏

    日本テラデータ 代表取締役社長の高橋倫二氏

これによると、グローバルにおける経営層の900人のうち、80%が生成AIをサービスや業務に取り入れることに興味を示していることが分かった。一方、86%はデータやモデルのガバナンスに取り組む必要あると回答し、66%が偏見、偽情報などのリスクがあると答えたという。

  • 経営層の900人のうち、80%が生成AIをサービスや業務に取り入れることに興味を示しているという

    経営層の900人のうち、80%が生成AIをサービスや業務に取り入れることに興味を示しているという

高橋氏は「生成AIをいかに管理して活用方法を確立できるかが、生成AIからビジネス成果を獲得するための鍵になる。生成AIはデータ活用を推進する起爆剤になる可能性を秘めている。そのため、当社はデータを管理するとともに、信頼できるAIをPoC(概念実証)だけでなく、本番運用できるデータ基盤として『Teradata VantageCloud』を提供し、最新のAI/MLを活用できるように、他社のツールやサービスとシームレスに連携を可能としている」と述べた。

同氏によると、2023年上半期の国内ビジネスは引き続き好調となり、既存システムのクラウド化や既存顧客の新規システム受注、新顧客の獲得などが寄与しているようだ。

同氏は「特にリカーリングレベニュー(繰延収益)は2桁成長しており、すでに当社の半数のお客さまはオンプレミスからクラウドに移行しており、今後も順次移行してもらうことを期待している。単に、クラウドに移行するだけでなく、大手製造業のお客さまでデータ基盤案件を受注している」と説明した。

  • 2023年上半期における国内ビジネスのハイライト

    2023年上半期における国内ビジネスのハイライト

Teradata VantageCloudが持つ6つの技術的特徴

続いて、日本テラデータ テクノロジーセールス事業部 事業部長の小永井崇氏が製品アップデートを解説した。同氏は、Teradata VantageCloudが採用されている背景について「大規模かつ複雑な分析を高速に処理することができるデータベースとして、認知されているからだ」と話す。

  • 日本テラデータ テクノロジーセールス事業部 事業部長の小永井崇氏

    日本テラデータ テクノロジーセールス事業部 事業部長の小永井崇氏

その技術的な特徴として「並列処理アーキテクチャ」「コストベースオプティマイザ」「圧縮機能」「インメモリ処理」「アドバンスド・インデックス」「ワークロードマネジメント」の6点を挙げている。

並列処理アーキテクチャは同社のDNAでもあり、エンドツーエンドですべてのステップを完全に並列処理できる。コストベースオプティマイザは複雑な分析やアドホックで非定型な分析でもデータのデモグラフィックな情報をもとに最短のアクセス経路を導き出し、高速にアクセスすることが可能。

圧縮機能はデータベースのI/O処理を改善し、インメモリ処理ではアクセス頻度の高いデータをメモリ上に配置して高速処理を行う。アドバンスト・インデックスはデータを複数に分割して格納することが可能なパーティショニングなどを実現し、ワークロードマネジメントはビジネス要件に合わせた形でシステムリソースを最適に配置することができる。

最近では、データサイエンティスや開発者による新たな分析ワークロードへの対応や、レイクハウスによるデータプラットフォームのモダナイゼーション、アジリティに必要なUX(ユーザー体験)の強化、増加する各種データの取り込み・アクセス課題への対応、予算超過リスクの低減などに取り組んでいる。

  • 日本テラデータにおける製品戦略の概要

    日本テラデータにおける製品戦略の概要

一例として、クラウド上でデータソリューションを構築する際にデータ&アナリティクスのコミュニティが一般的に使用するツールセットであるモダンデータスタックとTeradata Vantageを統合している。

具体的にはdbt、Airbyte、Mulesoftに対してネイティブコネクトをリリースし、データ連携を強化。これにより、価値実現までの時間短縮や効率的なワークフロー作成、開発者がイノベーションに費やす時間の最大化に貢献するという。

  • 日本テラデータにおける製品戦略の概要

    日本テラデータにおける製品戦略の概要

また「Teradata Vantage コネクテッド・データストア」は、あらゆるファイルフォーマットやテーブルフォーマットに対応し、各種データへの迅速なアクセスを提供するとともに、データの種類、ボリューム、アクセス頻度、SLA(Service Level Agreement)に応じて、最適なデータストアを使い分けることが可能。

直近の新機能として、Databricksが提供する既存のデータレイクファイルストレージ上に設置されるオープンソースストレージレイヤ「Delta Lake」や「Apache Iceberg」をサポートしている。

  • 「Teradata Vantage コネクテッド・データストア」の概要

    「Teradata Vantage コネクテッド・データストア」の概要

さらに、UXの強化と予算超過リスクの低減に関しては「Teradata VantageCloud Lake Console」で対応する。同コンソールは、部門別の消費量表示とチャージバック、クエリパフォーマンス最適化機能、クエリ多重実効性でコスト超過の抑制ができると同時に、支出パターンにもとづく予測機能、異常コスト検出機能を備えている。

  • 「Teradata VantageCloud Lake Console」の概要

    「Teradata VantageCloud Lake Console」の概要

PoCで止まることなく、本番運用まで可能にするAI/ML

次に、日本テラデータ セールスアナリティクススペシャリストの森浩太氏がAI/ML製品・ソリューションのアップデートを説明した。

  • 日本テラデータ セールスアナリティクススペシャリストの森浩太氏

    日本テラデータ セールスアナリティクススペシャリストの森浩太氏

森氏は「AI/MLの浸透により、さまざまな企業でデータサイエンスチームの設置やプロジェクトを開始しているが、PoCで一定の成果は上がるものの本番運用に大きな課題を抱えており、成果につながらないことが多い。これはアルゴリズムとデータの連携やSLAの応答レベル、システム監視などが必要になり、PoCと本番環境では異なる業務負荷が存在しているからだ」との認識を示した。

続けて、同氏は「こうした課題に対し同社はフォーカスしており、PoCで止まることなくシステム化して運用するところまでをエンドツーエンドで実現させるソリューションを提供している」と力を込める。

同氏によると、機械学習のアルゴルリズムをシステム化し、運用していく観点で重要になるものが“データの流れ”であり、データを計算資源のあるところで計算させるのではなく、計算資源を有するデータベースで計算することが望ましいとのことだ。PoC段階でよくあるパータンは前者となり、データをソースから引っ張り別の計算環境で実験的に行っているとのことだ。

森氏は「1回のみのPoCであれば問題ないが、データの移動が繰り返し行われると大きな非効率性の原因になる。例えば、データの移動そのものに時間がかかるほか、計算資源が必ずしもデータベースと比べて大きくないため、すべてのデータを移動しても分析処理が困難になる。また、複数の環境でデータが利用されればセキュリティリスクがある」と説く。

そこで、同社が本番運用で推奨している手法として、データがある場所で計算を行う「In-Database アナリティクス」だ。同氏は「データにある計算資源を使うことで、データの移動コスト削減や速度向上、セキュリティリスクの最小化が図れ、AI/MLを本番運用する際には必須の考え方」と強調した。

  • 「In-Database アナリティクス」の概要

    「In-Database アナリティクス」の概要

In-Database アナリティクスを実現するために、同社のプラットフォームは専用ソフトでしかできなかった統計的な分析や機械学習のアルゴリズムをデータベース内で処理できるように最適化された分析関数を備えている。

これに加え、PythonやRなどの機械学習で使用する言語、Apach Spark、Jupyter、R Studio、Azure Machine Learningといったパートナーツールとも統合し、外部で構築された学習モデルでもIn-Database アナリティクスの一部として利用することができるため、大規模な本番運用に耐えうる構成を可能としている。

加えて、機械学習モデルのデプロイメントにあたり、同社ではモデルやアルゴリズム自体もデータの一部として管理し、作成したモデルのデプロイを簡素化しているという。

  • Teradataが提供するMLスタックの概要

    Teradataが提供するMLスタックの概要

データ活用における現場の課題とは

最後に「Teradata Partner Award 2023」において「Partner of the Year」を受賞したNTTデータからDT事業本部デジタルテクノロジー&データマネジメントユニット データマネジメントプラットフォームグループ シニアITスペシャリスト(データベース)の丹羽利治氏が登壇し、DXによる課題について語られた。

  • NTTデータ DT事業本部デジタルテクノロジー&データマネジメントユニット データマネジメントプラットフォームグループ シニアITスペシャリスト(データベース)の丹羽利治氏

    NTTデータ DT事業本部デジタルテクノロジー&データマネジメントユニット データマネジメントプラットフォームグループ シニアITスペシャリスト(データベース)の丹羽利治氏

NTTデータでは、企業のデータドリブンカンパニーへの変革をサポートを掲げ、データ&アナリティクス領域においてデジタルサクセスに向けて「デジタル時代の戦略・事業・業務(ビジネス)」「デジタル変革を推進する人財・組織(人財・組織)」「データ整備と可視化・分析(データ・アナリティクス)」「データ活用を支えるシステム・ツールの整備(IT・Tech)」の4つの側面から支援している。

  • NTTデータにおける取り組み

    NTTデータにおける取り組み

丹羽氏は「データ活用やデータマネジメントプラットフォームの提供だけで終わりではなく、ビジネス価値があるのかということが問われている。ビジネス価値を生み出すためには継続的な価値向上の取り組みが必要となる。当社ではValue Engineering手法を提唱しており、これはビジネス価値との関係性を明確化し、成果創出に必要な施策を導入・実施・モニタリングを行うというものだ」と説明した。

ただ、一方で近年におけるデータ活用の現場の状況として、同氏はデータをすぐに使いたいというニーズからデータを一元的に管理している点に加え、データを活用する部門が従来はシステム部門だったが業務部門主導に変化し、同一プラットフォーム上での複数部門・業務で利用するためサーバリソースの分離が必要だと指摘する。

そして、日本ではレポートは中心だが、海外ではAIなどを利用した高度な分析となっており、海外の状況をふまえてプラットフォーム上で高度な分析機能の提供が必要だという。

こうした状況を鑑みて丹羽氏は「クラウド分析プラットフォームのVantageCloud Lakeであれば、コンピュートのリソース分離や無限のスケールアウトが可能で、従量課金制で利用できる。さらに、分析機能の『ClearScape Analytics』はアナリティクス環境を提供可能だ」と話す。

  • データ活用の現場に対してTeradataのプラットフォームは有用だという

    データ活用の現場に対してTeradataのプラットフォームは有用だという

NTTデータでは、データ活用製品として「Trusted Data Foundation」を提供しており、同製品を構成するソリューションベースドSIの一部にTeradataのプラットフォームが組み込まれている。

同氏はTeradataのプラットフォームについて「高い安定性と信頼性、パフォーマンスを有している。オンプレミスとクラウドの両方で提供できることからマイグレーションが容易であり、高度な分析ツールを提供している」と、そのメリットについて言及していた。