ガートナー ジャパンは3月15~16日、「エンタプライズ・アプリケーション戦略 & アプリケーション・アーキテクチャ サミット」を開催した。本稿では、ガートナー ジャパン リサーチ 主席アナリストの一志達也氏が「ビジネスに貢献するデータ活用のために、理解しておきたい10のトレンド」と題して行った講演の内容をレポートする。

データ活用の「3つのフェーズ」「3つの指標」

ガートナー ジャパン リサーチ 主席アナリストの一志達也氏

一志氏はまず、データ活用が注目される背景について「企業コンピューティングが始まって以来、データ活用の取り組みはずっと続けられてきました。ビッグデータが登場してから少し変わったのは、業務システムに蓄えられたデータ以外に使うことができるデータが大きく広がったことです。また多種多量なデータを扱う方法、活用の手段が増えました。この2つの軸が大きく影響しています」と紹介した。

講演タイトルにある「10のトレンド」とは、この2軸のうちデータを活用する手段・方法に関するものであり、ガートナーが提供している「ハイプサイクル」のなかでも評価されている。

各トレンドは、「蓄積」「処理」「活用」というデータ活用の3つのフェーズに分けて考えることができる。

蓄積には「マルチモデルDBMS」「ブロックチェーン」「クラウド・オブジェクト・ストアへのSQL」「Hadoopの進化と変化」という4つのトレンドがある。また、処理には「In-DBMSアナリティクス」「HTAP」「自然言語クエリ」の3つ、活用には「市民データ・サイエンス」「オープン・データ/データ取引市場」「アルゴリズム・ビジネス」の3つがあるといった具合だ。

ガートナーではこれらを「貢献度」「難易度」「切迫度」という指標で4段階評価し、企業での活用の参考にできるようにしている。

各トレンドの評価指標/出典:ガートナー(2018年3月)

一志氏は、10のトレンドを示すと共に、その評価と合わせて順に解説していった。

1つ目の「マルチモデルDBMS」(貢献度2、難易度1、切迫度3)は、リレーショナル型や列志向型、KVS、ドキュメント、グラフなど複数のデータモデルを一元的に管理できるDBMSだ。今後、急速に市場に広がって普及することが見込まれるが、新興のNoSQLデータベースのベンダーはメガベンダーに淘汰される可能性もある。そのため「アプリケーションやユースケースに適したデータモデルを選定する必要があります。例えば、IoTやモバイルアプリなどには、スキーマレスのNoSQLが望まれます」(一志氏)という。

2つ目の「ブロックチェーン」(貢献度4、難易度4、切迫度2)の特徴は、中央集権的でないことや、信頼できない環境に信頼性を付与することにある。ただ「ブロックチェーン・イニシアティブの90%は失敗すると言われています。それは、成熟度が不十分で技術的な課題が多く、適用領域が限られているからです。現在、構築した環境の寿命は2年程度と考えられています」と一志氏。

とは言え、既存業務で活用できる機会を逃さないようにすることも欠かせない。その際には「信用を付加することに価値があるところへの適用を検討する」「価値の移動にコストのかかる領域への適用を検討する」ことが重要だ。

3つ目の「クラウド・オブジェクト・ストアへのSQL」(貢献度2、難易度1、切迫度3)は、Amazon S3などにオブジェクトストレージに保存したデータにSQLを発行する技術だ。これにより、大量のデータを安価に格納できるだけでなく、さまざまな方法でシームレスに処理できるようになる。進化のスピードが速く、それらを好きなときにだけ使えることは企業ITにも大きなメリットだという。

「まずは、コールドデータのアーカイブなど、手間をかけずにSQLで処理したいものに使ってみることです。使い方や利便性、制限事項を学ぶことが大事です。もちろん、データの保管や転送にかかる料金には注意する必要があります」(一志氏)

4つ目の「Hadoopの進化と変化」(貢献度2、難易度3、切迫度4)とは、SQLへの対応やストリーム処理への対応など、Hadoopが企業ITに欠かせなくなることを示したものだ。分散ストレージと分散処理フレームワークは、今後も企業のデータ処理に不可欠であり、それらはクラウドを活用することでますます発展する。

一志氏は、「Hadoopは最初に話題になったころと比べて大きく変化しています。HDFSやMapReduce、Javaが必須ではなくなり、開発も簡単になっています。今後は、ストリーム処理やDWHと組み合わせて、業務での活用方法を検討することが求められます」と説明し、その一例として大量データのアーカイブや分散バッチ処理、IoTのストリーム処理のストレージなどを示した。