デジタルデータ活用の重要性が叫ばれる昨今、IT部門では日々不規則に生み出される大量のデータ管理に苦心している。一方、現場のビジネス部門もまた、思うようなデータが入手できず、十分なデータ活用が進まないという課題を抱えている。
本記事では、2018年7月27日 グランフロント大阪のマイナビルームにて開催された「マイナビニュースフォーラム 2018 Summer for データ活用」におけるTalendのセッション「データ統合の概念を壊す! ITを救い、データユーザーを躍動させるデータ統合とは」の内容を紹介し、そこで語られた現場の人々を悩ませるデータ統合のあり方と、その解決策について解説する。
デジタルプラットフォーム構築のコストと時間は、60%がデータ統合に費やされる
本セッションに登壇したのはTalendのプリセールスマネージャー 三浦 大洋氏である。米国に本社を構えるTalendは、クラウドを活用したデータ統合ソリューションを提供する企業である。同社が提供するオープンソースのソフトウェアには、全世界で4番目の規模をもつユーザーコミュニティが存在する。
まず三浦氏は、現在のデータ活用が抱える課題として、データ統合に費やされるコストと時間を挙げ、「現在の、企業におけるデジタルプラットフォーム構築において、コストと時間の60%がデータ統合に費やされています」と指摘した。
日々、社内外で多種多様なデータが大量に生み出されている。そして、データを活用したいと考えるビジネスユーザーが、毎日のようにIT部門が構築したシステムにアクセスする。しかし、そこにあるデータが共通したツールで作成されたものではないため、誰もが自由に利用できる状況にはなっていない。
IT部門とビジネス部門の“共通語”が必要
さらに、ビジネス部門から「こんなデータがほしい」とIT部門に依頼してもデータに対する共通語が存在しないため、痒いところに手が届かない、扱いづらいデータが提供されてしまう。
そのような課題が積み重なると、業を煮やしたビジネスユーザーはExcelなどを使って「自分の手でデータを加工しようとする」。しかし、ガバナンスが効いていない状態で、各自によるデータ加工が横行してしまうと、出所不明のデータが散在してしまうことになる。どのデータが最新で、どのデータが正しいのか、それすらわからない。そもそも、誰が何のデータを使って、何を分析しているのもわからない。そんな状況に陥ってしまう。
「もしかすると、隣の人が優秀な分析を導き出しているかもしれません。ですが、誰が何をやっているかわからないような状況だと、その優秀な分析を他の誰も活用することはできなくなります。データ活用の観点からも、非常に効率が悪い状態です。このような問題を解消するためには、IT部門とビジネス部門が共通語でコラボレーションできる環境が必要なのです」
データ統合プラットフォームに必要な構成
三浦氏は、「多種多様なデータが増え続ける現在の状況において、データ活用を進めるためには、5つ要素で構成されるデータ統合プラットフォームが必要」と語る。
5つの構成要素とは、以下のとおりだ。
1.データを取り出して貯めるための仕組みである「データ統合基盤」
2.(DWHやデーレイクなどの)適切なプラットフォームにデータを貯める「データ蓄積基盤」
3.他のシステムと連携してデータのやり取りをする「システム連携」
4.ビジネスユーザーがデータを扱いやすくする仕組みである「セルフサービス」
5.データを正しく管理する「データガバナンス」
そしてTalendでは、これらを単一のプラットフォームで開発するためのソリューションを提供している。
なお当日のセッションでは、「IT部門とビジネス部門のコラボレーション」をテーマに、特に「データ統合基盤」と「セルフサービス」についての紹介が行われた。
Talendが提供するデータ統合基盤「Talend Data Fabric」には、1,100を超える機能別部品が備わっている。これらをGUIによる直感的な操作でアイコンをつなぎ合わせて、データ統合のアプリケーションを作成していく。
三浦氏によると、このGUIを用いた開発ではETLやデータクレンジングなど、データ統合基盤に必要な処理を実行する場合、ハンドコーディングと比較して5倍から10倍の生産性が期待できるそうだ。
一方、セルフサービスにおいて、当日のセッションでは「Talend Data Preparation」にスポットライトを当て、具体的なデモが実施された。実際の動作についてはこちらの動画でも紹介されているので参考にしていただきたい。
Talendが実現するIT部門とビジネスユーザーのコラボレーション
「Talend Data Preparation」においては、特に注目される機能がある。それが「レシピ」の保存である。例えば、ビジネスユーザーA氏が分析に必要なデータプレパレーションを行い、その手順をレシピとして保存する。もしA氏の実行したレシピが優れていて、汎用性があれば、A氏以外のビジネスユーザーもそのレシピを利用することができ、組織としての効率化を進めることができる。そしてもし、組織のなかの100人がそのレシピを定期的に利用しているのであれば、レシピを利用するという作業そのものを自動化し、さらに効率化を高めることができる。具体的には、IT部門で定期実行するためのバッチ処理を自動作成する機能を使って実現する。
「IT部門が新たなバッチ処理を作成する場合、これまでの手順であれば、まず現場からヒアリングをして、要件定義を行い、その上でバッチ処理を開発することになります。ですが、このレシピを参考にすれば、よく使われているレシピを参考にするだけでいいので、ヒアリングも要件定義も必要ありません。このようなIT部門とビジネス部門のコラボレーションによる次世代型の統合開発を実行すれば、前述したデータ統合に費やされていた60%のコストと時間が、大幅に削減できるはずです」(三浦氏)
属人化されたデータ使用方式からデータ統合プラットフォームに移行することで実現する「次世代型統合開発」の有効性を訴え、三浦氏のセッションは幕を閉じた。
[PR]提供:Talend