【レポート】

「データサイエンティストは業務時間の50%~80%をデータ整備に費やす」 - データマネジメントで肝心な3つのポイントとは

 

マイナビニュースが主催するビジネスセミナー「マイナビニュースフォーラム2014 Winter for データ活用」が、去る2014年12月9日に開催された。どのセッションも意義深く、盛況であったが、特にデータ活用ができる状態を維持管理するために検討すべきポイントについて取り上げた、リアライズ 情報活用ソリューション部 部長の櫻井崇氏による「特別公開!! データ分析を支えるデータマネジメントの秘訣」と題した講演を振り返ってみたいと思う。

昨今ではデータ活用が注目を集めているが、実際には「分析を行おうとしても保有データが扱える状態にない」「データの補正や整備にかなりの時間を取られる」といった課題を抱える企業は多い。

マスターデータの整備が不十分で分析できないケースが増加

株式会社リアライズ
情報活用ソリューション部
部長 櫻井崇氏

リアライズは、データマネジメントを通じて企業の情報活用を実現するプロフェッショナル集団だ。データマネジメントの方針策定からデータ整備、データ運用管理まで一連の支援サービスをトータルで提供しており、約700以上ものデータマネジメントプロジェクトの実績を誇っている。 「企業が保有するマスターデータの整備が不十分なために、データによる分析が行えないケースはよくあります。データは足腰が基本ですから、しっかりと鍛えていなければ上手く分析が行えません」と語る櫻井氏は、最初に"なぜデータマネジメントが必要なのか"という点から解説した。

データマネジメントによる適切な管理で信頼性・整合性を確保

たとえば上司から、新商品や新サービスの開発などに際して、役員会で報告するレポートの作成依頼があったとしよう。分析ツールを導入していない場合、まずはExcelやAccessなど身近なツールでレポート作成を行うことになる。しかし、いざ始めてみても肝心なデータの保存場所が見つからない、どのデータを見れば良いのか分からない、データに対するアクセス権がなかったので申請が必要になるといった、データを取り扱う上での課題が発生することは想像に難くない。 また、そもそも分析をしているデータの元となる数値が正しく計測できているのか、参照するデータが正しいのか、自信をもてないケースも多々ある。このように苦労しながらも仕上げたレポートを提出したところで、上司からの「この結果で利益が出るのか」という問いには、自分でも結論に自信が持てないため「おそらくは……」としか答えられないのではないだろうか。 櫻井氏は「こういう場合では、提案内容の良し悪しは勿論のこと、肝心な数字そのものに対して信憑性があることをしっかり説明できなければ、報告やプレゼンでもなかなか良い結果が得られないケースが多い」と語る。

なぜ信憑性を得られる数字を出せないのかという答えは、企業におけるシステムとマスターデータの変遷に起因することが多いと櫻井氏は強調する。 往々にして、古くから企業で利用されていたメインフレームではデータが一ヶ所に統合されており、格納場所が分かりやすかった。しかし、システム自体が重厚長大になりコストが増え、データ自体の修正に擁する時間が長くかかることなどの問題点を解消すべく、オープン化の波が到来。そこで、コンパクト化のニーズを満たすべく各種ノードやセッションが構築されはじめ、さまざまな場所からデータを収集する流れができた。 こうして誕生したシステムと数多くのツールによって、確かに企業の利便性は向上した。

だが一方で、データのキーとなるマスターデータが散在する可能性が高まり、いざデータを活用する際に、欲しい情報へのアクセスが相対的に難しくなったとも言える。 「せっかく利便性の高いシステムを構築しても、これまでデータの中身に着目してこなかった故に、結果として企業は思い通りにデータを扱えない状況に陥っています。」と、企業の現状を説明した上で櫻井氏は「"システムにその処理を任せるのに先立って、データを自らの手で整理していなければ正しい情報が得られない"ということにいつ気付くかが課題だったわけです。このような背景から、最近は散在するデータをひとつの統合マスターにしたい、と言った要望が多く寄せられています」と語る。 すなわち、企業内にあるデータを適切に管理し、信頼性・整合性を確保するためのデータマネジメントが今、求められているのである。

データマネジメントの実現に必要不可欠な3つのポイント「器/中身/組織・人材」

データマネジメントの実現に求められる根本的なポイントとして、櫻井氏は「器(モデル)/中身(データ)/組織・人材」の3つを挙げる。まず器は、データモデルやシステムなどのメタ構造をしっかりと押さえるのに必要不可欠な要素だ。そして中身については、本当に設計図通りにデータが入っているのか、ユーザーがどのように登録しているのか、といったデータそのものを詳らかに把握することが重要となる。 組織・人材は、良化した状況を継続するために必要な部分だ。一度データを整理しても、時間の経過とともにまた元に戻ってしまっては意味がない。携わる人材の運用スキルを上げ、企業の文化として落とし込まなければ、データマネジメントの継続性は担保できないのである。

Data Managementの考え方(リアライズ提供)

「弊社では人材のスキルアップはもちろん、モチベーションの維持など運用上で重要なファクターに関するプランニングを行っています。このプランニングと実践を二段階に分けて実施することで、継続的な運用に必要な組織・人材を育成することができます」と語る櫻井氏。改めて、「データマネジメントでは器と中身、そして組織・人材の3つを総合的に考えることが重要です」と強調した。

ここから櫻井氏は、実際に同社が手掛けたデータマネジメントの事例を紹介した。 大手ECサイト系サービスを展開する企業では、複数の開発ベンダーにて構築されたデータベースから、データ分析者が必要な情報を収集するため、調査と確認に多くの時間を費やしていた状況から、そのデータの定義情報を1ヶ所に集約することで、最適な分析環境の構築と集中管理を実現。また、分析のキーとなる主要コードの発番ルールが不明確だったため、各組織の独自ルールで発番していた状況も、組織間の運用フローやルールを整備することで、タイムリーで正確なデータ分析がしやすい環境を構築した。

金融系サービスの事例では、喫緊の課題とされていた、サービスデスクが処理する膨大な申請書の整備に着手した。こちらでは、申請書の中身を見てデータを比較し、同じものは統合していく作業と並行して、新たに統合したER図に基づいてデータを加えていく仕組みを構築。これにより効率化がもたらされ、従来は紙ベースでやりとりしていた書類についても、システム上で処理できるようになりデータを取り巻く環境が劇的に向上した。

櫻井氏は講演の締め括りとして"データサイエンティストは50%から80%の時間を、不正データの排除やデータの整備といった事前準備に費やしている(New York Times,Aug.18,2014)"といった世の中の状況を示唆した。そこで、本業であるデータ分析に専念できるよう、データの整備を行うこと、すなわちデータマネジメントの必要性について強調した。



転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

HPE、ミッションクリティカル用x86サーバ「Superdome X」の新製品
[11:08 8/31] 企業IT
『ガンダム 鉄血のオルフェンズ』第2期ワールドプレミア上映会開催決定
[11:00 8/31] ホビー
櫻井VS有吉『ゼウス』第3弾放送決定! ジャニーズ軍に新たに3グループ参戦
[11:00 8/31] エンタメ
俳優・松岡広大が語る"役者としての自分" - 同世代が多いからこそ刺激を受ける
[11:00 8/31] エンタメ
ゴミ収集車による環境データ収集する慶應大×藤沢市の取り組み
[11:00 8/31] 企業IT

求人情報