「ビッグデータ」はどこから"ビッグ"?(前編)

【連載】

情シスドタバタトリオが行く! ITワード調査隊

【第1回】「ビッグデータ」はどこから"ビッグ"?(前編)

[2016/03/24 09:00]岡大勝 ブックマーク ブックマーク

ソリューション

ここは、中堅出版社マイマイ出版の情報システム部。部長以下7名で会社のシステムの企画・開発・運用・保守を行っています。開発と保守は外部ベンダーにほぼお願いしているので、社員は企画~案件立ち上げと運用が主な役割です。 新しい技術はできるだけキャッチアップして活用していきたいけれど、既存システムの対応でみんな正直手一杯。IT用語の正しい意味なんて考えるヒマもないまま、日々の業務をこなしています。

そんな情報システム部に2016年4月、関連会社に出向していたまさこさんが、出向先で飼われていたハムスターのハナちゃんを連れて、5年ぶりに戻ってきました。

主な登場人物

まさこさん:出向先から5年ぶりに情報システム部に戻ってきたが、ここ5年間のIT動向についていけなくて困っている。何事もはっきり白黒つけないと気が済まない江戸っ子気質。

星先輩:どんなに忙しくても頼まれると嫌とは言えない性格。面倒見がよくて情シスの皆から頼られる存在。その場の思いつきで、適当なことを言ってしまうのが玉にキズ。

ハナちゃん:まさこさんの出向先で飼われていたハムスター。出向先企業が買収されて職場で飼えなくなり、まさこさんが引き取ってきた。とてもかわいがってくれていた出入りのITコンサルタントの知識を吸収し、いつの間にかスーパーITハムスターとして成長していたことを、まだ誰も知らない。

基準は「俺のPC」?!

あーあ、ベンダーさんの提案を聞いてたら、またよくわかんないこと言われたわ。「御社クライアントの情報をビッグデータとして分析し……」ですって。要するにビッグデータって、通常のシステムでは処理しきれないくらい大量なデータのことでしょ? 一体どこからビッグになるのかしら。うちのお客さんの情報って、そんなにビッグな感じはしないんだけどなー。先輩、知ってます?

無粋な質問をするねえ。「ビッグ」って敬意を表すときに使う言葉だからな。人間ではかなわないと思った時に、「ビッグデータ」になるんだ。俺のPCのExcelで開けなくなったら、もう”ビッグデータさん”って呼んでいいと思うよ。

もう、先輩のボロPCが基準じゃ、世の中のデータは全部”ビッグデータさん”になっちゃいます! ちゃんと教えてくださいよ。

ゴメンゴメン! 俺の知識を総動員しても、厳密にコレという定義はなかったと思うんだ。でも何せビッグだから、全社データを集約するようなケースが該当するんじゃないかな。分析系で使われることがほとんどで、どちらかというと経営者が喜ぶやつっていうイメージだよ。

何か、適当にそれっぽいこと言ってまとめようとしてません? まあ、私もそんな感覚なんですけど、これだけいろんなところで「ビッグデータ」って言ってるんだから、基準とか標準とか、ルールってものがあってもいいと思うんですよね。IT業界なんだから、その辺きっちりしてほしいんですよ、きっちり。

そう言われてみれば、そうだよなあ。普通のデータがどうやったら「ビッグデータ」になるんだろ。DWHもたくさんデータを突っ込むものだけど、あれもビッグデータなのかな?

まさこさん、まさこさん、また星先輩と不毛な議論をしてるんですか。業界での統一された基準とは言えないまでも、一応「ビッグデータ」の定義はあるんデスよ。抽象的なので理解しにくいんですが、ガートナーが提言したもので、通称「3V」というものデス。

Big data is high-volume, high-velocity and/or high-variety information assets that demand cost-effective, innovative forms of information processing that enable enhanced insight, decision making, and process automation.

意訳すると、「ビッグデータとは、大量(High-Volume)・高い流速(High-Velocity)・多様性(High-Variety)のいずれか、もしくは全てを備えた情報資産であり、費用対効果の高い革新的な処理方式を用いることで、より深い洞察や意思決定、それらのプロセスの自動化を可能とする」みたいな感じデス。

うん、ぜんぜん意味わかんない。

この定義のポイントは、「革新的な処理方式」の部分デス。”他の普通のデータと同じ処理方式では扱いきれない”データを「ビッグデータ」と呼ぼう! と言っているわけデス。

お! 俺のExcel説が急浮上!

ってことは、うちの会社に置き換えると、案件管理とか会計とか普通のシステムにはOracleとかSQL ServerなんかのRDBが使われてるわね。ビッグデータは、RDBじゃ扱いきれない量のデータ、って理解でいいのかしら。

そう、少し前まではその理解で良かったんでス。RDBは万能でとても扱いやすいんでスが、データの量や特性、例えば為替データやTwitterフィードみたいにレコード長の割にキー値が大きいデータ(これを細かい粒度のデータっていいまス)が、1日に数千万件蓄積されるようなデータを扱おうとすると、RDBのトランザクション管理やそれに伴うインデックス構築の仕組みでは負担が大きすぎて、必要な性能が出なくなってしまいマス。

なるほど、そこで「革新的な処理方式」が出てくるわけね。でも、ちょっと待って?

(後編に続く)

※ 本記事は掲載時点の情報であり、最新のものとは異なる場合がございます。予めご了承ください。

一覧はこちら

連載目次

もっと知りたい!こちらもオススメ

【レポート】日本の製造業は、IoTでどう変わるのか? 先進企業の取り組みに見る、ものづくりの未来

【レポート】日本の製造業は、IoTでどう変わるのか? 先進企業の取り組みに見る、ものづくりの未来

日本の製造業に、IoTはどのように関わってくるのか――東洋ビジネスエンジニアリングが開催する年次イベント「MCFrame Day 2016」の今年のテーマは「―『ITと現場』の真の融合―」だ。

関連リンク

この記事に興味を持ったら"いいね!"を Click
Facebook で IT Search+ の人気記事をお届けします

会員登録(無料)

注目の特集/連載
[解説動画] Googleアナリティクス分析&活用講座 - Webサイト改善の正しい考え方
[解説動画] 個人の業務効率化術 - 短時間集中はこうして作る
ミッションステートメント
教えてカナコさん! これならわかるAI入門
知りたい! カナコさん 皆で話そうAIのコト
対話システムをつくろう! Python超入門
Kubernetes入門
AWSで作るクラウドネイティブアプリケーションの基本
PowerShell Core入門
徹底研究! ハイブリッドクラウド
マイナビニュース スペシャルセミナー 講演レポート/当日講演資料 まとめ
セキュリティアワード特設ページ

一覧はこちら

今注目のIT用語の意味を事典でチェック!

一覧はこちら

ページの先頭に戻る