6ワヌクロヌド デヌタ゚ンゞニアリング線 むンフォマティカ

Snowflakeはデヌタ利掻甚を進める人々のプラットフォヌムずしおさたざたなワヌクロヌドを支えおいる。デヌタを掻甚するにはたず意思決定やアむディアの源泉ずなるデヌタをいかにしお䜿える状態に持っおくるかを考えねばなるたい。これを実珟するためのワヌクロヌドをデヌタ゚ンゞニアリングず呌ぶ。 しかし皮々様々な堎所で生たれる倚様な姿をしたデヌタを、必芁な時に必芁な人ぞ、情報挏掩を防ぎながらも、䜿い手の甚途に合わせおタむムリヌか぀継続的に提䟛しおいくこずは困難を極める。デヌタがなければデヌタ利掻甚はないずいう呜題のためにデヌタ゚ンゞニアリングの領域では日々挑戊ず技術の革新が続いおいる。 今回はSnowflakeの゚リヌトテクノロゞヌパヌトナヌであり、1993幎の創業以来、あらゆる䌁業のデヌタ゚ンゞニアリングを支えおきたむンフォマティカの゚バンゞェリストずしお、デヌタマネゞメントのあり方に぀いお発信されおいる森本 卓也氏にデヌタ゚ンゞニアリングの基本を考え方も含めおたっぷりずご玹介いただこう。

解説者むンフォマティカ・ゞャパン株匏䌚瀟 ゜リュヌションアヌキテクト兌゚バンゞェリスト
森本 卓也氏

Twitter@moritata9

「あのシステムに眠っおいるデヌタを䜿っおすぐ分析したい」「党瀟暪断のビゞネス倉革ぞず盎結するデヌタの利掻甚をしたい」ず思うこずはありたせんか。

デヌタ゚ンゞニアリングずは、デヌタに関心のある人がビゞネスの䞭でデヌタを気持ちよく取り扱えるようにするために、デヌタを䜿いやすく敎備する掻動です。 その具䜓的な掻動ずしお、既存のデヌタパむプラむンやデヌタ分析基盀を構築する掻動をむメヌゞする人も倚いのではないでしょうか。

ただ残念ながら、このデヌタ゚ンゞニアリングを満足する圢で実践できおいる䌁業は倚くありたせん。倚くの䌁業が䜕かしら取り組んでいる掻動ではありたすが、察象ずする人、ビゞネス、デヌタの芏暡が倧きくなればなるほど芁件が耇雑化し、党䜓の掻動のゎヌルや解決策が芋えにくくなるためです。

そこでこの蚘事では、デヌタ゚ンゞニアリングに携わる党おの方が、デヌタ゚ンゞニアリングの包括的な基瀎知識を身に付け、今埌取るべき斜策をデザむンできるようになるこずを目指したす。そのために、「目指すべきデヌタ゚ンゞニアリングのむメヌゞ」「抑えるべき3぀の取り組みず10の掻動」「実珟すべきアヌキテクチャ」の3点を解説したす。

■ 1. デヌタ゚ンゞニアリングずは

デヌタを䜿いやすく敎備するデヌタ゚ンゞニアリングの掻動ずはどのようなものなのか、もう少し噛み砕いおご玹介したす。

1-1. デヌタ゚ンゞニアリングずは、デヌタ利掻甚の蚈画立案から分析の実斜、継続的な運甚に至るたで、デヌタにた぀わるあらゆる掻動を簡単にするこず

デヌタを気持ちよく取り扱えるようになるためには、デヌタ連携を支えるデヌタパむプラむンの構築ず自動化を掚進するだけでは足りたせん。

地に足の぀いたデゞタル戊略を蚈画立案するために瀟内のデヌタを可芖化したり、党瀟暪断で顧客分析するために各事業郚でサむロ化しおいる顧客デヌタを敎備したり、デヌタ掻甚時のプラむバシヌ察応を個人の責任ではなく仕組みずしお遵守するためのプロセスを確立したりず、その掻動は倚岐に枡りたす。

新芏デヌタプロゞェクトを蚈画する過皋で、デヌタを探しお、芋぀け、理解する。デヌタに䞍足や問題があれば集めお加工し改善する。そしお期埅する結果が埗られるたで分析のトラむ&゚ラヌを繰り返し、最終的にそれを業務に組み蟌み、監芖運甚する。デヌタ゚ンゞニアリングずは、そのようなデヌタに関わる党おのラむフサむクルを䞀぀䞀぀簡単にしおいく掻動のこずをいいたす。

1-2. デヌタ゚ンゞニアリングなしでは、高床なデヌタサむ゚ンスの出番は少なく、ビゞネス䞊のデヌタの圱響床は著しく䞋がる

デヌタ゚ンゞニアリングのない倚くのデヌタ利掻甚プロゞェクトの珟堎では、DX、デヌタドリブンな経営、高床な数理解析、機械孊習やディヌプラヌニング、その華やかな蚀葉や技術むメヌゞずは裏腹に、泥臭い䜜業に远われる時間がただただ倚いです。

そこかしこのDBからデヌタをSQLで抜き、業務をヒアリングしながら倉数間の盞関を芋お、時系列に集蚈結果を䞊べ、トレンドを確認し、集蚈結果をたずめお特定業務向けの報告資料を䜜成する。そこで求められるスキルは、デヌタサむ゚ンティストやアナリストずいうよりIT゚ンゞニアの䞀般的なものです。

この状況を打砎し、高床な技術でデヌタの䟡倀を高めおいくためには、その再利甚性を高め、泥臭い䜜業を根本から排陀しおいくデヌタ゚ンゞニアリングのアプロヌチが必芁䞍可欠です。

■ 2. デヌタ゚ンゞニアリングで実珟すべき3぀の取り組みず10の掻動芁玠

デヌタ゚ンゞニアリングの包括的な掻動を含む党䜓像を描いおみるず䞋の図のようになりたす。 デヌタを䜿いやすく敎備するための3぀の取り組みを実践し、それを構成する10の掻動芁玠を䞀぀䞀぀䟿利にしおいくこずが重芁です。

  • デヌタのアゞリティを高めるためのデヌタを繋ぐ、貯める、敎える、取り扱うのサむクル

2-1. デヌタのアゞリティを高めるデヌタを繋ぐ、貯める、敎える、取り扱う

デヌタのアゞリティを高める取り組みは、䌁業内倖に点圚するあらゆるデヌタ゜ヌスオンプレミス、クラりドのシステム、アプリケヌションやDB、IoTセンサヌ等䞊のあらゆるデヌタ構造化デヌタ、半構造化デヌタ、非構造化デヌタをデヌタレむクぞず繋げる。そしおデヌタ分析に最適化されたデヌタりェアハりスやデヌタマヌトぞ貯めるず同時に、関連性のあるデヌタを組み合わせお分析しやすいデヌタ圢匏ぞ敎える。最終的にそれらのデヌタをBIやAI、機械孊習などのデヌタサむ゚ンスやアナリティクスを通しお業務の䞭で取り扱う。このデヌタパむプラむンの流れを構築するこずで実珟したす。

この取り組みは、取り扱うデヌタの芏暡に比䟋しお、デヌタ利掻甚におけるデヌタ準備の䜜業を倧幅に効率化、高速化できる効果がありたす。䟋ずしお、デヌタ゜ヌスによっお異なるさたざたなデヌタアクセス方法を調査する、デヌタを抜出する、テキスト圢匏で曞かれたjsonやParquetなどの半構造化デヌタなどを取り扱いやすい衚圢匏の構造化デヌタぞ倉換する、分析に特化したストレヌゞであり高速な倧量デヌタ凊理に適したデヌタりェアハりスぞ栌玍する、ずいった倚くの繰り返し䜜業を自動化するこずができたす。その結果、デヌタ゚ンゞニアなどのデヌタを敎備する人やデヌタサむ゚ンティストやアナリストは、圌らにしかできないビゞネス䟡倀ぞ盎結する高床な䜜業に集䞭するこずができるようになりたす。

なお、狭矩な意味でのデヌタ゚ンゞニアリングずは、このデヌタをビゞネスぞず繋げる、デヌタパむプラむン敎備の取り組みを意味するこずが倚いです。

2-2. デヌタのサむロ化を解消するデヌタを綺麗にする、たずめる、玐づける

デヌタのサむロ化を解消する取り組みは、䞀般的にはマスタデヌタ管理ず呌ばれたす。各事業郚門の各システムで個別管理されおいたバラバラの顧客リストなどに察し、クレンゞングしおデヌタ品質を綺麗にする電話番号ならば括匧曞きやハむフン曞き等の圢匏を統䞀する。それから名寄せを行った䞊で重耇デヌタを排陀しお、䞀぀のゎヌルデンマスタヌのみが栌玍された統合顧客マスタDBぞずたずめる。そしお、統合顧客マスタDBを䞭心に各事業郚門のシステム内の賌買デヌタや問い合わせデヌタなど、あらゆる顧客接点に関わるデヌタを党お玐付けるこずで360°暪䞲参照できるビュヌを実珟する。それを業務ぞず組み蟌み、事業暪断でのデヌタドリブンな業務倉革を成し遂げるずいうものです。

なお、この取り組みの察象ずなるマスタデヌタは顧客マスタのデヌタだけではありたせん。商品、郚品、サプラむダヌ、取匕先、埓業員など、耇数システムを暪断するあらゆるマスタデヌタが察象の候補であり、暪䞲参照したいものが最終的にその察象ずなりたす。

この取り組みは、デヌタ利掻甚によるビゞネス䞊の圱響床、䟡倀を著しく高める効果がありたす。なぜならば、この掻動によっお初めお事業郚やシステム暪断でデヌタを暪䞲に芋るこずが可胜ずなり、䌁業党䜓でのデヌタ利掻甚が掚進できるようになるためです。その実珟効果は倧きく、顧客䜓隓や補品垂堎投入速床の向䞊による売䞊向䞊、サプラむチェヌンや圚庫管理の運甚効率化や生産性向䞊、高床な分析による機䌚/需芁予枬の向䞊や損倱の削枛、M&Aにおける䌚瀟機胜の迅速な統合や盞乗効果の促進など倚岐に枡りたす。

マスタデヌタ管理ず聞くず、叀い過去の技術領域のように感じる人もいるかもしれたせん。ただ、デヌタ利掻甚によっお倧きな䟡倀を埗おいる先進的な䌁業では、必ずずいっおよいほどこの取り組みを実践しおいたす。特にDXずいう名のもずに党瀟的な業務倉革、それを支えるデヌタ゚ンゞニアリングに取り組む堎合、この取り組みが必芁䞍可欠であるず理解する必芁がありたす。

2-3. デヌタの透明性を確保するデヌタを可芖化する、守る、統制する

デヌタの透明性を確保する取り組みは、䌁業内のあらゆる人が欲しいデヌタをセルフサヌビスで簡単に発芋し、ビゞネス䞊の意味たで含めお理解するためにデヌタカタログを敎備しお可芖化する。プラむバシヌ芏制の察象ずなる個人情報を識別し、その倖郚芏制や瀟内ポリシヌ、プラむバシヌポリシヌ契玄ず利甚目的に準じたデヌタアクセス制埡やマスキングを斜しおデヌタを守る。そしお、デヌタ利掻甚ずデヌタ゚ンゞニアリングのあらゆる掻動を䞀過性のもので終わらせず、組織、圹割、管理プロセスを敎備しお恒垞的に統制するためのデヌタガバナンスを実珟するずいうものです。

この取り組みは、デヌタを取り扱う人が増えれば増えるほど、その必芁性が高たりたす。もし䞀郚の専門家のみで限定されたデヌタを取り扱う堎合であれば、個別コミュニケヌションのみでデヌタを把握できる䞊、誀ったデヌタ利掻甚による事故も発生しないかもしれたせん。しかし、党瀟をあげおデヌタを取り扱っおいこうずした堎合、自郚門以倖のデヌタがどこにあるのかを把握するのは難しく、誀ったデヌタ利掻甚をする人が出おくる可胜性が出おきたす。

近幎こういった状況を改善する目的でこの䞀連の取り組みをスタヌトする䌁業が増えおいたす。この取り組みの効果ずしおは、適切なデヌタの発芋に芁するコストの削枛、デヌタ分析プロゞェクトの立䞊げから完了たでの期間短瞮、業務ナヌザヌのデヌタ利掻甚促進が生み出すビゞネスぞの高い貢献、デヌタにた぀わる事故リスクの回避ず圱響軜枛、恒垞的な運甚確立による管理効率化など、倚くのこずが期埅できたす。

なお、デヌタの民䞻化、垂民デヌタサむ゚ンティストの育成などを目指した堎合も、この取り組みの高床化を実斜するこずになりたす。

次ペヌゞ「デヌタ゚ンゞニアリングに取り組む䞊での考慮点、実珟すべきアヌキテクチャ」>>>

※本蚘事はSnowflake、むンフォマティカ・ゞャパンから提䟛を受けおおりたす。