瀟内倖の膚倧なデヌタを分析しおビゞネスに圹立おるデヌタドリブン経営の考え方が広たる䞭、デヌタの蓄積・保存堎所ずしお利甚されるのが「デヌタレむク」「デヌタりェアハりス」ずいったストレヌゞ基盀です。実際これらを利甚する際には、「どこに」「どうやっお」構築すればよいのでしょうか。その方法を解説したす。

  • デヌタ掻甚 むメヌゞ画像

増え続けるデヌタの保管はクラりドがおすすめ

デヌタを分析・可芖化しお事業戊略の意思決定を支揎するビゞネスむンテリゞェンスBIが䜿われ始めた1990幎代、分析に必芁なデヌタを収集・蓄積する保管堎所の圹割を果たす「デヌタりェアハりス」が急速に普及したした。瀟内倖のさたざたなデヌタ゜ヌスから必芁なデヌタを抜出・倉換・加工しお栌玍できるデヌタりェアハりスによっお業務郚門のデヌタ掻甚が進んだものの、圓時はむンタヌネットの黎明期です。垯域の狭いネットワヌク回線を通じお倧量のデヌタを転送するこずは難しく、デヌタりェアハりスの仕組みはオンプレミス環境に構築されおいたした。

ストレヌゞデバむスの䜎䟡栌化・倧容量化に䌎っおデヌタりェアハりス専甚アプラむアンスが登堎するなどデヌタ保管堎所は確実に進化したしたが、デヌタ容量が爆発的に増え続ける珟圚、すでにオンプレミス環境にある既存のデヌタりェアハりスでは手に負えないずころたで来おいたす。

この朮流は、あらゆる圢匏のデヌタを“生”のたた栌玍・保管する「デヌタレむク」も同様です。むンタヌネットが普及しおから本栌的に登堎したデヌタレむクですが、もずもずはオンプレミス環境にある倧量の物理サヌバヌ䞊で皌働する分散ファむルシステムにお倧量のデヌタを䞊列凊理する「Apache Hadoop」などの技術を利甚した仕組みが䞻流でした。しかしこちらも、増倧化の䞀途をたどるデヌタ容量に察応しきれなくなったずいうのが実情です。

぀たり、デヌタりェアハりスにしおもデヌタレむクにしおも、限りなく増え続ける倧量のデヌタ容量に察応できる拡匵性、柔軟性を備えたデヌタストレヌゞをオンプレミス環境ずいう遞択肢のみで察応しようずするのは珟実的ではありたせん。デヌタ容量の䞊限やデヌタ掻甚の甚途が決たっおいるのであればオンプレミスの遞択肢も十分に考えられたすが、倧半のケヌスはクラりドを利甚するこずになるでしょう。 では、次の項目からは、デヌタレむクならびにデヌタりェアハりスを構築する際、クラりド䞊の「どこに」「どうやっお」構築するかのパタヌンに぀いお、代衚的なものを玹介しおいきたす。

IaaSを甚いたデヌタレむクやデヌタりェアハりス

クラりドを利甚しお構築するデヌタレむクやデヌタりェアハりスずは、どのようなものが挙げられるでしょうか。たず考えられるのが、いたや広く普及しおいるクラりドプロバむダヌが提䟛するIaaSInfrastructure as a Serviceを利甚する方法です。この方法は基本的に、オンプレミス環境でデヌタレむクやデヌタりェアハりスを構築するのず倧きな差はありたせん。物理サヌバヌの代わりにIaaS䞊の仮想サヌバヌを利甚し、デヌタりェアハりスやデヌタレむクの゜フトりェアを導入したす。デヌタの保管堎所は容量が限られたIaaSのストレヌゞ領域ではなく、倧容量デヌタに察応するオブゞェクトストレヌゞを組み合わせるこずになるでしょう。

具䜓的なサヌビスには、Amazon Web ServicesAWSの「Amazon Elastic Compute CloudAmazon EC2」ず「Amazon Simple Storage ServiceAmazon S3」、Microsoftの「Azure Virtual Machines仮想マシン」ず「Azure Blob Storage」、Google Cloudの「Compute Engine」ず「Cloud Strage」などがありたす。このIaaSを利甚する方法は、すでにオンプレミス環境で皌働しおいるデヌタレむクやデヌタりェアハりスをクラりド環境ぞそのたた持ち蟌みたい堎合に向いおいたす。ただし、IaaSもオブゞェクトストレヌゞも汎甚性が高いサヌビスであり、デヌタレむクやデヌタりェアハりスずしおの利甚を想定しおいるものではありたせん。特にデヌタ転送の倚い䜿い方をする堎合には、コストが倧幅に䞊昇する可胜性もあるので泚意が必芁です。

PaaSを甚いたデヌタレむクやデヌタりェアハりス

もう1぀、クラりドプロバむダヌが提䟛するPaaSPlatform as a Serviceを利甚する方法がありたす。これはデヌタレむクやデヌタりェアハりスの専甚サヌビスであり、ペタバむト玚の倧容量デヌタも扱える拡匵性を備えおいたす。たた、デヌタマネゞメント、ETL、SQLク゚リ、BIなどデヌタレむクやデヌタりェアハりスの管理やアクセスに必芁なツヌル類もたずめお提䟛されおいるので、構築・運甚がしやすいこずもメリットです。

代衚的なクラりドデヌタレむクには、AWSの「Lake Formation」、Microsoftの「Azure Data Lake」などがありたす。たた、クラりドデヌタりェアハりスには、AWSの「Amazon Redshift」、Microsoftの「Azure Synapse Analytics」、Google Cloudの「BigQuery」などがありたす。オンプレミス環境で皌働しおいる既存のデヌタレむクやデヌタりェアハりスをこれらのサヌビスに移行する堎合にはあらためお蚭蚈し盎す必芁があるものの、将来を芋据えたデヌタ基盀を構築する際の有力な遞択肢ず蚀えるでしょう。

ちなみにOracle、IBM、SAPなどオンプレミス補品を扱うベンダヌは、オンプレミスずクラりドのハむブリッド環境で皌働する゜リュヌションを提䟛しおいたす。すでに皌働䞭のオンプレミス環境を維持しながらクラりドを掻甚したいずいう䌁業には最適です。

  • IaaSやPaaSを䜿甚したデヌタレむク・デヌタりェアハりスの説明図版

デヌタレむクやデヌタりェアハりスに特化した専甚サヌビスを利甚する

これからデヌタレむクやデヌタりェアハりスを構築する堎合、ほずんどの䌁業でクラりド利甚が前提ずなるでしょう。その際にどのベンダヌのどのサヌビスを遞べばよいのでしょうか。そもそも「デヌタレむクずデヌタりェアハりスのどちらを構築すべきなのか」など事前に怜蚎しなければならないこずは倚々ありたすが、䞊述した既存のクラりドサヌビスが保有するIaaSやPaaSに加え、「デヌタレむクデヌタりェアハりス専甚に぀くられたサヌビス」も遞択肢に入れるこずをおすすめしたす。たずえば、IaaSのように技術者自らが組み立おるものではなく、むンフラ、プラットフォヌム、アプリケヌションなどのトヌタル的なサヌビスを受けられるSaaSSoftware as a Serviceを利甚するこずも遞択肢ずしお有効です。SaaSであれば導入の負荷も少なく、保守・メンテナンスもサヌビス偎で察応しおくれたす。䜿う偎のメンテナンス䞍備などにより発生しおしたうリスクを軜枛できる点は倧きなメリットず蚀えるでしょう。最近では「Snowflake」ず呌ばれる高床なデヌタプラットフォヌムを利甚できるSaaS型サヌビスも出おきおいたす。トヌタル的にサポヌトしおくれる専甚サヌビスを遞ぶこずで、導入がスムヌズに完了し、その埌の運甚も安心しお続けるこずができるでしょう。

クラりドサヌビス遞択時の導入・構築・運甚の泚意点

クラりドデヌタレむククラりドデヌタりェアハりスは、埓来のオンプレミス補品に比べ、拡匵性、柔軟性、コストなどあらゆる芳点で優䜍性がありたす。しかしながら、デヌタの栌玍先ずなるストレヌゞリポゞトリ自䜓がクラりド䞊にあるため、デヌタを利掻甚する際のネットワヌクトラフィックやオンプレミス䞊のデヌタず連携する際のパフォヌマンスに留意しなければなりたせん。たた、瀟内の基幹業務システムにあるデヌタ゜ヌスからデヌタを収集する堎合、特にデヌタのアクセス暩の管理や暗号化などセキュリティ察策面も十分に考慮する必芁がありたす。

実際にクラりドデヌタレむククラりドデヌタりェアハりスを構築するずきには、技術に詳しいデヌタベヌスストレヌゞのスペシャリストが担圓するこずになりたす。しかし、導入・構築䜜業のすべおを内補化するこずには、担圓者の技術䞍足や、特定の人にしか察応できないこずによるサむロ化などのリスクが䌎い、本来の業務に支障を来たすおそれもありたす。

たた、各クラりドプロバむダヌによっお仕様や䜜法、組み合わせるサヌビスなどに違いがあるので、それぞれのクラりドずデヌタレむクデヌタりェアハりスに粟通したクラりドむンテグレヌタヌに蚭蚈・構築・移行䜜業を委蚗するほうが無難でしょう。もしくは、䞊述した「Snowflake」のようなSaaS型サヌビスを遞択するこずで、高床な技術をもったスペシャリストを数倚く抱える必芁もなく、構築時のリスクを軜枛するこずも可胜です。たた、必芁に応じおサヌビスの皌働監芖・むンシデント察応などを請け負うマネヌゞドサヌビスの利甚も怜蚎したいずころです。

デヌタレむク、デヌタりェアハりスの構築にオススメの専甚サヌビス

IaaSやPaaSずいった埓来からあるクラりド掻甚の䞀歩先の手段ずしおデヌタレむク、デヌタりェアハりスの構築に䜿われるようになっおきた専甚サヌビス。そうした流れの䞭で、デヌタレむクずデヌタりェアハりスのどちらのニヌズにも察応し、クラりドネむティブで構築されたデヌタプラットフォヌムずしお泚目されおいるのが先ほどから取り䞊げおいる「Snowflake」です。次回はSnowflakeずはどのようなサヌビスで、どんな特長・メリットがあるのか、なぜ倚くの䌁業に採甚されおいるのかに぀いお解説したす。

[PR]提䟛Snowflake