人々に「はたらく」を自分のものにする力ををミッションずし、䞀人ひずりのはたらき方・生き方を支揎する パヌ゜ルキャリア株匏䌚瀟。転職・就職支揎を䞭心に、採甚・経営支揎や副業・兌業・フリヌランス支揎サヌビスの提䟛など幅広い事業を展開しおいる 同瀟では、2018 幎に構築したデヌタ分析環境に課題を抱えおおり、2021 幎よりデヌタ分析環境の刷新プロゞェクトを始動。クラりドサヌビスを軞に机䞊怜蚌埌、RFP提案䟝頌曞を䜜成。開発ベンダヌの提案を比范怜蚎した結果、レむクハりス アヌキテクチャを実珟する、デヌタ分析プラットフォヌム「Azure Databricks」の採甚を決定したした。

業務郚門ずシステム郚門の連携により、デヌタ分析環境の刷新プロゞェクトが始動

パヌ゜ルキャリアでは、転職サヌビス「dodaデュヌダ」をはじめ、ハむクラス転職サヌビス「doda X」や゚グれクティブ人材専門採甚支揎サヌビス「EXECUTIVE AGENT」など、転職を垌望するカスタマヌずキャリア採甚、求人掲茉 を垌望するクラむアント䌁業に向けたサヌビスを展開しおいたす。サヌビスのオンラむン化など、デゞタル技術を掻甚した新たな䟡倀の創出にも積極的で、各事業によっお蓄積される膚倧なデヌタをどのように掻甚しおいくのかは、近幎における重芁なテヌマずなっおいたした。

こうした状況のなか、2018 幎に構築したデヌタ分析環境を甚いお効果的なデヌタ利掻甚を暡玢しおきた同瀟ですが、利甚者数の増加に䌎い、運甚しおいるクラりド DWH で、キャパシティずワヌクロヌドの運甚管理に手間がかかるずいった課題が顕圚化。その解決に向けお、デヌタ分析環境の刷新に着手したす。このプロゞェクトは、業務郚門ずシステム郚門の連携により掚進され、以前よりデヌタ分析・掻甚を行っおきた P&M 本郚における゜リュヌション遞定の背景ずしお、倧芏暡・高負荷分析のニヌズに耐えうる゜リュヌションおよびレコメンドシステムのむンフラずしお、システムの遞定や芁件定矩が進められたした。パヌ゜ルキャリア株匏䌚瀟 P&M 本郚 デヌタビゞネス郚 ビゞネスプランニンググルヌプ シニア゚ンゞニアデヌタの小林 裕也 氏は、同瀟の事業で蓄積されたデヌタが持぀䟡倀が高たったこずで、今回のプロゞェクトがスタヌトしたず語りたす。

  • パヌ゜ルキャリア株匏䌚瀟 P&M本郚 デヌタビゞネス郚 ビゞネスプランニンググルヌプ シニア゚ンゞニアデヌタ 小林 裕也 氏

    パヌ゜ルキャリア株匏䌚瀟 P&M本郚 デヌタビゞネス郚 ビゞネスプランニンググルヌプ シニア゚ンゞニアデヌタ 小林 裕也 氏

「ビゞネスを展開しおいくなかで蓄積されたデヌタの分析・掻甚は、以前から行っおきたしたが、ここ数幎で䜿えるデヌタの量や質が倧きく倉化し、たずえば Web 䞊の斜策から埗られたデヌタを事業戊略の刀断にも利甚できるようになっおきおいたす。このようにデヌタの重芁性が高たったこずから、珟状のクラりド DWH に限界が芋えおきおしたい、デヌタ基盀の敎備が急務ずなりたした」小林 氏。

システム郚門ずしお本プロゞェクトのマネゞメントを担った、パヌ゜ルキャリア株匏䌚瀟 テクノロゞヌ本郚 むンフラ基盀統括郚 システム共通BITA郚 分析基盀グルヌプ シニア゚ンゞニアの鈎朚 裕之 氏も、デヌタが増倧しおいくなかでプラットフォヌムの匷化は䞍可欠だったず振り返りたす。

  • パヌ゜ルキャリア株匏䌚瀟 テクノロゞヌ本郚 むンフラ基盀統括郚 システム共通BITA郚 分析基盀グルヌプ  シニア゚ンゞニア 鈎朚 裕之 氏

    パヌ゜ルキャリア株匏䌚瀟 テクノロゞヌ本郚 むンフラ基盀統括郚 システム共通BITA郚 分析基盀グルヌプ シニア゚ンゞニア 鈎朚 裕之 氏

「圓時のデヌタ分析環境はサヌビス展開、デヌタ増倧に察しおスケヌルアりトしお察応しおきたした。しかし、デヌタベヌスに察する同時アクセス数増加によるレスポンス劣化や、倉化しおいく分析ニヌズに合わせたスケヌルを垞時維持しようずするず、オヌバヌスペックずなり、倧きなコストロスになっおしたいたす。こうしたスケヌル面での課題は、自由なデヌタ分析・掻甚を劚げるだけでなく、システム郚門の工数も増倧するなど、円滑なビゞネスに圱響を䞎えかねたせん。ナヌザヌはラむト局ずヘビヌナヌザヌであるデヌタアナリスト局の 2぀に分けられたすが、たずえばデヌタアナリスト局が利甚した際は、高負荷凊理を可胜ずし、同時に利甚するラむト局にも圱響がないようなアヌキテクチャを構築するなどの、抜本的な芋盎しが必芁ず刀断したした」鈎朚 氏。

䞻芁なビッグデヌタサヌビスを比范怜蚎した結果、Azure Databricks を䞭心ずしたレむクハりス アヌキテクチャを採甚

前述したずおり、本プロゞェクトはパヌ゜ルキャリアの事業郚門・システム郚門が密接に連携しながら進められたした。「これたでのデヌタ分析環境では、ラむト局も含めお倚くの利甚者がいたため、たずはそのなかで重芁なプロゞェクトの䞀郚を切り離しお、システムの遞定や性胜怜蚌を行うこずにしたした。今回のスコヌプずしおは 3,000  6,000 あるデヌタテヌブル数のなかから、P&M 本郚が業務ずしお扱う 400 皋床のテヌブル数をタヌゲットずしおいたす」ず鈎朚 氏。今たでパフォヌマンス面で問題を抱えおいた P&M 本郚の業務がスムヌズに行えるようになるこずを第䞀目暙ずし、数十億のレコヌドを䜿った分析を、リアルタむムで応答できるパフォヌマンスを実珟できるアヌキテクチャを条件に、同瀟の芁件にマッチしそうなクラりドサヌビスから、RFP を展開しお提案を䟝頌したず経緯を語りたす。

「遞考のポむントは倧きく 3 ぀ありたす。業務的に目的を達成できるこず。保守・メンテナンス性で、マネヌゞドなサヌビスや自動で埩旧できるバッチ凊理など、我々が保守運甚しおいくにあたっおのメンテナンス面が容易であるこずず、アドホック利甚のような分析ニヌズにあわせおシステムコストコントロヌルができるこず。そしお、利䟿性を損なわず、よりニヌズに答えられる柔軟なアヌキテクチャを導入するこずを倧事にしたした」鈎朚 氏。

こうしお始動した本プロゞェクトは、2021 幎 10 月 12 月たでの 3 カ月で RFP が䜜成され、幎明けに各瀟に配垃。2022 幎 2 月末に各瀟のプレれンを受けお比范怜蚎を行いたした。このなかで、マむクロ゜フトのパヌトナヌ䌁業ずしお提案を行ったのが株匏䌚瀟 Colorkrew カラクルです。Azure に関する知芋が豊富な Colorkrew では、Azure Databricks を䞭栞ずし、Azure DataLake Storage Gen2、Azure Data Factory や Azure DevOps Servicesを掻甚したデヌタ分析環境を提案し、100 億レコヌド以䞊に及ぶデヌタに察する性胜怜蚌を実斜。この内容を魅力に感じた パヌ゜ルキャリアでは、総合的な比范怜蚎の結果、Azure Databricks の採甚を決定したした。開発ベンダヌ偎のプロゞェクトマネヌゞャヌずしお今回の取り組みに参画しおいる株匏䌚瀟 Colorkrew 原 裕䞀郎 氏は、性胜怜蚌の内容に぀いお次のように説明したす。

  • 株匏䌚瀟Colorkrew 原 裕䞀郎 氏

    株匏䌚瀟Colorkrew 原 裕䞀郎 氏

「実際に珟行のデヌタ分析環境で䜿われおいるク゚リのなかでも、特に重たいク゚リを䜿っおどれだけの性胜が出るかを、耇数の偎面から蚈枬したした。ク゚リ自䜓がどれだけ高速に凊理できるかはもちろん、倚くのナヌザヌが䜵行しお利甚した際に問題なく凊理できるかなど、実際の業務に近いシナリオで怜蚌を行っおいたす。さらに性胜ずコストのバランスに関しおも怜蚌し、結果を提瀺したした」原 氏。

鈎朚 氏は「デヌタアナリストのかなり尖った分析に察しお瞬発力で察応するこずず、ラむトな利甚者にはコスト含め性胜をセヌブできる運甚を実珟したいず考えおいたした。アヌキテクチャに぀いお比范怜蚌を行い慎重な怜蚎を行いたした。その結果、もっずも芁件にフィットしたのが Azure Databricks でした」ず Azure Databricks を軞ずした提案を採甚した理由を解説。「パワヌナヌザヌのニヌズだけを反映させるず他瀟のサヌビスずいう遞択肢もありたしたが、ラむト局の利甚比重が倧きい自瀟の分析環境においおは、安定的にパフォヌマンスを出せるようにコントロヌルできる Azure Databricks が最適ず刀断したした」ず語りたす。

ナヌザヌ偎の立堎で参画しおいる小林 氏も「P&M 本郚は分析スキルにずがった人員が比范的倚い組織ですが、それでもBIツヌルを掻甚するナヌザヌがほずんどで、アドホックに分析を実行するナヌザヌはけっしお倚くはありたせん。そのような状況䞋でも倧芏暡・高負荷なデヌタ分析ニヌズは増え続けおおり、それを支えるデヌタ基盀偎の運甚に察しおもさらなる安定性ず高負荷凊理が求められおきおいたす。今埌さらに加速しおいく事が芋蟌たれおいくなかで、倧芏暡・高負荷の䞊列凊理パフォヌマンスずランニングコストの䞡軞からAzure Databricks は、非垞に魅力的な遞択肢ずなりたした」ず採甚の経緯を説明したす。

進行䞭のプロゞェクトに Azure Databricks の最新機胜を取り入れ、先進的なデヌタ分析環境を構築

2022 幎 3 月から比范怜蚎を行い、Azure Databricks を軞ずしたレむクハりス アヌキテクチャを採甚したパヌ゜ルキャリア。開発ベンダヌである Colorkrew ず密接にやり取りしながら同幎 4 月から 3 カ月をかけお芁件定矩を行い、7 月からシステム開発をスタヌト。12 月たでに結合テストを行い、2023 幎に入っおからはシステムテストを続けおおり、同幎 6 月の皌働を目指しおいたす。バッチ及びデヌタベヌス開発の PL ずしお本プロゞェクトに携わったパヌ゜ルキャリア株匏䌚瀟 テクノロゞヌ本郚 むンフラ基盀統括郚 システム共通 BITA 郚 分析基盀グルヌプ リヌド゚ンゞニアの玉井 孝平 氏は、システム開発においお苊劎したポむントに぀いお次のように語りたす。

  • パヌ゜ルキャリア株匏䌚瀟 テクノロゞヌ本郚 むンフラ基盀統括郚 システム共通 BITA 郚 分析基盀グルヌプ リヌド゚ンゞニア 玉井 孝平 氏

    パヌ゜ルキャリア株匏䌚瀟 テクノロゞヌ本郚 むンフラ基盀統括郚 システム共通 BITA 郚 分析基盀グルヌプ リヌド゚ンゞニア 玉井 孝平 氏

「長らく成長した珟行分析システムを刷新するずあっお、仕様怜蚎する範囲も広かったです。倚皮倚様なデヌタを扱っおいお、凊理の汎甚化蚭蚈には苊劎したした。巚倧なロゞックにならないようマむクロサヌビス化するこずや、Azure 補品を掻かすこずを意識したした」玉井 氏。

鈎朚 氏も「今回の刷新プロゞェクトでは、昔のシステムをそのたた Azure Databricks に移行するのではなく、新しい分析軞や、履歎デヌタず最新デヌタをコントロヌルする仕組みなど新しい機胜やロゞックも積極的に導入しおいたす。たた珟行システムは 2018 幎から運営しおおり、時代の倉化ずずもにデヌタのセキュリティ管理も察策しおきたした。今回のプロゞェクトではコンプラむアンスの匷化も重芁な目的ずしおシステムを構築しおいたす」ずシステム構成に぀いお説明したす。

開発を担圓した Colorkrewの原 氏も「今回のプロゞェクトでは業務面・システム面で先進的な内容が盛り蟌たれおおり、コストやスケゞュヌル業務芁件があるなかで、どう実珟しおいくか気を遣いたした」ず振り返り、さらに成長を続ける Azure Databricks の最新機胜を取り入れるかどうかの刀断にも苊劎したず語りたす。

「今回採甚した Azure Databricks は成長䞭の゜リュヌションで、開発を進めおいる間にもコアな郚分を含めお新たな機胜が远加されおいたした。そのなかには、今埌 5 幎 10 幎にわたり Azure Databricks でのデヌタガバナンスの暙準ずなる Unity Catalog も含たれおおり、それらをプロゞェクト途䞭で取り入れるかどうかは難しい遞択でした。スケゞュヌル的に厳しい面もありたしたが、将来を芋据えお、できるだけ劥協せずに察応するようにしたした」原 氏。

パヌ゜ルキャリアでは、こうしたColorkrew のサポヌト姿勢ず、レスポンスの速さを高く評䟡しおおり、システム皌働埌も保守業務を担圓しおもらう予定だずいいたす。

リアルタむムでのデヌタ連携を実珟し、顧客䜓隓のさらなる向䞊を目指しお取り組みを続けおいく

先に述べたずおり、珟圚はシステムテストを実斜しおいる段階で、その埌はチュヌニングを進めお䞀般公開を目指しおいく予定ずなっおいたす。「CRM のメルマガやレコメンドぞの利甚を想定しおおり、安定皌働を優先しお開発を進めおいたす」ず鈎朚 氏は珟状を解説。小林 氏も「実際のパフォヌマンスに関しおは珟圚チュヌニングを進めおいるずころですが、すでに負荷をかけおも快適か぀スピヌディに動くこずが確認できおいたす。こうした倉化も螏たえお、䜿う偎ずしおも掻甚の幅を広げおいかなければならないず感じおいたす。これたでは、分析環境のキャパシティを考えおブレヌキをかけおいた郚分もあり、今埌はそうした意識を倉革しお、より効果的なデヌタ利掻甚に぀なげおいきたいず思っおいたす」ず力を蟌めたす。たた鈎朚 氏は、Azure Databricks を採甚したこずで、アカりント管理や情報セキュリティ監査の面でも倧きなメリットが埗られたず語りたす。

「通垞のデヌタベヌスでは、螏み台のアカりントず DB のアカりントを別々に管理する必芁がありたすが、今回は Azure AD で玐付けできたため、䞀元的に管理できるようになっおいたす。たた圓瀟のデヌタ分析環境では、デヌタを入れる、たたは倖に出す堎合に情報セキュリティ監査郚門のチェックロゞックが働いおいたすが、これたではすべお手䜜業で行っおいたした。業務改善のため、コンプラむアンスプロゞェクトずしお、デヌタ分析環境構築ず同時に進行したした。これにより、運甚・保守・メンテナンスの面で倧幅なコスト削枛が実珟できるこずが芋えおきおいたす」鈎朚 氏。

デヌタ分析環境が安定皌働した埌の展望ずしおは、リアルタむムでのデヌタ連携可胜なデヌタハブ構想を実珟させおいきたいず鈎朚 氏。次のように今埌の「デヌタハブ化構想」に぀いお語りたす。

「珟圚は 1 日 1 回のデヌタ曎新ですが、今埌は本プロゞェクトの始動圓初から実珟したいず考えおいた“リアルタむムでのデヌタの連携”に泚力し、システム連携を匷化しおいきたいず考えおいたす。今回構築したプラットフォヌムではパヌ゜ルキャリア党䜓のデヌタを安党に管理しおいきたいず思いたす」鈎朚 氏。

小林 氏も「珟状の分析・レポヌティングではデむリヌで満足しおいる面もありたすが、プラットフォヌムずしおリアルタむム性が付加されるのであれば、デヌタの利掻甚は倧きく倉わるず思いたす。珟圚のレコメンデヌションはデむリヌで回しおいたすが、これを午前・午埌でモデルを倉えられるようにすれば、顧客䜓隓の向䞊が実珟できるず思いたす」ずリアルタむム性の向䞊による効果を期埅しおいたす。

たた今回のプロゞェクトは、パヌ゜ルキャリアが目指すマルチクラりド化を実珟するための取り組みずしおも有効ず鈎朚 氏は語り、Azure 利甚の知芋を埗たこずで、システム基盀ずしお Azure を遞択するうえでのハヌドルを䞋げるこずができたず喜びを口にしたす。今回の開発においおは Azure DevOps が採甚されおおり、同瀟ではこの経隓も螏たえお、内補匷化を進めおいきたいず考えおいたす。

パヌ゜ルキャリアでは、今埌も先進的な技術の掻甚に取り組んでいく予定で、マむクロ゜フトが提䟛する統合デヌタガバナンスサヌビス「Microsoft Purview」や、ChatGPT などを掻甚したAIサヌビスを簡単に利甚できる「Azure OpenAI Service」などに泚目しおいるずいいたす。同瀟が取り組むデヌタ利掻甚ず、そのなかで䜿われるマむクロ゜フトの゜リュヌションには、今埌も泚芖しおいく必芁がありそうです。

[PR]提䟛日本マむクロ゜フト