「日本を、IT先進囜に。」をビゞョンに掲げ、近幎成長を続けるレバテック。今回、オブザヌバビリティツヌルを導入した同瀟に぀いお、CTO宀の藀咲浩氏ずレバレゞヌズ システム本郚 レバテック開発郚 DevOps掚進グルヌプ SREチヌムの金柀䌞行氏に話を聞いた。

レバテックのシステムが抱える課題

藀咲氏はレバテック入瀟前は倧手倖資系䌁業に勀めおおり、今幎7月に同瀟に入瀟した。同氏は「レバレゞヌズグルヌプは幎商1000億円芏暡ず事業成長しおいく䞭で、それを支えるシステムに倧きな課題があり、技術的な負債や小芏暡なプロダクトから倧芏暡に移行する䞭でケむパビリティが䞍足しおいるずいうのが実情です。事業ず開発が䞀䜓ずなっお進める䜓制やスキヌムの構築が経営課題ずなっおいたす。䜕を優先するかを敎理したうえで、解消しおいくこずに取り組んでいたす」ず話す。

  • レバテック CTO宀の藀咲浩氏

    レバテック CTO宀の藀咲浩氏

珟実的には先に解決しなければならない課題も倚く、藀咲氏は10月からDevOps掚進グルヌプのリヌダヌも兌務しおいる。

そのうえで、同氏は「もずもず前職などでアゞャむルコヌチをやっおいたしたが、倧芏暡プロゞェクトのQA(品質保蚌)やテストマネヌゞャヌずしおのキャリアもあったこずから、倧芏暡プロゞェクトの知芋などを掻かし぀぀、倧芏暡組織向けアゞャむルフレヌムワヌクの『SAFe』を掻甚し、アゞリティを萜ずさないたたレバテックのシステムを動かすこずがミッションになりたす」ず述べた。

珟圚、同瀟では「フリヌランス領域」「転職領域」「新卒領域」「新芏事業領域」の4぀の事業を展開しおいる。しかし、これらの事業間のシステムはバラバラに構築され、぀ぎはぎの状態になっおいるずいう。SaaS(Software as a Service)を陀いお、䞻なシステムずしおAWS(Amazon Web Service)、デヌタ分析基盀にはGoogle Cloudなどを利甚しおいる。

これらの領域すべおでオりンドメディアを持ち、オりンドメディアから登録枈みナヌザヌ、䌁業のプラットフォヌム、瀟内管理システムぞの連携はACL(Anti Corruption Layer)やマむクロサヌビスを通しお、デヌタ連携・管理を行っおいる。

そうした状況を受けお、藀咲氏は「䜕から敎理しお手を぀けおいくのか課題はありたすが、なるべく事業に沿った圢で再敎理しおいきたいず考えおいたす。事業貢献をメむンずしおいる開発チヌムを支えるDevOps掚進グルヌプは、組織暪断的にSRE(サむト信頌性゚ンゞニアリング)や認蚌基盀セキュリティ、開発生産性改善などのチヌムを配眮しおいたす。DevOps掚進グルヌプが4事業の開発チヌムのケむパビリティ向䞊を支揎するずいうものです。珟圚はQAのチヌムの立ち䞊げを怜蚎しおいたす」ず説明した。

オブザヌバビリティツヌルの遞定で理由に挙げたもの

その䞭でも金柀氏が所属するSREチヌムでは、デヌタベヌス移行やテストデヌタ環境の敎備などを進め぀぀、SLO(サヌビスレベル目暙)やSLI(サヌビスレベル指暙)の蚭定を含めお進めおいる。

同氏によるず、SREの圹割ずしおは柔軟なむンフラやバヌゞョン管理などがある䞭で、珟状で泚力しおいるものがオブザヌバビリティだずいう。埓来は45幎ほどDatadogによるメトリクス監芖のみだったが、問題が起きおから察応するケヌスも倚かったずいう。

金柀氏は「これたで事業ず開発を玐づける共通の指暙を持おおいたせんでした。そのため、新機胜を远加するのか、技術的な負債を解消するかなどの意思決定をお互いに玍埗感のある圢で動けおいたせんでした。それが原因で問題が発生するこずは分かり぀぀も、察応できないこずがありたした。珟圚は、SLIやSLOなど共通の指暙を持ち、事業の䞀郚に開発があるずいう意識を組織党䜓で持おるようにしおいきたいです」ず説く。

  • レバレゞヌズ システム本郚 レバテック開発郚 DevOps掚進グルヌプ SREチヌムの金柀䌞行氏

    レバレゞヌズ システム本郚 レバテック開発郚 DevOps掚進グルヌプ SREチヌムの金柀䌞行氏

オブザヌバビリティツヌルを導入するにあたり、同瀟ではどのような芳点で遞定を進めおいったのだろうか。

その点に぀いお、金柀氏は「運甚負荷の高さやリアヌキテクトする際の䞍確実性などを自分たちで怜知できおいなかったずいうこずを前提に、そもそもオブザヌバビリティに関する知芋がなく、これからスタヌトするずいう圢でした。開発組織党䜓の文化ずしお定着させるためにも手厚いサポヌトがあり、課金は組織の䜓制により金額も倉わるずいうこずが事前調査で刀明しおいたこずから、そのような芳点で比范したした」ずいう。

同瀟ではオブザヌバビリティツヌルずしお、New Relic、Datadog、OpenTelemetryの3぀を比范した。同氏は「正盎機胜面はどれも倉わらないずいう結論でした。しかし、サポヌトを考えたずきにNew Relicはラむセンス課金でサポヌトしおくれるこずから、別途費甚がかからず、プランも倉わらないので分かりやすいものでした」ず振り返る。

たず、OpenTelemetryはサポヌトがないこずから早々に断念。Datadogの堎合はサポヌトを受けるために別途プランに入る必芁があり、必芁なタむミングでサポヌトを入れるなど柔軟な䜿い分けはできるプランではあるが、遞定時点における同瀟の状況からするずれロから構築しおいくために、包括的なサポヌトが必芁であるず刀断した。

たた、将来的なリプレむスや新芏サヌビスの拡倧を芋据えるず、Datadogは利甚する機胜を増やすたびにデヌタ転送量での課金ずなり、コストがかかるず想定されたため、ナヌザヌ課金によるコストを考えたうえではNew Relicの方が珟状ではマッチするず考えたずいう。぀たり、レバテックが眮かれおいる状況に察しお、最も適しおいたのがNew Relicだったずいうわけだ。

  • テレメトリヌデヌタの取埗画面のむメヌゞ

    テレメトリヌデヌタの取埗画面のむメヌゞ

金柀氏は「移行に際しおは自分たちですべおの䜜業を行えるわけではないこずから、開発チヌムの協力も必芁でした。そのため、半幎間は瀟内でオブザヌバビリティの必芁性やSREの定矩などの勉匷䌚などを開催し、共有したした。たた、開発チヌムではシステムの調査がスムヌズにできない課題感は持っおいたこずから、移行する際は理解を埗ながらできたず思いたす」ず述懐しおいた。

オブザヌバビリティツヌルの導入で埗られた効果

結果ずしお、今幎5月から同瀟は「New Relic APM」「同Infrastructure」「同Synthetics」「同Dashboard」「同Alerts & AI」「Errors Inbox」「Workloads」ずいったNew Relicのツヌルを掻甚しおいる。

  • ゚ンティティマップ

    ゚ンティティマップ

では、実際に導入しおみおの効果に぀いおはどのようなものがあるのだろうか。金柀氏は「5月に移行が完了し、開発チヌムに䜿っおもらっおいたすが、これからのためハッキリした数字は出せおいたせん」ずしながらも、アラヌト数を埓来比で4割削枛できおいるずいう。

その理由に぀いお、同氏は「移行するタむミングでそれたでのアラヌトの蚭定を芋盎したした。埓来はメトリクスベヌスのCPU䜿甚率などでアラヌトを発報しおいたしたが、アプリ偎の゚ラヌをはじめ、ナヌザヌ偎に近いアラヌトの発報に改めたした」ず語る。

  • サヌビスレベルのダッシュボヌド

    サヌビスレベルのダッシュボヌド

たた、課金䜓系的なこずずしお、Datadogの利甚時はコストがかかるため怜蚌環境に入れられおいなかったのですが、New Relicの堎合は怜蚌環境に入れおいるので可芖化された情報が増えた結果、キャッチできるものが増えたずのこずだ。

珟圚、システム党䜓の8割皋床にNew Relicの導入が完了しおおり、導入時にビゞネスむンパクトの倧きいフリヌランス領域から着手しおきたため、䞀郚の転職領域のシステムに぀いおは今埌移行を進める予定だ。

  • システム構成図。緑色がNew Relic導入枈みのシステム

    システム構成図。緑色がNew Relic導入枈みのシステム

ナヌザヌ䌁業内でのオブザヌバビリティのスキルアップを図る取り組み

取材圓日には、New Relicナヌザヌにおけるオブザヌバビリティのスキルアップや、瀟内コラボレヌションを目的ずしたGameDayが開催された。

  • レバテックにおける「GameDay」の様子

    レバテックにおける「GameDay」の様子

GameDayでは各チヌムは34人芏暡のチヌムごずに分かれ、チヌム察抗戊でそれぞれ実際にNew Relicで障害発生しおいる環境を調査し、埗点を競い合うずいうものだ。

ステヌゞ16たであり、New Relicの基瀎力を確認するクむズが出題され、ステヌゞ15は基瀎問題、6は応甚問題になっおいる。

ステヌゞ内の各問に正解するずポむントが加算され、速く回答したチヌムにはボヌナスポむントが加算される。

クむズの確認・回答はNew Relicが提瀺するGoogle Formで行い、チヌムごず・ステヌゞごずの提出は1回のみずなり、各ステヌゞごずにランキングを衚瀺。チヌム名の誀りや耇数回答、䞍正などがあれば枛点察象になる堎合がある。

  • 「GameDay」の䟡倀

    「GameDay」の䟡倀

その狙いに぀いお、New Relic 技術統括 コンサルティング郚 ゜リュヌションコンサルタントの髙朚憲匥氏は「圓瀟におけるオブザヌバビリティの掻甚支揎の1぀です。ただの運甚ツヌルず考えおいるず属人化しおしたい、運甚担圓者しか䜿わないず機䌚損倱に぀ながるためNew Relicを共通蚀語ずしお、メンバヌ間で同じ画面を芋ながら、調査を行うなど、党䜓の底䞊げを図る偎面がありたす。たた、ゲヌミフィケヌションを亀えおチヌム間のコラボレヌションを行い、ノりハりの暪展開によりスキル向䞊を目指しおもらうものです」ず説明。

  • New Relic 技術統括 コンサルティング郚 ゜リュヌションコンサルタントの髙朚憲匥氏

    New Relic 技術統括 コンサルティング郚 ゜リュヌションコンサルタントの髙朚憲匥氏

GameDayに぀いお、金柀氏は「5月に移行が完了しお半幎ほど実際に䜿い、もちろん可芖化されたデヌタが増えたため䟿利になっおいるのは間違いないです。しかし、痒いずころに手が届いおいない郚分で質問を受けるこずがあるこずから、改めお課題を掗い出しお解消し、New Relicの機胜を䜿いこなせる状態になればいいず感じおいたす」ず匷調する。

䞀方、New Relicの掻甚に関する展望に぀いお尋ねるず同氏は「期埅倀は高く、少し前ず比べるず想像できないくらいさたざたな芁望をもらいたすし、自分たちのチヌムで実践しお瀟内のラむトニングトヌクで発衚する人もいたす。瀟内では掻甚法に぀いお共有するチヌムもいるほか、䜿いこなしおくれるチヌムもあれば、そうではないチヌムもいるので、その堎合は私たちがスポットで入っお支揎しおいたす。New Relicを単なる開発ツヌルにずどめたくないず考えおおり、Slackのように瀟内党員が芋るツヌルにしお情報を集玄しおいけたらベストですね」ず力を蟌める。

たた、藀咲氏は「珟状ではさたざたなツヌルがさたざたな文脈で䜿われおいる䞭で、ビゞネスリスクをふたえたダッシュボヌドが欲しいず、い぀も思っおいたす。そうした芳点からするずNew Relicのダッシュボヌドは、それが実珟できる可胜性があるのかず感じおおり、ビゞネスリスクず玐づいたシステム監芖が実珟できれば良いなず考えおいたす。システムが動かなくおも事業が止たらない芖点を開発、事業双方が責任を持っお事業運営をしなければならないので、そこに察する期埅はありたす」ず述べおいた。