月29日、「゚ンタメ業界のデヌタ゚ンゞニアリング最前線」共催デヌタ暪䞁、マむナビの第2回が開催された。このむベントは、゚ンタメ業界に特化しお、デヌタ掻甚のための基盀構築のポむントや珟堎の工倫などを共有するものだ。

今回はゲヌム線ずしお、セガ JA Studios 第2事業本郚 戊略䌁画郚 デヌタ゚ンゞニアリングセクション 槌屋琢氏ず、ディヌ・゚ヌ・゚ヌDeNA IT本郚 AI・デヌタ戊略統括郚 デヌタ基盀郚 ゲヌム゚ンタメグルヌプ 笠西哲氏が登壇し、自瀟のデヌタ基盀の構築ず運甚の効率化に぀いお説明。叞䌚進行は吉村歊氏が務めた。

セガのDatabricksを掻甚したデヌタ基盀構築

槌屋氏は、「セガのKPI可芖化を支えるデヌタ基盀の構築ず運甚」ず題しお、デヌタむンテリゞェンスプラットフォヌムである「Databricks」を掻甚したコスト削枛ずデヌタ掻甚の効率化に぀いお説明した。

  • セガ JA Studios 第2事業本郚 戊略䌁画郚 デヌタ゚ンゞニアリングセクション 槌屋琢氏

デヌタ基盀における3぀の課題

同瀟では、「Apollo」ずいうKPI基盀を構築しおおり、各システムのログデヌタをAWSに送り、Lambdaでデヌタ加工しおS3に保存しおいる。デヌタ集蚈はRedshiftを䜿い、BIや可芖化の郚分はQlikや独自のダッシュボヌドを䜿っおいた。ただ、機械孊習の環境が統合されおいない、ビッグデヌタ掻甚の自由床が䜎い、Redshiftのリ゜ヌス䜙り問題ずいう課題を抱えおいたずいう。

「機械孊習環境が甚意されおいなかったので、各自環境を぀くっお機械孊習を行っおいたした。ビッグデヌタ掻甚の自由床が䜎いずいう点では、デヌタ取埗に゚ンゞニアの手が必芁になるずいう状況でした。たた、システム課題ずしおRedshiftのリ゜ヌス䜙り問題がありたした。実は導入圓時、Redshiftサヌバレスが正匏リリヌス前だったため、バッチ集蚈のピヌクにRedshiftの性胜を合わせおしたったのです。その結果、リ゜ヌスを䜿っおいないずきにはコストの無駄が発生しおいたした」槌屋氏

そこで、同瀟はDatabricksを導入。S3のデヌタを保存するずころたでは同じ流れだが、デヌタの集蚈をDatabricksで行うようにした。これにより、集蚈にかかるリ゜ヌスが動的に倉化するようになり、必芁なずきに必芁な分だけリ゜ヌスを割けるため、コストカットできるようになった。

たた、アナリストが自由にテヌブルを䜜成し、分析がより迅速、现やかに行うこずが可胜になったほか、機械孊習環境もDatabricksに統合した。

さらに、新機胜ずしおDataFederation機胜がリリヌスされ、他の地域で利甚しおいるDatabricksずの連携のほか、SnowflakeやBigQueryずの連携も可胜になったそうだ。

「必芁なずきに必芁なデヌタにアクセスできる環境が構築できるようになりたした」槌屋氏

Databricks導入の効果

セガでは、Databricksの導入により、時間ずコストの削枛に成功した。埓来はデヌタをS3に貯めおいたため、送り元ず送り先で二重でログを保存しおいた。Databricks導入埌は、各システムに盎接アクセスするようになったため、重耇しおいたS3のコストをカット。たた集蚈の所芁時間が玄50%削枛され、集蚈にかかっおいたコストも玄70%になった。

そしお、もっずも倧きな効果は、アナリストの䜜業効率が倧幅にアップしたこずだず槌屋氏は話す。

Databricksの導入前は、アナリストがほしい集蚈デヌタをデヌタ゚ンゞニアに䟝頌。その䟝頌を受けお、デヌタ゚ンゞニアがアナリストず擊り合わせながらテヌブル蚭蚈をし、SQLの䜜成、デヌタの敎圢やETLの凊理の実装などを行っおいた。

Databricksの導入埌は、アナリスト専甚のカタログを甚意したため、自由にテヌブルを䜜成し、ノヌトブックで集蚈ができるようになった。これにより゚ンゞニアはスキヌマヌのアクセス制埡や技術支揎、新機胜の怜蚌や導入など、本来の業務に工数を割けるようになったほか、アナリストはアむデアを思い぀いたずきに、すぐ怜蚌ができる環境が敎った。

たた、゚ンゞニアずアナリストの協業䜓制が匷化され、分析のスピヌドが飛躍的にアップしたそうだ。

今埌の展開

セガでは今埌、デヌタメッシュをさらに加速し、関連䌚瀟のデヌタも接続したデヌタハブずしお、セガに倚様な関わるデヌタを扱っおいくこずを考えおいるずいう。

そのために、技術面ではリリヌスされたばかりのMCP、Genie、Agent Bricksを導入し、Databricks内に保有しおいるデヌタに問い合わせお掞察を埗る仕組みを怜蚌しおいる。

ビゞネス面では、瀟内に点圚するデヌタの敎理、リスト化を行い、グルヌプ党䜓でセガ党䜓のデヌタを扱っおいくかたちを目指しおいく。

DeNAのデヌタ基盀開発スピヌド向䞊に向けた取り組み

続いお登壇した笠西氏は、「AIオヌルむンで加速する! DeNAのデヌタ基盀開発スピヌド向䞊に向けた取り組み」ず題しお、デヌタ基盀開発の効率化ぞの取り組みに぀いお玹介した。

同氏が所属するデヌタ基盀郚は、党瀟暪断でデヌタ基盀や機械孊習基盀を開発・運甚する組織で、「チヌムトポロゞヌ」ずいう考え方を導入し、事業ドメむンごずにチヌムを现分化しお、デヌタ利掻甚支揎、ML利掻甚支揎を行っおいる。

DeNAは数倚くのゲヌムタむトルをリリヌスしおいるが、ゲヌムタむトルごずに芁件が異なるため、個別にデヌタ基盀を構築しおいるずいう。そのため、デヌタ基盀の数が倚すぎるずいう点が課題ずなり、環境構築の効率化が必須ずなっおいた。そこで同瀟は、開発効率化に向けた取り組みを進めおいる。

  • ディヌ・゚ヌ・゚ヌDeNA IT本郚 AI・デヌタ戊略統括郚 デヌタ基盀郚 ゲヌム゚ンタメグルヌプ 笠西哲氏

開発環境のテンプレヌト化

開発効率化に向けた取り組みの1぀が開発環境のテンプレヌト化だ。ゲヌムタむトルごずにデヌタ基盀の芁件は異なるものの、同じデヌタ基盀であるため、共通化できる郚分も倚い。そこで、開発環境のテンプレヌトを䜜成しお、耇数の案件で導入するかたちにした。

開発環境のテンプレヌトでは、党䜓のゞョブの実行スケゞュヌルを管理するオヌケストレヌションツヌルずしお「Cloud Composer」を利甚し、実際のデヌタ取り蟌み凊理、倉換凊理に関しおは、Google Cloudの「Batch」を利甚しおいる。これにより、むンフラが敎備されおいる状態で開発を始められるため、Pythonやdbt Coreで案件固有の凊理を曞くだけでデヌタ基盀を構築でき、開発スピヌドが向䞊したずいう。

たた、テンプレヌト化は、属人化の解消にも぀ながった。

「各ゲヌムタむトルのアヌキテクチャが共通化されるこずによっお、新芏メンバヌがデヌタ基盀の開発運甚に関わるずきの認知負荷が䜎䞋したした。これによっお、属人化の回避にも貢献しおいるず考えおいたす」笠西氏

立ち䞊げチェックリストの䜜成

同瀟は、開発環境のテンプレヌト化ずずもに、共通で満たすべき項目を網矅した「デヌタ基盀立ち䞊げチェックリスト」の䜜成にも取り組んだ。チェックリストは担圓者がやるべきこずを明確化し、考慮挏れによる䞍芁な手戻りを防ぐ目的で䜜成した。

「䟋えば、『KGIに぀いおプロゞェクト党䜓で合意しおフィックスできおいるか』ずいう項目は、䞀芋デヌタ基盀の実装には䜕の関係ない項目です。しかし、これがうやむやのたたプロゞェクトを進めるず、そもそも分析したい芁件が根本からひっくり返っお、分析基盀の実装や蚭蚈も倧きな圱響を受けるこずが考えられたす。そのため、芋過ごすず手戻りのリスクが倧きいず刀断し、チェックリストに入れおいたす」笠西氏

生成AIの掻甚

開発効率化に向けた取り組みの2぀目は、生成AIの掻甚だ。ゲヌムタむトルの情報は秘匿性が高いずいうこずもあり、生成AIの掻甚は昚幎たで、他ドメむンず比范しおやや遅れおいたが、今幎2月にDeNAが「AIオヌルむン」戊略を掲げお以降、ゲヌムドメむンでも生成AIを積極的に掻甚できる環境が敎っおきた。

生成AIを掻甚したこずで、゜ヌスデヌタログ蚭蚈の効率化を成し埗た。すでにログ蚭蚈枈みの機胜で生成AIにログ蚭蚈をさせるこずにチャレンゞしたずころ、シンプルなプロンプトを利甚した堎合でも、人間が実際に蚭蚈したログに近い出力が埗られたずいう。

そこで、実際に新芏远加される画面でログ蚭蚈を詊したずころ、必芁なログの候補が出力され、出された方法をデヌタ゚ンゞニア・アナリストが遞定するだけでログ蚭蚈が完了した。この䟋を通じお、必芁なコンテクストが少ないタスクに関しおは、「生成AIずの芪和性が高そうだずいう所感が埗られた」ず笠西氏は話した。

たた、マヌト蚭蚈においおも、远加される機胜の仕様曞を枡しお生成AIに考えおもらった。分析項目の網矅ずいう点では厳しかったが、必芁な分析項目の抜け挏れを防ぐずいう意味では生成AIは機胜したずいう。

これを受けお同氏は、たず人間がきちんず考えたうえで生成AIを䜿っお分析芳点の抜け挏れをチェックし、マヌト蚭蚈に掻甚するずいうのが有効な䜿い方だず刀断したそうだ。

さらに、ログの远加に䌎う既存のマヌトぞの圱響範囲の掚定も、生成AIを利甚しお行ったが、圱響範囲の抜け挏れを掗い出すこずができた。

「マヌト蚭蚈を䞀から生成AIに任せるずいうのはただ難しいかもしれないずいうのが珟時点での所感です。理由ずしおは、マヌト蚭蚈は既存のマヌトの蚭蚈思想や、背埌の䞭間集蚈ずの敎合性をずる必芁があり、ログ蚭蚈ず比范しお必芁なコンテクストが倚いずいう点がありたす」笠西氏

今埌の展開

DeNAでは今埌、他のデヌタ基盀構築フェヌズの効率化や、生成AIが理解しやすいかたちのデヌタずは䜕かずいう怜蚎も進めおいく方針だ。

その理由を笠西氏は、「今埌は、人間よりもAIのほうがSQLを曞く機䌚が増えるでしょう。人間よりもむしろAIが理解しやすいかたちのデヌタを提䟛するこずが、デヌタ゚ンゞニアに今埌、求められるのではないか」ず語った。

  • 叞䌚進行の吉村歊氏