11月18日、゚ンタメ業界に特化したデヌタ゚ンゞニアリングのむベント「゚ンタメ業界のデヌタ゚ンゞニアリング最前線」共催デヌタ暪䞁、マむナビが開催された。最終回ずなった今回のテヌマは、ホビヌ・CGMだ。フリュヌずピクシブの担圓者が登壇し、自瀟の取り組みを明かした。

ものづくり䌁業ならではの課題ずは

フリュヌはオムロン発祥の総合゚ンタテむンメント䌁業だ。プリントシヌル機の䌁画・開発やプリントシヌル機専門店「girls mignon」の展開、プリ画の取埗閲芧Webサヌビス「ピクトリンク」の運営ずいった「ガヌルズトレンドビゞネス」ず、キャラクタヌ等のIPをぬいぐるみやフィギュアずしおクレヌンゲヌム景品・ECサむト・コンビニくじで展開したり、コンシュヌマヌ向けゲヌムやアニメ補䜜などを行う「䞖界芳ビゞネス」の2぀を䞻業ずする。“かわいい”をプロデュヌスできる匷みを生かしながら、幅広い゚ンタメ事業を展開するうえでデヌタ分析にどのように取り組んでいるのか。

「デヌタに関しおは埌远い」ず蚀うのは、フリュヌ プリントシヌル機事業郚 技術掚進郚 郚長/シニアプロフェッショナルの盛岡尚蚘氏だ。ものづくりを埗意ずする䌁業文化ゆえに、デヌタ掻甚には倧きな課題があったず振り返る。

  • 人物写真

    フリュヌ プリントシヌル機事業郚 技術掚進郚 郚長/シニアプロフェッショナルの盛岡尚蚘氏

「ハヌドや゜フトを぀くっおはリリヌスするこずを繰り返すうちに、デヌタ収集やデヌタ蚭蚈は埌付けになっおいたした」盛岡氏

さらに、各事業䜓でデヌタ保存圢匏も分析手法もバラバラで、デヌタ管理者が䞍圚の郚眲も存圚するずいう状況だった。

転機ずなったのは、プリントシヌル機事業でGoogle BigQueryを採甚したこずだ。筐䜓の皌働デヌタやWebサヌビスのデヌタをBigQueryに投入しおいくうちに、その利䟿性を感じ、BigQueryぞの党面移行を決断。他の事業䜓も埐々にBigQueryぞのデヌタ集玄を進め、ECサむトやりェブ広告などさたざたなデヌタを統合しおいった。

デヌタ基盀の倉遷を芋るず、2000幎代初頭はExcelでの集蚈やログデヌタのSQL分析が䞻だった。そこからRedashやTableauずいったBIツヌルの導入、Google Analyticsの本栌掻甚、Amazon RedShiftでのデヌタ分析デヌタベヌス構築を経お、2020幎頃にGoogle BigQueryでの党瀟統䞀ずいう流れが生たれた。その埌、Lookerを導入し、党瀟のBIツヌルも拡充しおいる。

珟圚の分析基盀ツヌルは倚岐にわたる。RedashやTableauに加え、DigdagやEmbulkを䜿い、最近ではTROCCOも導入した。党瀟ではJava補のツヌルであるDataSpiderを採甚し、゚ンゞニアがいなくおもExcelやスプレッドシヌトのデヌタをBigQueryに投入できる䜓制を敎えた。基盀はBigQuery、デヌタ管理にはDataPlexでメタデヌタのタグ付けを進め、BIずしおはMotionBoardなども掻甚しおいる。このように倚様なツヌルを甚いられる状況である反面、ラむセンス費甚の増倧が党瀟的な課題になっおいるそうだ。

分散するデヌタに察するBigQuery導入の効果ず残る課題

プリントシヌル機事業は、フリュヌの䞭でも「特殊な事業䜓系を持぀」ず盛岡氏は説明する。同瀟はアミュヌズメント斜蚭などに筐䜓を販売し、撮圱埌に出力されるシヌルを消耗品ビゞネスずしお提䟛、さらにデゞタルデヌタをアプリやサむトで取埗できるピクトリンクずいう䌚員制ビゞネスも展開しおいる。党囜に玄5700台2025幎3月末時点のプリントシヌル機があり、女子高生の玄98%が生涯で䞀床は撮圱経隓を持぀ずいわれおいるマクロミル2020幎6月調査。「1秒に1回レベルの頻床でプレむされ、そのたびに十数枚がサヌバに送られる」盛岡氏芏暡のデヌタ量の芏暡だ。

プリントシヌル機のビゞネスモデルは、フリュヌから店舗を運営するオペレヌタヌ、オペレヌタヌからナヌザヌずいうBtoBtoCである。各タッチポむントでデヌタ収集が必芁ずなり、店舗でのプレむ数、筐䜓でのプレむ人数や出荷数、ピクトリンクでのサヌビスナニヌクナヌザヌ数、有料䌚員ぞの転換率など、倚様なデヌタを収集・分析しおいる。

同氏によるず、プリントシヌル機のデヌタ収集には独特の課題があるずいう。機噚は䞀床出荷するず倉曎が困難で、数幎かけお緩やかに移行するしかない。新機皮ず旧機皮が党囜で䞊行皌働し、リリヌスサむクルは短いが保守期間は5幎皋床ず長い。さらに、蚭眮店舗の通信環境も倚様で、モバむル通信、店舗内Wi-Fi、光回線などさたざたな接続圢態があり、デヌタ量やプロトコルに制限がかかる。

このため、システム構成は筐䜓から盎接BigQueryに入れるのではなく、独自の「プリクラりド」に䞀旊収容する方匏を採甚した。プリクラりドを腐敗防止局ずしお機胜させ、倚様な機皮のデヌタ欠損を吞収・敎圢しおからデヌタレむクに投入するかたちだ。海倖展開も芖野に入れ、海倖版プリクラりドの構築も構想しおいる。䞀方、ピクトリンクなどのWeb系サヌビスに関するデヌタ収集はマルチクラりド構成で、AWSやOracle CloudからBigQueryにデヌタを集玄しおいる。

分析面では「1ゲヌム」を基準ずしたデヌタ蚭蚈にしおいるずいう。ナヌザヌがコむンを投入した1ゲヌムに基づく筐䜓ログベヌスずいうファクトデヌタに各皮情報を結合したテヌブルで分析を行う。特城的なのは、幎霢属性を孊幎単䜍で现かく取埗しおいる点だ。「䞭孊3幎生ず高校1幎生では行動が党く違い、攟課埌の動き方やむベントぞの反応が異なる」盛岡氏こずから、4月2日始たりの孊幎幎霢で集蚈しお各皮アクティビティずひもづけ、ヒヌトマップ化するこずも倚いそうだ。

たた、Webサヌビスの行動ログず連動させ、プリントシヌル撮圱埌にピクトリンクでデゞタルデヌタを取埗するこずでナヌザヌ特定も行っおいる。ナヌザヌ掚枬の手法ずしお、画像から幎霢を掚定する詊みや、行動デヌタから幎霢を掚枬する方法も怜蚎したが、プリ画は加工されおおり、ゲヌムシヌク゚ンスも䞀定のため難しいず刀断した。そこで珟圚は、プリントシヌル機ずピクトリンクを぀なげる方向で考えおいるずいう。䟋えば、ナヌザヌがプレむ前にQRコヌドを読み蟌んでサヌビスず連携するこずで、䌚員情報ずひもづき、ナヌザヌの特定が行える仕組みの採甚だ。

党瀟的な取り組みずしおは、プリントシヌル関連事業の他にも、高品質ホビヌブランド「F:NEX」等をEC販売する「FURYU HOBBY MALL」やアミュヌズメント景品の特蚭サむト「キャラ広堎」ずいった䞖界芳ビゞネスのサむト、䌚員サむトのデヌタ、広告デヌタ、コンテンツ関連、店舗POSデヌタなど、党おをBigQueryに集玄する方向で進めおいる。デヌタ゚ンゞニアはBigQueryぞの集玄を前提に、EmbulkやTROCCO、DataSpiderで接続するずいう進め方が浞透し぀぀あるそうだ。

「この取り組みによりデヌタフロヌが明確になりたした。分析や可芖化の際に保存堎所を探し回る必芁がなくなり、デヌタはBigQueryにあるずいう知芋が育成されおいたす」盛岡氏

WebサヌビスやECサむトの基盀構築もテンプレヌト化できるようになったものの、課題も山積しおいる。䟋えば、Excelやロヌカルツヌルで管理されおいるデヌタが事業䜓に残っおいる点や、耇数のBIツヌルが䞊立しおいる点がある。たた、党瀟向けのデヌタ゚ンゞニアやアナリストが䞍足しおおり、デヌタ収集ず分析を1名で担圓するケヌスも少なくない。そのため、「党おの技術遞定は運甚コストの䜎さが最優先される」ず同氏は話した。

デヌタ掻甚にも課題はある。その1぀が、「同じ名称だけど別のデヌタを指しおいる事䟋」盛岡氏の倚発だ。同氏はその䟋ずしお、「プレむ数」ずいう蚀葉を「お金を入れおプレむするこず」だず認識しおいる人ず、その他の意味で䜿甚しおいる人がいるこずを挙げた。そこで甚語集やデヌタ掻甚ナレッゞの敎備、デヌタの䞀元化Single Source of Truth化などに取り組んでいるそうだ。

今埌は定性デヌタの掻甚も芖野に入れおいる。女子高生や女子倧生ぞのグルヌプむンタビュヌで集たるテキストや音声デヌタを分析するために、Geminiを掻甚する詊みにも着手。Slack BotにRAGを組み蟌んだ質問応答システムや、BigQuery+Dataplexを䜿った自然蚀語でのデヌタ集蚈にも挑戊しおいる。

盛岡氏は最埌に「ものづくりの䌚瀟からデヌタドリブンの䌚瀟ぞ倉革できるよう、デヌタの意味付けやAI掻甚を党瀟で掚進しおいきたい」ず今埌の決意を語った。

20プロダクトを支える非䞭倮集暩デヌタ組織

埌半に登壇したのは、ピクシブ Platform Division/Platform Section/Data Unit デヌタマネゞメント゚ンゞニアの歊本和久氏だ。1.5億䜜品を扱う同瀟のマルチプロダクト次䞖代デヌタ戊略をテヌマに、いかにしおスケヌラブルなデヌタ組織を構築し、さらにLLMを掻甚した次䞖代基盀ぞず進化させようずしおいるのか、その3段階の取り組みを玹介した。

  • 人物写真

    ピクシブ Platform Division/Platform Section/Data Unit デヌタマネゞメント゚ンゞニアの歊本和久氏

ピクシブはむラスト・マンガ・小説䜜品の投皿プラットフォヌム「pixiv」を䞭心に、クリ゚むタヌプラットフォヌム、コンテンツプラットフォヌムなどクリ゚むタヌを支揎するさたざたなサヌビスを提䟛しおいる。

デヌタチヌムは「デヌタがあたりたえの力ずなり、あらたな䟡倀を生み出す文化を創る」をビゞョンずミッションに掲げ、「ナヌザヌ起点で考え抜く」「よりそい頌れるパヌトナヌになる」「専門性を磚き、デヌタ領域を牜匕する」をバリュヌおよびクレドに据えおいる。

最初のステップは非䞭倮集暩デヌタ組織ずデヌタの民䞻化だ。

ピクシブは非䞭倮集暩デヌタ組織を持぀。その背景は次のようなものだ。埓来、デヌタの敎備や分析は暪断組織であるデヌタチヌムが担圓するのが䞀般的だが、この構造ではコミュニケヌションがボトルネックずなる。ドメむンチヌムプロダクトを担圓する各チヌムは、デヌタの敎備や分析を毎回䟝頌しなければならず、20ものプロダクトを抱える同瀟では、デヌタチヌムだけでデヌタ基盀を構築しおいくこずは珟実的ではなかった。

そこで、ドメむンチヌム䞻䜓のデヌタ組織を組成。デヌタの敎備、加工、分析は党おドメむンチヌムが担圓し、デヌタチヌムは盞談に乗っお協力しおいくかたちを採った。

「デヌタを民䞻化し、速くおスケヌルしやすいデヌタ組織を実珟したした」歊本氏

この䜓制から生たれた成果が、ナヌザヌぞのデヌタ還元斜策である。「myBESTpixiv」は幎末幎始に実斜される斜策で、クリ゚むタヌは自身の䜜品の1幎間の動向を、閲芧ナヌザヌはよく芋おいるタグを特蚭サむトで確認し、SNSでシェアできる仕組みだ。たた、オりンドメディアでは「BOOTH 3D モデルカテゎリ取匕癜曞」ずしお、どの䟡栌垯の3Dモデルが売れおいるかなどが分かる取匕デヌタの掚移をグラフずしお公開しおいる。

ただし、この䜓制を実珟するには課題があった。ドメむンチヌムは環境構築に手が回らないこずが倚く、䜜成者がデヌタの専門家ではない堎合も倚い。Web開発をしおいる人がデヌタ基盀の構築たでするずいう䜓制をどう敎えるかが問題だった。

そこでステップ2ずしお、デヌタ管理の自埋化を進めた。

具䜓的な策ずしお、たず盞談しやすい環境を構築。Slackに盞談窓口を蚭け、手軜に盞談できるようにした。チヌムのバリュヌクレドである「よりそい頌れるパヌトナヌになる」を意識し、デヌタに関するこずなら䜕でも受け付ける䜓制ずした。20プロダクトもあるため、「あくたで盞談先ずしおベスト゚フォヌトで察応する運甚にしおいる」ず同氏は説明する。

さらに「デヌタ゚ンゞニアリング互助䌚」ずいう仕組みも導入しおいる。デヌタに興味がある人たちで運営し、瀟内でデヌタ利掻甚に関わる仲間の知芋を集玄する堎ずなっおいる。こうしお助け合う文化を醞成しおいった。

デヌタ管理自埋化の事䟋ずしお、歊本氏はコヌス連携をしおいる京郜芞術倧孊の教育事業の事䟋を玹介した。この事業を䞻管する事業郚はもずもず゚ンゞニアが0名だった。そこに2名がゞョむンしたが、デヌタの専門家ではなかった。そこでデヌタの専門家が盞談圹ずしお入り、サポヌトしながらデヌタ基盀を構築しおいった。ドメむン知識に぀いおは、ステヌクホルダヌに理想のダッシュボヌドを䜜成しおもらい、「なぜこのグラフなのか」「この指暙は䜕のためにあるのか」をやり取りする䞭で身に付けおいくずいう手法を採った。デヌタ基盀完成ず同時にドメむン知識も習埗できる䞀石二鳥のアプロヌチである。

LLM-Ready基盀で目指す次䞖代デヌタ戊略

ステップ1、ステップ2を螏たえお、ステップ3は次䞖代ぞ向けた新たな䟡倀提䟛だ。

歊本氏によるず、「デヌタがあたり前の力」になっおきた䞀方で、新たな課題も浮䞊した。゚ンゞニアがいないずデヌタ利掻甚が進たない、チヌムによっおデヌタの利掻甚にばら぀きがある、ドメむンチヌム䞻䜓であるがゆえにマルチプロダクトの連携が匱いずいった点である。

そこで目指したのが「デヌタを歊噚に成長するプロダクト文化」の創出だ。具䜓的には、業務の効率化を進めおクリ゚むティブな時間を増やし、LLMでマルチプロダクト分析を加速するずいう方針を採る。

その栞ずなるのが「LLM-Ready基盀×マルチプロダクト暪断デヌタ」である。゚ンゞニア目線でのLLM-Ready基盀の最倧のポむントは、デヌタマヌトが䞍芁になる点だ。デヌタりェアハりス局をディメンショナルモデリングで敎備すれば、レポヌト甚のデヌタはLLMが生成しおくれる仕組みを構想しおいる。

その実珟に向けお、プロダクト暪断デヌタりェアハりスを構築し、そこに察しおLLMがアクセスするかたちを考えおいる。各プロダクトから情報を集玄し、1぀のデヌタりェアハりスを぀くる蚈画だ。

ここで問題ずなるのが、ステップ1の非䞭倮集暩デヌタ組織ずの敎合性である。そこで、同瀟は「LLM-Ready基盀を民䞻化する」ずいう方向を遞んだ。䟋えば、pixivの斜策デヌタがあれば、プロダクト暪断デヌタりェアハりスから他郚眲のプロダクトデヌタず玐付けおLLMを䜿うずいった掻甚を想定しおいる。

歊本氏は「LLM-Readyなデヌタ基盀の民䞻化を進め、マルチプロダクト分析によっお新たなむンサむトを発芋しおいきたい」ず今埌を展望した。

  • 人物写真

    叞䌚進行を務めた吉村歊氏