広告効果の測定という観点で、国内テレビCM市場の出遅れを指摘する声は多い。「テレビの前の人は本当に画面を見ているのか」という点がブラックボックスになっているからだ。

この課題を解決する上で大きな役割を果たすことが期待されているのが、REVISIO株式会社が提供する新たなデータサービスだ。人体認識技術と調査機器により、「誰がどんな番組やCMを視聴しているか」だけでなく「誰がいつどんなシーンに注目したか」まで可視化できるようになった。

番組制作におけるREVISIO提供データの活用も進む中、同社が直面していた大きな課題が、リアルな視聴データを1秒ごとに取得して加工する際の処理スピードの高速化だった。また、データ量・サービスの種類・顧客の増加によって生じる データベースの負荷増大も、高コスト化につながっていた。

そんなREVISIOはデータ基盤を刷新することにより、処理速度、安定性、コストの課題をまとめて解消。特に運用コストは、移行前と比べて4割以上削減できたという。この劇的な改善を実現した、同社の取り組みに迫る。

一時的な処理量増大がデータ基盤の不安定化、高コスト化につながっていた

ある調査によると、日本人は1日に約2.5時間テレビを視聴しているという。いうなれば人生の10%以上をテレビの前で過ごす計算になる。REVISIO株式会社(リビジオ)は、私たちがテレビの前で過ごす10%の時間をデータによって明らかにする会社と言うことができる。

もちろん「世帯でどんな番組が見られているか」という世帯視聴率データは早くから存在する。だが「テレビの前に人がいるのか」や「視聴しているのは誰か」という情報についてはモニターである視聴者が手動入力する必要があり、ましてや「テレビの前の人は本当に画面を見ているのか」という点についてはブラックボックスというのが実情だった。

独自開発の人体認識技術により、この課題を解決したのがREVISIOである。そのポイントは大きく二つある。一つは、人体認識センサーでテレビの前に誰がいるのか識別すると同時にその人の顔がテレビ画面に向いているか否かを判別するテクノロジー。そしてもう一つは画面に映るコンテンツを音声により自動認識するテクノロジーである。二つのデータを1秒単位で組み合わせることで「誰がどんな番組・CMを見ているか」だけでなく、「誰がいつどんなシーンに注目したか」まで把握することが可能になる。

創業は2015年。2023年現在、データ取得するのは、関東2000世帯、関西600世帯の6000人弱に及ぶ。そのデータに注目したのは、テレビCM出稿企業だった。創業者の代表取締役社長 郡谷 康士氏はこう説明する。

「国内テレビCM市場は1.7兆円ほどあります。その料金は番組視聴率に基づいて決められることが一般的ですが、テレビの前に本当に人がいるかどうかも含め、誰が見ているか、正確には分かりませんでした。しかし当社のサービスを利用いただくことで、CMのターゲット層と視聴者がどれだけ合致しているかという点まで含め、把握することが可能になります」

近年は、番組制作におけるREVISIO提供データの活用も進んでいるという。リアルな視聴データを1秒ごとに取得し、ニーズに応じてそれを加工して提供する同社のビジネスモデルにおいて、処理スピードの高速化は当初から大きな課題であり続けてきた。

「サービス拡充を常にコスト増が追いかけるという構造は、事業をスケールアップする上で大きな課題でした。事業のサスティナビリティという観点からも、なんとかしなければならないという認識は創業当初から持ち続けていました」(郡谷氏)

Snowflakeのスムーズなスケールアウト機能に注目

特に大きな問題になったのは、データ量、サービスの種類、顧客の増加によって生じるデータベースの負荷増大への対応だった。執行役員 データテクノロジー担当の森下 光之助氏はこう説明する。

「データ量の増加は言うまでもなく、新しいサービスを開発・提供しようとした場合も、日々のデータ処理量は増大することになります。その結果、処理速度が低下すると共にデータ基盤が不安定化し、その解決のために新たなコストが発生するという状況が続いてきました。その解決に向け、当社が注目したのがSnowflakeのデータ基盤でした」

サービス提供開始以来、Amazon Redshiftを利用してきた同社がSnowflakeに注目したのは、ネット上でその名が目立ちはじめた2021年秋のことだった。2022年4月には本格的な検討を開始し、6月からは1カ月半のトライアルを実施。データ移行手法、従来のSQLへの対応、処理速度、コストなどの各観点から評価を行った。その結果、すべてにおいて好結果が得られたことで2022年7月にデータ基盤の全面移行が決断された。なお、評価にあたってはRedshift Serverlessとの比較も実施したが、移行工数を除けばほぼ全項目でSnowflakeが優位だったという。

移行工数が増える理由は、双方のSQLの細かな差異にあった。15TB(圧縮後)、510テーブル、196ビュー、ETL/ELT数11種類のデータ基盤移行において、この問題は大きな課題だった。その解決のため同社はSQL変換ツールを独自に開発。RedshiftからSnowflakeへの移行工数の大幅削減を実現すると共に、ツールをオープンソースとして公開している。移行のリード役を務めたエンジニアリングマネージャーの片岡 基氏はこう振り返る。

「トライアルを通しSnowflakeの可能性を強く実感した一方、既存システムが大きければ大きいほど、リスクやコストが大きくなることも分かりました。そのため変換ソフトの意義は開発当初から認識し、移行を終えたら絶対公開しようという話もメンバー間でしていました。苦労して作ったツールの公開を不思議に思う方もいるかもしれませんが、そもそも当社にはスキル共有を活発に行うカルチャーがあったことも大きかったと思います。さらに言えば、それによって多くの方とSnowflakeでデータが共有できるようになるわけですから、公開は当社にとってもメリットがあると考えています」

変換ツールのオープンソース化も含めた同社の取り組みは、2023年度のSnowflakeのData Driver of the Year受賞につながるなど、大きな注目を集めている。

処理速度、安定性、コストのすべての課題が劇的に改善

約1カ月の並行稼働期間を経て、Snowflakeへの完全移行を終えたのは2022年12月のことだ。本格運用による効果は、移行にあたったメンバーにとっても驚きだったという。

「ちょっと良くなったとか、少し改善されたというレベルの話ではなく、パフォーマンス、安定性、コストのすべてにおいて、その効果はまさに劇的でした。一例が、バッチ処理の高速化です。データ量増大に伴い、夜間バッチを翌朝までに終えることが困難な状況になりつつあったのですが、移行後は以前の半分の時 間で処理を終えられるようになっています。また、ニアゼロメンテナンスという言葉通り、データ基盤が不安定化するたびにエンジニアがサイジングを最適化するというストレスが掛かる作業が不要になった点も大きな成果の一つです」(片岡氏)

コスト面の効果も大きい。

「移行前との比較では4割以上の運用コスト削減が実現しています。移行後もデータ量や処理の種類が増え続けていることを考えると、5割近く削減できていると言っても言い過ぎではないように思います」(森下氏)

一口に言えば、ウェアハウスのサイズ選択の柔軟性、マルチクラスタ設定による自動スケーリングといったSnowflakeの特長がパフォーマンスの向上、安定性の実現、コスト削減のすべてに関わっていると言えるだろう。さらにユーザビリティ向上も注目したいポイントの一つだ。

「当社の場合、ユーザーにはデータ分析ツールの提供先顧客と社内のデータサイエンティストやカスタマーサクセスの二通りがありますが、Snowflakeへの移行は双方からとても好評です。顧客の例では、新たなサービスを利用する際の処理の関係上、待ち時間が発生していたのですが、それが大幅短縮化できています。社内の例では、BIツールのレスポンス速度や安定性の向上には感動の声があがっています」(片岡氏)

マーケットプレイスを活用し多くのユーザーにデータを提供したい

スピーディなデータ共有を可能にするSnowflakeのデータシェアリングやマーケットプレイスの活用は、データ企業である同社にとり今後の重要なテーマの一つだ。

「当社の一番のプロダクトはデータです。実際には、提供するデータ分析ツールを利用するだけでなく、他社のデータ分析ツールに当社のデータを加えるという使い方もあるわけですが、本質的には顧客が使いやすい形でデータを提供できることが重要であると考えています。そういう意味でSnowflakeのデータシェアリングやマーケットプレイスといった機能・サービスと当社の相性はかなり高いと考えています。今後より多くのお客様がREVISIOのデータを活用してもらうための基盤として注目しています」(郡谷氏)

広告出稿の費用対効果測定の重要性は日増しに高まっている。これまでブラックボックスだったテレビCMの費用対効果測定において、REVISIOのデータがこれまで以上に大きな意味を持つことは間違いない。

「『ビッグデータ』というバズワードを目にしなくなった理由の一つに、データ量が大きいことイコール価値ではないことを多くの方が認識したことが挙げられます。創業以来、当社はいかに価値あるデータを顧客に届けるかということに力を注いできました。この課題に今後はSnowflakeさんと共に挑んでいきたいと考えています」(郡谷氏)

■事例先企業情報
企業:REVISIO株式会社
所在地:東京都千代田区大手町一丁目6番1号 大手町ビル

■ご利用のSnowflakeワークロード
・データエンジニアリング
・データレイク
・データウェアハウス
・データサイエンス
・データアプリケーション
・データシェアリング

■このストーリーのハイライト
・処理速度の劇的向上により多様なデータ活用を実現
・サービス拡張に伴う、一時的な負荷増大にスムーズに対応
・スムーズなウェアハウスサイジングにより運用コストを4割以上削減

Snowflakeについて

Snowflakeは、あらゆる組織がSnowflakeデータクラウドを用いて自らのデータを最大限に活用するのを支援します。多くのユーザー企業がデータクラウドを利用して、サイロ化したデータの統合、データの発見と安全な共有、多様な人工知能(AI)/機械学習(ML)および分析ワークロードの実行を進めています。データやユーザーがどこに存在するかに関係なく、Snowflakeは複数のクラウドと地域にまたがり単一のデータ体験を提供します。多くの業界の何千社もの企業(2023年7月31日時点で、2023年Forbes Global 2000社(G2K)1 のうち639社を含む)が、Snowflakeデータクラウドを全社で幅広いビジネスに活用しています。詳細については、snowflake.com/ja/をご覧ください。

関連リンク


※本記事はSnowflakeから提供を受けております。

[PR]提供:Snowflake