まずは各データの分析から......

ラボの概要を把握した上で、いよいよデータ分析の体験だ。検索キーワードに選んだものはベスト8進出を決め、これから決勝トーナメントを控え、現在まさに検索数が多いであろうと推測できるラグビーワールドカップにした。

そして、比較キーワードはサッカーワールドカップとし、ずぶの素人である筆者がデータ分析に挑戦するため、宮本氏とヤフー データ&サイエンスソリューション統括本部 事業開発本部アナリシスの澁川高昌氏の教えを乞いながら体験してみた。利用するツールは「Tableau」だ。

まずは、検索ランキングから。「ラグビーワールドカップ」を含むキーワードの中では「チケット」が一番多く検索されており、次いで日程や会場、ボランティアなど日本開催だからこそ、検索されるキーワードが目立つ結果となった。

  • 「ラグビーワールドカップ」を含むキーワードのランキング

    「ラグビーワールドカップ」を含むキーワードのランキング

「サッカーワールドカップ」を含むキーワードでは「日程」が多く検索されているものの、直近での大きな話題がないことから、昨年のロシアワールドカップや今年開催した女子ワールドカップへの関心が多いものだった。

  • 「サッカーワールドカップ」を含むキーワードのランキング

    「サッカーワールドカップ」を含むキーワードのランキング

続いて「長期トレンド」「週次トレンド」「日次トレンド」のグラフで両競技の推移を比較してみる。

まず、長期トレンドから見てみよう。上段のグラフでは判断が難しいところだが、下段のパーセンテージでは互いのワールドカップ開催時期とリンク(サッカーの場合、アジア予選ともリンク)する形で増えている。例えば、サッカーは2014年開催のブラジルワールドカップ後から急激に下降線をたどるが、ラグビーでは2015年のワールドカップ開催を控えていたことから、徐々に増加していることがわかる。

  • 長期トレンド

    長期トレンド

週次トレンド(2月~10月中旬までの集計値)では、7月中旬からラグビーワールドカップが増加し、開幕直前には爆発的に増加している。日次トレンド(9月~10月中旬までの集計値)は、グラフを見れば一目瞭然だが、ラグビー日本代表の試合開催日に急激に増加しており、この間サッカーはラグビーワールドカップ期間中にアジア二次予選などを含めて民放で4試合がテレビ中継されているものの、多くの人がラグビーに関心を寄せているということが把握できる。

  • 週次トレンド

    週次トレンド

  • 日次トレンド

    日次トレンド

次いで、性別・年代を分析するためクロス集計とデモグラフィック比較を用いた。クロス集計ではサッカーワールドカップの場合、性別・年代でバラつきはあるものの、男女問わず老若男女が関心を持っていることがうかがえる。

ラグビーワールドカップでは10代以下と70代以上の女性が検索した形跡がないほか、女性の総計を見てもサッカーが30.4%(記事中では四捨五入して表記)に対して、ラグビーは21.0%と10ポイント程度の差がある。しかし、男性ではラグビーの30代が16.1%、40代が28.8%、50代が20.5%といずれもサッカーの各年代に加え、総計でも上回っている。デモグラフィック比較でもクロス集計と同様の結果となった。

  • クロス集計

    クロス集計

  • デモグラフィック比較

    デモグラフィック比較

最後は、都道府県別検索特徴度のヒートマップ(赤に近づけばスコアは高い)。当然のことながら、ラグビーは試合の開催地が赤みを帯びている地域だ。一方、サッカーはラグビーと比較すると、全国的に赤みを帯びている地域が多い。

  • ラグビーワールドカップの都道府県別検索特徴度のヒートマップ

    ラグビーワールドカップの都道府県別検索特徴度のヒートマップ

  • サッカーワールドカップの都道府県別検索特徴度のヒートマップ

    サッカーワールドカップの都道府県別検索特徴度のヒートマップ