本連載は今回で最終回となる。そこで、Excelでデータ分析を行うときに必要となるスキルについてまとめておこう。かなり大雑把な内容ではあるが、Excelを上手に活用していくための所論として参考にしてもらえれば幸いだ。
データ分析に必須の数式入力
データ分析を行うには「数学や統計学の詳しい知識が必要」と考えている方も少なからずいるだろう。確かに、統計データとして公開する資料などでは、データを適切に処理し、十分に検証を行う、といった作業が求められる場合もある。しかし、それほど難解ではないデータ分析も沢山ある。
たとえば、日々の売上をExcelにまとめて管理している場合を考えてみよう。この場合、それぞれの売上を単純に比較するのは簡単だ。その結果として、「あの日は全体的に売上が良かった」とか、「あの店舗はいつも売上が悪い・・・」などの印象を抱くこともあるだろう。
ただし、こういった「表面的な数値」に捉われてしまうと、本質を見抜けなくなってしまうケースがあることに注意しなければならない。たとえば、店舗の規模が違えば、売上の金額も違って当然である。そこで、データを比較可能な形にするためのテクニックを学んでおく必要がある。
テクニックといっても、そんなに大袈裟なものではない。店舗の規模による差異を解消したいのであれば、「1席あたりの売上を計算してみる」などの手法が考えられるだろう。
こういったデータの加工を実現するには、「Excelで数式を自在に扱えること」が必須条件となる。少なくとも四則演算や合計、平均などの算出方法は理解しておくべきだろう。そのうえで、最適な比較方法を考えていくのが基本だ。
むしろ、最適な比較方法を考えることが、データ分析の難しいポイントともいえる。上図の例では「1席あたりの売上」で比較しているが、もしかすると「スタッフ1人あたりの売上」や「家賃10万円あたりの売上」などの方が理に適っているかもしれない。
これについてはExcelのスキルというより、「それぞれの分野にどれだけ精通しているか?」という問題になる。ただ、いずれにしても、「数式を自由に扱えること」が前提条件となることに変わりはない。
そのほか、上下動の激しいデータは移動平均線を使うと、データの動向を読み取りやすくなるなど、知っておくと便利なテクニックもいくつかある。
これらについては、本連載の序盤でいくつか紹介しているので、気になる方はいちど読み返しておくとよいだろう。
状況を把握しやすくするために
状況をすばやく理解するためにデータ分析を行うケースもある。このような場合に活用できるのが「条件付き書式」だ。「条件付き書式」を使うと、特異なデータを強調したり、セル内で数値をグラフ化して表示したりすることが可能となる。
これについては本連載の第6回~第12回で詳しく解説しているので、「条件付き書式」の使い方がよくわからない方は一読しておくとよい。データ分析というより「見やすい表の作成方法」と感じるかもしれないが、「見やすい表になっているからこそ、データ分析をスムーズに進められる」ともいえる。Excelの中級者になるための必須スキルなので、この機会に学んでおいていただきたい。
また、データをグラフ化して示すのも効果的な手法だ。もちろん、「単にグラフを作成しました」では十分とはいえない。グラフ化する際は、「どのような形にすればデータを比較しやすくなるか?」をよく考えて、最適なグラフを選択する必要がある。状況によっては、第31回の連載で紹介したファンチャートのように、事前に簡単なデータの加工が求められるケースもある。
さらには、「グラフの色を変更する」、「軸を反転する」など、基本的なグラフのカスタマイズ方法も覚えておく必要がある。これについては実際に手を動かしながら、Excelのグラフ作成機能は「何ができて、何ができないのか」を把握しておくことが大切だ。これを理解しておけば、グラフをスムーズに作成できるようになるだろう。
グラフに関連する話は、本連載の第29回~第41回で詳しく解説している。Excelのグラフ作成機能は、突き詰めていくと奥の深い話になる。これについては、近い将来、「あらためて詳しく解説できる機会があれば・・・」と考えている。
サンプル調査から全体像を予測するには?
最後に、分析用に収集したデータそのものついても触れておこう。データを分析するときは、そのデータが「どのようにして収集されたものか?」を調べておくことも重要な要素となる。調査方法がよくわからないままでは、正しいデータ分析も行えない。
調査方法を十分に確認したうえで、データ分析により「何を知りたいのか?」または「何を予測したいのか?」を決めていくのが基本だ。この際に役に立つのが、第52回以降の連載で紹介した統計学の知識となる。標準偏差や正規分布に関する知識があれば、限られたサンプルデータから「母集団の全体像」を見極めることも可能となる。
そのほか、「平均値の95%信頼区間」を求めてデータの信頼性を検証するなど、統計学を学んでおくとデータ分析の応用範囲が広がる。
ただし、統計学を完璧に理解するにはそれなりの数学力を求められるため、万人にお勧めできるとは言い難い。また、本格的な統計処理を行うとなると、Excelでは物足りなく感じてしまうケースもある。よって、どこまで知識を広げていくかは、各自の状況に委ねられることになる。
一概に「データ分析」といっても、その守備範囲はかなり曖昧で、どんな知識またはテクニックが役に立つかは個々の状況に応じて変化する。本連載では、なるべく幅広い層の人々が「役に立ちそう」と感じてもらえる内容を紹介してきたつもりだが、もちろん過不足も多くあったであろう。
願わくば、本連載をきかっけに、「Excelの新しい使い方」を発見して頂ければ幸いだ。各自が理解しやすい内容から始めて、少しずつ深く掘り下げていけば、「Excelの便利な使い方」と「実務に役立つデータ分析」を同時に習得できるだろう。Excelの使い方も、データ分析の手法も、実際に手を動かして経験を積むことが大切である。少しずつでも構わないので、ぜひ実践して頂きたい。