テキストマイニングの手法は、分析対象のテキストデータの特徴により使い分けます。本稿では、テキストマイニングの概要を整理した後、テキストマイニングの主な分析手法を3種類紹介します。テキストマイニングを効果的に活用する手法や戦略についても解説しますので、ぜひ最後までご覧ください。
テキストマイニングツールの製品比較記事を見る
テキストマイニングとは
テキストマイニングとは、「自然言語処理」による解析を行うことで、膨大な量のデータの中から有益な情報を抽出するための技術です。テキストマイニングが分析対象とするテキストデータはさまざまですが、代表的なものをいくつかピックアップしました。
- TwitterやInstagramなどのSNSの投稿データ
- Webサイトやメールなどで収集した顧客アンケート
- コールセンターでのオペレータと顧客のやり取り
- チャットボットなどの質問応答システム
- メール
- インターネットの掲示板
- 口コミサイト
これらのデータを適切な分析手法を用いて解析することで、ビジネス課題にとって有用な情報を抽出するために、企業はデータマイニングを利用します。
1、テキストマイニングを行う目的
テキストマイニングを行う目的は、主に顧客のニーズ発掘やビジネス課題の改善策発見、ビッグデータ分析による将来予測などが挙げられます。せっかく有用な情報が流れていても、データ量が膨大だと手動での解析は時間がかかり、現実的ではありません。
テキストマイニングにより、SNSの投稿データ・口コミサイト・インターネットの掲示板などから、自社や同業他社の最新情報を自動で収集・分析できます。コールセンターでのやり取りやチャットボットのデータからは、自社製品やサービスの品質向上に関する情報やヒントが見つかるかもしれません。
テキストマイニングを導入する際は、どのようなビジネス課題を解決したいかを明確にしましょう。テキストマイニングに用いる分析手法も検討することで、より効果的に目的を達成できます。
2、データマイニングとの違い
テキストマイニングは、データマイニングの一種です。テキストマイニングはテキストデータを分析対象とします。一方、データマイニングは、テキストデータだけでなく、データ全般を解析対象とする点が大きな違いです。
テキストマイニングの概要について整理できたら、次にテキストマイニングの主な分析手法について見ていきましょう。
テキストマイニングの主な分析手法3つ
テキストマイニングの主な分析手法として、センチメント分析・対応分析・主成分分析について解説します。
1、センチメント分析
センチメント分析とは、顧客の「感情」を分析する手法です。SNSや個人ブログの書き込みなどのテキストデータから、顧客は自社の商品やサービスを使ったときに抱いた感情を分析します。
分析の際は、感情を「肯定的」「中立」「否定的」の3種類に分類。商品やサービスのブラッシュアップ、選挙予想などにも活用されます。
ただ、年代によって感情表現が逆となる単語もあり、肯定とも否定とも判断しにくい表現も多く、分析精度を上げることが今後の課題です。
2、対応分析
アンケートなどのテキストデータによく使われる分析手法です。コレスポンデンス(Correspondence)分析とも呼ばれ、企画書やブランドのイメージ分析になどによく用いられます。
設問をかけ合わせて作成するクロス集計表や編集・集計を行う前のローデータを散布図として可視化。調査結果の分析をやりやすくする点が対応分析の特徴です。
データ量が少ない場合は、クロス集計表だけでも集計の分析結果がある程度は理解できますが、設問項目が増えると理解しにくくなります。このような場合に、対応分析による可視化はより大きな効果を発揮します。
3、主成分分析
主成分分析は、ビッグデータによく用いられる分析手法です。膨大なデータ項目をグルーピングしながら1~3項目に集約することで、データを解釈しやすくします。集約したデータ項目は、合成した順番から第1主成分・第2主成分と呼ばれます。
ただし集約の過程で、一部の情報は捨ててしまう場合がある点には注意が必要です。この場合は、集約の方法を変えて第1主成分・第2主成分を抽出し、散布図で図式化して分析結果を読み取ります。
テキストマイニングツールの製品比較記事を見る
テキストマイニングを効果的に活用する手法5つ
テキストマイニングを具体的かつ効果的に活用するには、どのように作業を進めていけばよいでしょうか。分析手法だけでなく、テキストマイニングを活用していくための手法についても抑えておきましょう。
1、基幹となる情報を見極めて業務フローを定着させる
まずは、自社にとって基幹となる情報は何かを見極めることが重要です。基幹データには、常に発生し続け枯渇しない情報を設定することで、テキストマイニング作業のルーチン化や業務の流れを作りやすくなります。
基幹データは、自社商品やサービスに対する顧客の苦情やクレームに関するデータとするのが一般的です。苦情・クレームデータは全社に関係する内容が多く、全社で改善に取り組みやすい情報です。
2、業務を細分化と体系化の推進
基幹データを決定したら、テキストマイニングを日々の業務に取り込んだ業務フローを作って定着させることを考えます。データの収集・テキストマイニングによる分析・改善策の検討までのサイクルを回す体制作りを推進しましょう。
この際、1つ1つの業務は細分化することで、自動化や単純化しやすく、業務全体としてルーチン化できます。逆に言えば、ルーチン化できるまで作業を細分化することが、本手法のポイントです。
3、収集テキストデータの質的向上
収集テキストデータを質的に向上させる手段がある場合は、対策を講じることも重要です。収集対象のテキストデータは、必ずしも分析に最適な状態であるとは限りません。
例えば、コールセンターで問い合わせ内容と回答について記録を残す際、「『動かないという苦情』『マニュアル説明で対応』」など簡略化した表記で済ませているとどうなるでしょうか。具体的にどのような動作不良があり、マニュアルのどのページを参照しどう回答をしたのか、という重要な情報が欠落してしまいます。
コールセンターの記録内容は、自社でコントロールできるデータなので、情報の記録マニュアルなどを作ってどのようなデータを残すべきかを明示・教育します。
残すべきデータが絞り込まれることで、より分析しやすく有用な情報を収集できるようになります。
4、テキスト分析スキルの向上
テキスト分析スキルとは、主に以下のスキルを指します。
- 形態素分析などテキストマイニングの基本的な知識
- テキストマイニングツールの習熟
- 実際の業務が抱えるビジネス課題の抽出
- 分析結果から問題解決の手がかりを得る問題解決能力
現場部門では、特に現状の業務に対する問題意識が必要で、テキストマイニングの専門家に関しては資質と経験が問われます。
また、同一データに対して、多面的な分析と複数人で別々の分析を試みるようにします。そこからはじき出された複数の結果を比較し、しっかりと議論をした上で、結論を出すことも重要です。
5、テキストマイニングの適用範囲拡大と活用の活性化
テキストマイニングの分析結果は、あるビジネス課題の解決だけでなく、複数のビジネス課題に対しても効果を発揮する場合があります。
苦情・クレームのデータ分析結果は、商品やサービスの改善だけでなく、取り扱い説明書の改善や接客面でのサービス改善にも利用可能です。
まずは、大きなビジネス課題を抱えた1部門でテキストマイニングによる業務改善を実施します。その部門でのフローを定着化させた後、他部門への横展開を検討するといいでしょう。
主要分野でテキストマイニングを活用した戦略3つ

最後に、テキストマイニングを活用した代表的な戦略を3例紹介します。
1、アンケート分析によるマーケティング戦略
テキストマイニングの活用方法として代表的な例です。さまざまな形でアンケートの回答を収集し、分析結果をもとに新しい商品やサービスの企画、販売戦略の立案などに用います。
アンケートの場合、一般顧客の声がデータとして集まります。また、社内でも顧客に近い立場で業務を行っている営業職の日報分析もマーケティング戦略に役立つ情報データです。営業を通して見た顧客の意見を、イベントや販促活動の効果測定に活用することで、顧客・自社サイド両面からの分析ができます。
2、カスタマー商品の品質向上戦略
コールセンターに日々寄せられる苦情やクレームデータは、商品の品質向上戦略に有効な情報を数多くもたらします。
苦情やクレームデータは、品質管理部門だけでなく、商品の販売促進や新商品の企画を行うマーケティング部門・商品開発部門でも活用できる情報です。
3、コールセンターにおける顧客対応戦略
企業や製品に対する苦情やクレームは年々増加傾向にあります。企業側は問い合わせ対応業務の効率化と品質向上を、いかにして同時に達成するかを検討しなくてはなりません。
テキストマイニングによる苦情・クレームデータの分析は、商品そのものだけでなく、サービス面で必要な改善点に関する有益な情報も抽出可能です。
テキストマイニングの手法を知って業務を効率化しよう
テキストマイニングの分析手法は、分析対象のデータがどのようなタイプかによって決定します。分析手法は1つだけでなく、複数を組み合わせて用いるなどの工夫で、さらに効果的な情報を抽出することもできます。
テキストマイニングツールの製品比較記事を見る