ボイスボットとチャットボットの併用で複雑な会話が可能になる

ボイスボットを導入することにより、コンタクトセンターでオペレーターが受けるコール数を削減できれば、コンタクトセンター業務の効率化だけでなく、機会損失の回避や顧客満足度の向上が期待できます。ただし、それを達成するまでには、いくつか乗り越えなければならない壁があります。

1つ目の壁:複雑な質問への対応はAIには難しい

1つ目の壁は、複雑な質問に対応することは、AIにとって難しいということです。ボイスボットは、顧客からの質問をテキスト化する「音声認識」と、適切な回答を導き出すために質問の意図を理解する「自然言語処理」、そして回答を音声で読み上げる「音声合成」という3つの技術の組み合わせで成り立っています。しかし、現実問題、複雑な質問に直面すると、最初の音声認識の部分でつまずいてしまうのです。

2つ目の壁:技術的に実現できる範囲を優先してシナリオを作ってしまう

2つ目の壁は、1つ目の壁の延長としてCXの視点よりも技術的に実現できる範囲を優先してシナリオを作ってしまうことです。

例えば、レストランの予約において、「予約の日時をお知らせ下さい」というAIの問いに対し、人間が店舗名を先に発話したり、余計な発話をしたりすると「認識できませんでした。もう一度お願いします」と返すことがあります。それを改善して複数の情報を聞き取ってくれるAIもなかにはありますが、この聞き返されるという行為は顧客とって心地の良いものではありません。

このような事態が起こらないように会話のシナリオデザインを工夫するのですが、ここでコンタクトセンターとしてのCXの考え方と、コンタクトセンター業界のCXを理解していないAIベンダーとしての解決策にギャップが発生することが多く見受けられます。

CX観点ではこうしたいが、技術的にはこの方法しかできないなど、妥協せざる得ない状況も発生します。コンタクトセンターにおけるCXの視点と、AIやITを理解している人材がいるかいないかで、ボイスボットのクオリティが左右されると言っても過言ではありません。

3つ目の壁:固有名詞の言語認識率の低さ

3つ目の壁は、日本語の固有名詞の言語認識率です。AIの認識精度として、一般的な人名や地名などは問題ありませんが、珍しい氏名や英語、フランス語などのカタカナの建物名などは認識が難しくなります。

したがって、レストラン予約時に「お名前をお願いします」と言われたら苗字だけで十分です。苗字なら珍しいものはさほど多くないので、認識できる可能性は高いでしょう。しかし、修理受付の予約は住所、氏名、電話番号など、複数の情報を正確に認識する必要があります。また、フルネームになると苗字のみより認識が難しくなる傾向にあります。

これらに対する根本的な解決策として、ボイスボットとチャットボットをシームレスに併用できるソリューションが登場しました。ボイスボットによる音声応答だけではユーザーに伝えられる情報量に限界があるため、チャットによるテキスト情報を組み合わせることで提供できるサポート範囲を広げるものです。

  • ボイスボットとチャットを組み合わせた顧客体験

例えば、レストランのメニューや注意事項など、音声だけでは伝えきれない長文の情報も、音声とテキストを組み合わせることで、Webやアプリと同等の情報量を提供し、適切なナビゲーションが可能になります。固有名詞も、顧客に入力してもらえば認識ミスは防げることになります。

精度を継続的に改善することがCX向上を支える

AI活用の難しさにおけるさらなる問題が、常に精度の改善(メンテナンス)が必要ということは3回目に解説しました。AIは勝手に学習してどんどん賢くなるというイメージを持つ方もいると思いますが、企業で活用するAIはそう単純ではありません。

ボイスボットを導入するときにチューニング(音声からテキストに変換するために、音声データと正解であるテキストデータを学習させること)をしますが、その後も常に音声認識の結果をチェックして、学習データの追加や修正を繰り返し行わなければ、認識精度は上がりません。

また、最初のうちは会話のシナリオも、顧客とのやり取りを確認して分析し、顧客にストレスがなく、AIが認識しやすい回答をもらえるような質問の仕方を継続的に探っていく必要があります。

CXを重視したシナリオ設計と進化したAI技術(ボイスとテキストを同時に利用)を掛け合わせることで、AIでの解決率が9割を超える実績も確認されています。AIでの解決率が9割を超えると、オペレーターは人にしかできないより上質なサポートに専念できるため、負担軽減だけではなく、顧客満足度の向上で新たな顧客接点の創出などにリソースを使える可能性が広がります。

ボイスボットが拓くCXの未来

スマートフォンが普及して、ボイスボットとチャットボットを同時に使うことが容易になりました。コンタクトセンターへのボイスボットの導入はこれからますます加速して行くと考えられます。

人間は、デバイスやシーンに捉われず、好きな時、好きなシーンでAIと会話をし、要望が即時に解決する、そんな未来が近づいてきてるのかもしれません。

筆者はDX(デジタルトランスフォーメーション)における次世代デバイスは「テレビ」になると想像しています。最近のテレビは、動画配信サービスのアプリをダウンロードできるなど、インターネットデバイスとしての機能を備えています。そして、テレビにはリモコンがあります。リモコンにマイクがついていれば、音声で会話したり、チャンネルボタンを使って番号を入力したりできます。

また、テレビならスマートフォンよりも画面が大きく、高齢者の方でも見やすいのもメリットです。テレビCMを見て、そのままテレビのリモコンから電話をかけるという時代が来るかもしれません。

テレビに企業のアプリをダウンロードして、テレビをスマートスピーカーのように使い、音声とリモコン操作で対話をする。スマートフォンと連動することで外出時はスマートフォン、自宅ではテレビがデバイスとなる。それにより「コンタクトセンターに電話をする」という行為自体がなくなり、有人対応は直接エスカレーションチャネルへと変わっていくことになります。

そして、ここで重要になるのは「CXが考慮された高い技術を備えたボイスボット」であると筆者は考えます。