ChatGPTなどの生成AIの登場により、4度目のAIブームが到来したといわれています。

文章や画像、音楽、動画などのコンテンツづくりなどもAIが担うことができるようになり、私たちの働き方やビジネスの世界が大きく変わりつつあります。

今回のAIブームは、過去の一過性のものとは異なり、インターネットやスマートフォンと同じように私たちの生活に不可欠な存在として定着するでしょう。

ビジネスにおけるAI活用も一層進み、AIを活用する企業とそうでない企業の競争力の差は、ますます広がっていきます。

本連載ではAI活用が当たり前になる社会においてこれまで価値を見出されてこなかった「音声」の可能性について紐解いていきます。

AIを活用しなければならない日本の特徴

そもそも日本にはAIを活用しなければならない特有の事情があります。

それは労働力不足の問題です。

人口減少により日本企業の原動力となる生産年齢人口(15~64歳)は、2020年から2070年にかけて7,500万人から4,500万人へと約4割も減少すると言われています。

このような状況で、日本企業が成長し続けるためには、生産性を向上させることが不可欠であり、そのためにはAI活用が重要な鍵となります。

高度化している「音声認識技術」とは?

AIの有効活用には、AIに学習させるデータの「質」と「量」が重要です。

学習データとして、テキストや画像がすぐに思い浮かぶかもしれませんが、有効活用できる次なるデータとして「音声」に注目が高まっています。

音声認識の分野には、音声を自動でテキスト化する技術、テキスト化された会話の内容を要約する技術、話している内容や感情を分析する技術など、優れた技術があります。これらを有効活用することで、ビジネスの生産性を向上し、音声をビッグデータ化してAIの学習に活かせます。

日常生活に「音声×AI」がもたらす変化

音声認識技術が普及すると、身近な生活にも変化が起こります。

例えば、パソコンやスマートフォンはキーボードやフリック入力など、手入力が主流ですが、音声認識の精度が高まると、スマートスピーカーのような声で操作できるボイスユーザーインターフェースのニーズが高まります。音声入力はフリック入力の約3分の1の時間で入力ができ、操作時間の短縮に繋がります。

また、情報を音声で出力することも進むと想定されます。既存のAIから出力された情報を収集する際は、文章やグラフなどで表現されていてわかりやすい一方、視覚を奪われるという短所があります。その点音声による情報収集は「ながら」聞きが可能で、タイムパフォーマンスが良く、可処分時間を増やして生産性の飛躍的な向上が期待できます。

AI時代はコミュニケーションそのものが資産になる

これまでビジネスにおけるデータといえば、メールや書類のようなテキストや画像情報が中心でした。

一方で、人は1日に1回あたり30分、合計で約6時間と多くの時間を会話に費やしています(国立国語研究所調べ)。

このような会話の中には、商談の進展に役立つ情報や、意思決定に関わる内容など、経営に係る重要な情報が含まれています。

さらに、パーソナリティやニュアンス、緊急度、温度感といった貴重な付随情報も含んでいます。

しかし、それを担当者が議事録等にまとめようとしても、詳細に記録するには労力もかかり、担当者の主観が入って正確に記録することは非常に困難です。

そこで会話を録音し、AIで解析することで、商談内容を自動で文字起こし・要約して議事録を作成できます。

また、会話内容をトピックごとに分類し、感情の変遷なども併せて共有でき、工数を掛けずに正確な情報を伝達可能になります。ほかにも、話し方の特徴を分析してどのような話をした際に相手が反応を示したのかが分かるなど、音声データとAIの力でコミュニケーションを最適化させることができます。

このように会話の内容をAIで解析することで、顧客と担当者が「何を」「どのように」話しているかわからないと言った「会話のブラックボックス化問題」が解消されます。これまで記録として残りにくかった音声データを企業のビッグデータとして資産化することも可能です。

今まで資産といえば、石油や金などの有形資産が主流でしたが、これからのAI社会では、画像、テキスト、音声に代表されるデータという無形資産が企業の競争力を左右する時代になります。

日頃のコミュニケーションそのものに価値があるという意識をもち、コミュニケーション自体を資産化し、データ蓄積の文化を持つ企業が市場で競争力を高めていくでしょう。