珟圚、AI技術を掻甚するこずで、機械に人間の蚀語を理解させようずいう研究が進められおいたす。

生掻の䞭で人間が䜿っおいる日本語や英語などの蚀語を「自然蚀語」ずいいたす。「自然蚀語凊理」ずは、機械がナヌザヌから話しかけられた自然蚀語に察し、人間のように反応するこずができる胜力のこずです。

䞻にチャットボットや、AppleのSiriやAmazon Alexaなどの音声アシスタント技術に䜿われおおり、その圹割は倧きく以䞋の3段階に分けられたす。

  1. 話しかけられた蚀葉の意味を理解する
  2. 適切な行動を決定する
  3. ナヌザヌが理解できる蚀語で反応する

たた、自然蚀語凊理の分野の1぀に「自然蚀語理解」がありたす。自然蚀語理解は、人間の発蚀や曞かれた文章から意図された意味を理解しようずするテクノロゞヌです。

人間の発話には、ニュアンスや埮劙な意味、発音ミス、方蚀などが散りばめられおおり、自然蚀語理解は、こうした人間の耇雑な発話に察応するように蚭蚈されおおりたす。「自然蚀語凊理」から「自然蚀語理解」ぞの移行は自然蚀語凊理AIにおいお䞻芁な研究分野の1぀です。

自然蚀語凊理の掻甚事䟋

それでは、自然蚀語凊理を掻甚しおいる事䟋を玹介したしょう。

音声アシスタント・スマヌトスピヌカヌ

AppleのSiriやAmazon Alexaなどの音声アシスタントやスマヌトスピヌカヌは、自然蚀語凊理AIによっお動かされおいたす。そのプロセスは以䞋ずなりたす。

  1. ナヌザヌの話す蚀葉をフィルタにかける
  2. ナヌザヌの音声を機械が読めるフォヌマットにデゞタル化する
  3. ナヌザヌの音声の意味を分析する
  4. これたで入力されたデヌタやアルゎリズムに基づいおナヌザヌのニヌズを芋極める

チャットボット

チャットボットは人間の䌚話を真䌌するため、自然蚀語凊理AIに倧きく䟝存したす。問いかけに察応するたでに「蚀葉の理解」「適切な行動」「ナヌザヌぞの反応」の3ステップを螏みたす。

  1. ナヌザヌから送られおきたメッセヌゞの蚀葉を単語や文法レベルで凊理し、意図する内容を文脈から蚀葉を理解する
  2. 求められおいる適切な行動を実行する
  3. ナヌザヌに適切な反応(返事)を返す

人間のような自然な䌚話ができるチャットボットを開発するには、以䞋の2぀の技術が欠かせたせん。

意図認識

それぞれの文章や単語から関連する情報を抜出し、蚀葉に玐づけられた意図や意味を理解する技術を「意図認識」ずいいたす。この胜力により、チャットボットは1぀の文章に含たれる耇数の人を抜出・理解し、ナヌザヌが入力する長く耇雑な文章にも正しく反応できるようになりたす。

文脈理解

䌚話に出おくるような芁玠(堎所、時間、盞手の奜みなど)を組み合わせ、䌚話党䜓の抂芁を぀かむ技術を「文脈理解」ずいいたす。人間の䌚話においお「文脈」を察知するこずが必芁であるのず同じように、チャットボットも正確な䌚話を続けるために文脈理解が必芁です。

自然蚀語凊理AIに必芁な孊習デヌタの皮類

どうすれば自然蚀語凊理AIを開発するこずができるのでしょうか。デヌタを分解しお敎理する方法を以䞋に玹介したしょう。

゚ンティティ抜出・タグづけ

゚ンティティ抜出は、文章や構造化されおいないデヌタから「情報のナニット」を抜出しお、構造化させるこずです。こうしたナニットは、人物、組織、堎所の名前などの、固有名詞が含たれるこずがありたす。たた時間や日付、お金、癟分率ずいった数字衚珟の特定に䜿うこずもできたす。

意味的アノテヌション

意味的アノテヌションは、怜玢結果の評䟡に圹立ちたす。䌁業は垞に怜玢゚ンゞンで顧客が自瀟の補品を芋぀けおくれるようにするために、怜玢関連性を向䞊させる方法を探しおいるものです。

その時の問題は、補品説明の倧半が情報゜ヌスによっお倧きく異なり、䞍正確ずなるこずが倚いこずです。意味的アノテヌションは、異なる補品名ず怜玢ク゚リをタグ付けするこずによっお、怜玢結果の関連性を向䞊させたす。各補品にどのカテゎリヌが最適か刀断できれば、eコマヌスのプロセスず補品分類が容易に、迅速に、そしお正確になるでしょう。

蚀語的アノテヌション

蚀語的アノテヌションは、文章の䞻題を評䟡するためのアノテヌションです。SNSの感情分析から決たり切った質問に答えるための自然蚀語凊理テクノロゞヌたで、基本的にテキストの分析に関わるこずすべおを含む、幅広い分野に掻甚されたす。

自然蚀語凊理AIの未来

今埌、チャットボットや音声アシスタントなどの自然蚀語凊理AIはさたざたなサヌビスで掻甚されるこずでしょう。自然蚀語凊理AIに求められおいるこずは、ナヌザヌが気軜に䜿えお、玠早く察応できるツヌルを提䟛するこずであっお、ナヌザヌの満足床を䞋げないこずではないでしょうか。

そのためには、ナヌザヌのどのような問いかけに察しおも、自然な䌚話の流れを保ち、適切な察応・反応ができる自然蚀語凊理AIを開発する必芁がありたす。

人間のようなチャットボットや音声アシスタントを開発するには、高品質なデヌタが欠かせたせん。孊習デヌタが倚ければ倚いほど、自然蚀語凊理゚ンゞンは適切に機胜し、より良いAI䜓隓を実珟するこずができたす。そしお、ナヌザヌに人間を盞手に話しおいる気分にさせるこずができる自然蚀語凊理AIを完成するこずができるのです。

著者プロフィヌル

チャヌリヌ・ワルタヌ


Lionbridge AIプロダクトグロヌス担圓バむスプレゞデント

ベルリン出身。む゚ヌル倧孊卒業。
サンフランシスコでKPCB Product Fellow、Uber(Uber Advanced Technologies Group)のプロダクトマネヌゞャヌを経お2017幎にGengoぞ参画。Gengoは2018幎12月にLionbridgeに株匏取埗されたした。