NTTコミュニケーションズ(NTT Com)は、NTTグループの自然言語解析技術を手軽に利用できるAPIサービス「COTOHA API」において、新たに「言い淀み除去」「音声認識誤り検知」「感情分析」の3つのAPIを提供するほか、従来β版だった「照応解析」APIの正式版提供を開始すると発表した。
言い淀み除去 (β版)は、音声認識処理後のテキストデータの中から、「ええと」や「あのう」といった言い淀みを特定し、除去する。既存の音声認識エンジンやアプリケーションにアドオンすることで、音声認識結果の精度向上を実現する。
音声認識誤り検知 (β版)は、音声認識処理後のテキストデータの中から、認識ミスの恐れがある単語を検知・抽出する機能。「認識した文章全体における誤り度合い」と「言い間違いや音声認識間違いの可能性が高い単語」をスコア化して表示する。このAPIを活用することで、音声認識結果の信頼度判定を行うことや、AIが人に対して聞き返しを行う際に不明点のみを尋ねることが可能となるという。
また、今後提供予定の「音声認識誤り訂正」APIと組み合わせることで、誤りを自動で訂正して、認識精度を向上させることが可能だという。
感情分析 (正式版)は、文章が表現している感情を「ポジティブ」あるいは「ネガティブ」と判定。否定語の認識をしながら文章全体の意味を踏まえて分析するため、単語単位の判定と比べ高精度で感情を判定できるという。
また、文章に含まれる「喜ぶ」「驚く」「不安」「安心」といった15種類の感情を分類・認識することも可能だという。
照応解析 (正式版)は、「あれ」「彼/彼女」「同〇〇」「その〇〇」などさまざまな指示語を検知し、それらが指し示す対象を特定する。従来β版を提供してきたが、今回の正式版にて、指示語が複数形(彼ら)の場合や、指示語のさす対象が複数の単語から成る(任期満了による知事選)場合などのさまざまな照応関係について認識できるようになった。