韓国電子通信研究院(ETRI)は、音声でナビゲーションを操作できるソフトウェア技術を開発したと発表した。

これまでナビゲーション端末に出発地や行き先などを入力する際は、タッチパネル式の画面に対して、メニューを指で選んで入力する形式だった。今回開発されたソフトウェア技術を利用すれば、行き先などを音声で入力できるようになる。

ETRI開発による音声認識ソフトウェア

ナビゲーションの操作を簡単にするだけでなく、運転中に片手でナビゲーション端末を操作するなど、交通事故の原因をなくすのにも一役かいそうだ。またETRIでは「手が不自由など、身体的な条件でタッチパネルを使えなかった人にも、端末操作の一助になる」と、福祉面での活用も見込んでいる。

今回開発された技術は、CPUやメモリなどの制約がある端末で、より多くの単語をすばやく認識できるように、人の音声認識過程と類似した認識方法を採用しているという。人の耳をモデリングして開発されたこの認識技術では、音素を感知した後、これらの音素を総合して単語を探す仕組みとなっており、「認識効率が高いとの評価を得ている」(ETRI)という。この技術により、実質的に45万もの単語が認識可能になったとされる。

さらに、人により異なる単語の発音や表現などにも対応できるよう、開発の際に実際の運転環境下で発生する大量の音声データを収集することで音声認識率を高めた。

ETRIは、この音声認識システムをナビゲーションだけでなく、モバイル用デジタル放送規格「DMB」の車載用端末の操作、WiBro端末での住所録照会、およびそこに表示された電話番号に電話をかける機能でも利用できるようにし、最近増加している車載用端末のあらゆる操作を音声でできるようにしたい考えだ。

今後はナビゲーションメーカーと共同で音声認識端末を製作し試験サービスを行う。その後、2008年上半期頃に商用化させたい意向だ。