NTTドコモは2月27日、ネットワーククラウドを活用した新サービス「しゃべってコンシェル」を発表。ドコモのサービスやスマートフォンの機能が幅広く利用できる音声エージェント機能で、3月1日から一部の対応機種で提供開始される。同日都内で開催した説明会では、本サービスについて説明した。
同社サービス&ソリューション開発部長の栄藤稔氏から概要の説明があった。ドコモでは2015年を目処にした中期的なビジョンで、ユーザーの利便性向上などを目指した「スマートライフ」構想の実現を目指している。ネットワーククラウドを利用した本サービスもその一貫。音声認識/意図解釈の技術によりユーザーにより便利で効率的なサービスを提供するものだ。
具体的には、スマートフォンでアプリ「しゃべってコンシェル」を起動させると「何かご用ですか」のメッセージとともにアイコンが出現するので、マイクボタンを押して要望を音声入力するという流れ。説明会ではデモも体験できた。
「富士山の写真が見たい」と音声入力すると富士山の画像検索結果が表示され、「今日の予定」でスケジューラーが参照でき、「写真が撮りたい」ではカメラが起動した。そのほかにも「○○の地図を見せて」でゼンリンデータコムのデータが、「○○のレシピを教えて」でクックパッドのデータが参照できるなど、対応サービスは実に幅広い。なお、3G / Wi-Fi / Xiのいずれの回線でも利用できるという。
栄藤氏は「自然言語を使ったインターフェースが実用化できる時代になった。本サービスは話し言葉で端末の機能が操作でき、色んなサービスが利用できるというもの。ドコモが提供する多種多様なコンテンツに簡単にアクセスできるツールとして、是非役立てて欲しい」と力強く語った。将来的にはユーザーのニーズに合わせて機能をさらに拡張していくとのこと。近々では2012年度中にiコンシェルなど各種サービスとの連携ができるようにする予定だという。
提供の開始は3月1日13時からで、利用料は無料。対応機種はAndroid 2.2以上を搭載したスマートフォンで、2月27日現在で18モデルが対応している(詳細はNTTドコモのHPを参照)。「しゃべってコンシェル」アプリはAndroidマーケット、またはdメニューのサービス一覧からダウンロード可能になる。
質疑応答では、栄藤氏が記者団の質問に答えた。iPhoneで提供されている、音声で端末を操作できる機能Siriとの違いについては「音声認識の機能差はほぼ同じだが、しゃべってコンシェルではドコモが持っているコンテンツや機能への導線としてより最適なものを提供できる」と答え、その優位性をアピールした。
利用できる語彙数は数十万語で、音声言語の認識率は約90%だという。現時点で方言は利用できない。外国語に対応する予定は、との質問には「今のところ対応予定はない。逆に言えば、日本の生活・文化に根ざした日本語専用の音声認識技術を磨いていくことが、今後の我々のサービスの強みになる」と回答した。
今後の目標は、との質問には「本サービスは実際に提供しないと性能が上がらない種類のもの。ユーザーの話し言葉を学習したり、雑踏の中での認識率を上げたりすることで精度を上げていきたい」とのこと。市場にはどの程度の需要があると認識しているか、という質問には「具体的な数字は分からない。しかし、本サービスのような音声認識技術を用いたサービスは近年、認知が広がってきており、潜在的なニーズの高まりを感じている。スマートフォンの使い方が分からない、急いである機能が使いたい、手が塞がっている状態でスマートフォンを操作したいなど、しゃべってコンシェルが活躍できるシーンはいろいろ想定できる。我々としては、そこに向かって機能・サービスを充足させていきたい」と回答した。
(記事提供: AndroWire編集部)