【レポート】

HTML5、日本語で音声入力する方法

    後藤大地  [2011/05/24]

    Google Chrome runs web pages and applications with lightning speed.

    Chrome 11安定版にはスピーチ入力機能が実装されている。input要素の入力に音声を利用できるというもので、Chrome 11以降のバージョンを使っているなら、たとえばGoogle翻訳のページで簡単に試すことができる。Google翻訳の翻訳元言語を「英語」にすると、テキストエリアの右下にマイクのアイコンが表示される。このアイコンをクリックすると音声入力を受け付けるモードに入る。音声は英語に変換され、テキストエリアに表示される。

    この機能はinput要素を拡張する形で実装されており、試してみるのに特別なプログラミンは必要ない。「<input x-webkit-speech type="text" />」のように、input要素の属性にHTML5の「x-webkit-speech」を指定すれば試すことができる。例えば、次に掲載するHTMLをChrome 11で閲覧すると、テキストフィールドの右端にマイクのアイコンが表示される。アイコンをクリックすると音声入力を促すプロンプトが表示されるので、マイク経由で日本語の文章を喋ればいい。

    <!doctype html>
    <html lang="ja">
    <head>
      <meta charset="utf-8">
      <title>HTML5 input and speech demo 01</title>
    </head>
    <body>
    <input x-webkit-speech type="text" />
    </body>
    </html>
    

    input要素に「x-webkit-speech」の属性を指定することで音声入力の機能を利用できる。

    Google翻訳で入力できる言語は5月23日現在のところ英語だけだが、上記に掲載したHTMLでは日本語で入力する必要がある。英語で入力したい場合にはhtmlで指定しているlangの値を「lang="ja"」から「lang="en"」へ変更すればいい。「lang="ja"」のときには、英語で喋っても該当する日本語やカタカナに置き換えられたり、認識されなくなる。

    音声入力の機能は「type="text"」以外のタイプで指定しても利用できる。ただし現在のところ、スピーチ入力をサポートした種類には限りがあり、すべてのtypeで音声入力が実施できるわけではない。次のようなHTMLを用意すれば、利用できるtypeの種類を確認できる。

    <!doctype html>
    <html lang="ja">
    <head>
      <meta charset="utf-8">
      <title>HTML5 input and speech demo 02</title>
    </head>
    <body>
    <input x-webkit-speech type="text" /> (x-webkit-speech type="text")<br/>
    <input x-webkit-speech type="tel" /> (x-webkit-speech type="tel")<br/>
    <input x-webkit-speech type="url" /> (x-webkit-speech type="url")<br/>
    <input x-webkit-speech type="email" /> (x-webkit-speech type="email")<br/>
    <input x-webkit-speech type="date" /> (x-webkit-speech type="date")<br/>
    <input x-webkit-speech type="number" /> (x-webkit-speech type="number")<br/>
    <input x-webkit-speech type="color" /> (x-webkit-speech type="color")<br/>
    <input x-webkit-speech type="password" /> (x-webkit-speech type="password")
    </body>
    </html>
    

    日本語入力を確認。スピーチ入力はtypeがtext以外の場合にも利用でき、numberであれば数値のみが入力されるようになる

    type="number"のように数値を指定した場合、「ひゃくにじゅうさん」といった数値を発音した場合には入力が実施されるが、数値以外の日本語を発音した場合には何も入力されない。使ってみた感じではかなり高い確率で日本語入力が実現されているような印象を受ける。

    デスクトップで動作するブラウザで音声入力機能を利用するというのはこれから活用が期待される分野であり、既存のサイトでこの機能を活用しているものはあまりない。今後どういったシーンで活用されるのか興味深い。

    関連記事

    関連サイト

    関連したタグ

    新着記事

    特設サイトの情報

      求人情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      転職ノウハウ

      あなたの仕事適性診断

      4つの診断で、自分の適性を見つめなおそう!

      Heroes File ~挑戦者たち~

      働くこと・挑戦し続けることへの思いを綴ったインタビュー

      はじめての転職診断

      あなたにピッタリのアドバイスを読むことができます。

      転職Q&A

      転職に必要な情報が収集できます

      スカウト転職する

      企業からアプローチのメッセージが届きます。

      マイナビニュースマガジン