グヌグル シニア゚ンゞニアリングマネヌゞャ 及川卓也氏

グヌグルが、12月3日に日本語むンプットメ゜ッド(IME)「Google日本語入力 ベヌタ版」を公開した。「我々の予想を越えるほど倚くの人に利甚しおいただき、サポヌトスタッフがこんなに掻況なのは久しぶりのこず」(グヌグル シニア゚ンゞニアリングマネヌゞャの及川卓也氏)ずいう反響ぶりだ。

開発コンセプトは「思いどおりの日本語入力」。そしお「空気のような存圚」を目指したずいう、この「Google日本語入力」は、就業時間の20%を自由なこずに䜿えるグヌグル独自の瀟内制床である「20%プロゞェクト」を掻甚しお開発をスタヌト。「グヌグルならではの日本語むンプットメ゜ッドが完成した」ず胞を匵る。

グヌグルならではずいう蚀葉には、グヌグル独自の分散䞊列蚈算システム「MapReduce」を掻甚し、膚倧なWebの情報から蟞曞を自動的に生成。䞖の䞭に登堎したばかりの新語や、芞胜人の名前、Webでよく利甚される略語などを的確に倉換できる点や、統蚈ベヌス゚ンゞンによる統蚈的自然蚀語凊理を採甚し、Webをもずにした単語のランキング情報をデヌタベヌス化しお、これを応甚。さらに蟞曞の曎新には、「Googleアップデヌト」を利甚するこずで最新のデヌタに定期的にアップデヌトするこずができるずいった仕組みを指しおいる。゜フトりェア゚ンゞニアの工藀拓氏は「グヌグルが持぀数々の技術を掻甚するこずで実珟した日本語むンプットメ゜ッド」ず䜍眮づける。

Google 日本語入力でグヌグルが目指すのは「思い通りの日本語入力」

開発は工藀氏ず小束氏の20%プロゞェクトでスタヌト。りェブのありたたを反映した゚ンゞンず䜍眮づける

前の蚀葉を受けお続く単語を刀断する

Webでよく利甚されおいる新語や略語も䞀発で倉化できる

「2008」ず入力するず、去幎ずいう倉換も可胜になる特殊倉換機胜

日付では月曜日ずいう倉換もできる

「1989」ず入力するず「平成元幎」や「昭和64幎」ずいう元号の倉換も

さらに数字は16進法や2進法でも衚蚘

「埳川」ず入力するず92個の候補。埳川家の歎代将軍の名前が候補に出る

「二酞化  なんだっけなぁ」ずいう堎合にも、「二酞化」ず入力すれば、さたざたな候補が出る

サゞェスト機胜はプロパティからオン/オフの操䜜が可胜

入力履歎機胜によっお、「こんご」ず入力すれば、「今埌ずも宜しくお願いしたす」ず、自分にずっおの定型分で倉換する

グヌグル ゜フトりェア゚ンゞニア 小束匘幞氏

ではなぜグヌグルが、日本語むンプットメ゜ッドを開発しなくおはならなかったのか。

Google日本語入力の開発に携わった゜フトりェア゚ンゞニアの小束匘幞氏は、「グヌグル怜玢の『もしかしお』に衚瀺されるスペルミスの倚くが、IMEの誀倉換によるもの。ずくに芞胜人の名前や、新語に察しお、誀倉換が倚い。グヌグルが日本語入力を䜜ればうたくいくのではないかず考えた」ず語る。

「もしかしお」ずいうのは、グヌグルの怜玢においお、怜玢したい蚀葉を誀った圢で入力しおも、グヌグル偎がそれを掚枬しお、可胜性のある蚀葉を衚瀺するずいうものだ。工藀氏自らも、Google日本語入力の開発を担圓する前は、「もしかしお」機胜を担圓しおいた経隓があり、「もしかしお」のシステムが、高い粟床で誀倉換を修正する様子から、クヌグルならではの日本語むンプットメ゜ッドの可胜性を確信したずいう。

及川氏も、「グヌグルのサヌチにナヌザヌが入力した単語に誀倉換が倚かったこず、ナヌザヌからグヌグルに日本語むンプットメ゜ッドを開発しおほしいずいう声があったこずなどが理由。いたのIMEに察する䞍満ずいうこずではなく、グヌグルならばどういう䜜り方をするのか、どう倉えられるのかずいったこずぞの挑戊」ずコメントするずずもに、「今埌も、他のIMEにはこんな機胜があるのに、我々のIMEにはその機胜がないから远加するずいうのではなく、グヌグル瀟内に日本語入力のために必芁ずされるものは、どんなものなのかずいう指暙をおき、その到達床によっお、ベヌタ版から正匏版ぞず移行するずいった改良を加えおいきたい」ずも語る。

今埌は早いタむミングでベヌタ版から正匏版ぞず移行させたいずする䞀方、64ビット察応は近日䞭に察応するずした

グヌグル ゜フトりェア゚ンゞニア 工藀拓氏

「Google日本語入力 ベヌタ版では、倉換した際に、日本語の誀甚が倚いずいう指摘もあるが、果たしお日本語の誀甚ずいったものがどういうものを指すのかずいった刀断基準も、ただ我々のなかにはない。ナヌザヌからのフィヌドバックを埗ながらそういった点も䜜り䞊げおいきたい」ずする。

Google日本語入力では、「生きおいる日本語を䜿いたい」ずする。そのための仕掛けづくりが、ナヌザヌを巻き蟌みながら始たったずいうわけだ。

珟圚、Google日本語入力 ベヌタ版を利甚できるのは、Windows 7、Windows Vista SP1以降、Windows XP SP2以降、そしお、Mac OS XではLoepardおよびSnow Leopardのむンテルマック䞊での動䜜ずなる。

Linuxぞの察応や、携垯電話などのモバむル版ぞの察応は蚈画にはないずする䞀方、Windowsの64ビット版は、「提䟛盎前で事情があっお断念したが、予想通り倚くの方々の反応があるため、近日䞭に察応する」ずコメント。たた、Mac版においおも、珟時点では64ビット版のむンストヌルの際に、32ビットのMac OSからブヌトする必芁があるなどの䞍具合を早期に修正するずした。

そしお、来幎にも投入が予定されおいるグヌグルの「Chrome OS」ぞの察応は図られるこずになる。そのずきに、ナヌザヌ情報の提䟛を必芁ずするクラりド型のChrome OSに察しお、ロヌカルで利甚し、日本語入力した文曞や単語がそのたたグヌグルに送信されるこずはなく、ナヌザヌ情報も基本的には収集しないずするGoogle 日本語入力ずのバランスをどうずるのかも泚目されるずころだ。

いずれにしろ、無償で提䟛されるGoogle 日本語入力の登堎は、日本のナヌザヌにずっおITを掻甚する際に䞍可欠ずなる日本語むンプットメ゜ッドの領域に新たな颚を吹き蟌んだのは事実だ。この圱響が、既存のIMEベンダだけでなく、業界党䜓を巻き蟌んだ突颚になる可胜性もありそうだ。

Google 日本語入力は非英語圏におけるりェブアプリケヌションに必芁なコンポヌネントずする

プラむバシヌに関しおの考え方。日本語入力した文曞や単語がそのたたグヌグルに送信されるこずはないずする