【レポート】

2007 Office Systemの新機能 - MS-IMEとOpen XMLの詳細

1 変換精度の向上が図られた「MS-IME 2007」

    小山安博  [2006/05/31]

    既報の通り、マイクロソフトが来年1月に発売を予定している「the 2007 Microsoft Office System」が報道機関向けに公開された。新機能についてはすでに各所で報じられているが、今回は個人的に気になった「MS-IME」と「Office Open XML」について採り上げたい。

    MS-IME 2007

    日本語を使う我々にとっては重要なOfficeアプリケーションである日本語IMEの「MS-IME」もバージョン2007になった。今回のバージョンアップの目玉は「大幅な変換精度の向上」だ。

    MS-IME 2007の新機能

    MS-IMEは、「ATOK」(ジャストシステム)と比べると変換精度に難があると言われることが多い。そのあたりは同社自身も認めているところで、今回のIME 2007ではそれを解消、誤変換を極力減らすことを目指した。

    キーポイントとなるのが変換エンジンの刷新で、「Trigram/SLM(Statistical Language Model)」を採用して精度を高めている。これまでのMS-IMEでは、2つの単語のつながりがあったらその品詞を判断、「形容詞の次には名詞が来やすい」などのアルゴリズムで文脈を判断していた。

    Trigram/SLMでは、「3つの単語で判断する」(同社)ことで精度を高めることに成功したという。3単語で文脈を判断したほうが精度は上がるということで、「格段に精度は上がる」としている。実際、IME 2003とIME 2007で比較したところ、誤変換はかなり減ったようだ。

    他社の製品同士で変換精度を比べる場合、「貴社の記者が汽車で帰社する」といったような短文であることが多いが、同社いわく「短文での比較はあまり意味がない」。できるだけ長文での比較をしたほうがより精度の差が分かりやすいそうで、具体的にATOKとの精度差を聞いてみたところ、現時点ではベータ版という前提ながら、ATOKに迫る精度と自信を見せた。

    これぐらいの長文で比較したほうがいいらしい。ただしこれは旧バージョンとの比較

    短文の変換精度向上の例

    こうしたIME関連の研究は、Microsoft Research Asiaが行っており、今回のTrigram/SLMはその成果なのだそうだ。変換精度は、使い込んでみないと分からない面もあり、このあたりは実際にチェックしてみたいところだ。

    また、IME 2007の新機能の目玉のもう1つが「予測変換」機能の搭載だ。すでにATOKでは搭載されていた機能だが、事前に入力された文章を記憶し、次に同じ言葉を入力する際に、先頭の数文字を入力するだけで予測変換が行われ、「TAB」キーを押せばその文章を入力できる、というもの。

    たとえば「よろしくお願いします」と入力したあと、さらに「よろし」と入力するとツールチップが現れ、TABキーを押すと予測変換の候補が表示され、素早く入力できる。2度入力した文章を覚えてくれるという。個人的には、ATOKで慣れて手放せない機能だけに、この機能強化はうれしいところ。

    予測変換の例。ツールチップが出たらTABキーを押すと、右の画面のように変換候補が表示される

    Outlookの連絡先との連携機能もなかなか便利そう。たとえば「こやま」と入力して変換すると、Outlookに登録された「小山」の氏名、会社名、住所などといった情報が表示され、そこからその人のフルネームやEメールアドレスを変換結果として示すことができる。メールアドレスを覚えていなくても、Outlookにさえ登録しておけば、名前から変換できるというわけだ。

    Outlookとの連携。この変換候補には出ていないが、メールアドレスを選択して変換することもできる

    新着記事

    特設サイトの情報

      人気記事

      一覧

        イチオシ記事

        新着記事

        特別企画

        マイナビニュースマガジン