今週は、TechNet OnlineというよりもマイクロソフトのWebサイトの話になるが、サポート技術情報について取り上げよう。検索だけならさほど難しいことはないが、今回のお題は「機械翻訳」。

検索だけなら問題ないが

すでに、本連載の第21回で取り上げているように、TechNet Onlineのリニューアルにより、TechNet Onlineのトップ画面からサポート技術情報の検索を行えるようになった。

キーワード指定に加えて、サポート技術情報のトピックごとに設定されている番号を使った検索や、イベントビューアが記録するイベントIDを使った検索も行える。特に、イベントログを見る機会が多いであろうシステム管理者にとっては、イベントIDを使った検索が便利そうだ。

ところが問題は、サポート技術情報の翻訳が間に合わず、英語の情報に行き当たる機会が少なくないこと。もともと英語で書かれているものを日本語に翻訳して提供している上に、新しい情報がどんどん加わるのだから、ときとして、翻訳が間に合わないケースが出てくるのは致し方ない。

そこのところをフォローするため、何年か前から機械翻訳を使ったサポート技術情報の提供が行われている。最初の頃はものすごい訳語が登場して話題にされることがあったが(失礼)、最近では訳文の内容がこなれてきて、かなり改善されてきたように見受けられる。

とはいえ、やはり機械の仕事だから完璧とはいかず、分かりにくい訳文が出てきてしまう場合があるのは致し方ない。ただ、それでも日本語になっているだけマシだし、ちょっとしたコツが分かれば、グッと理解しやすくなる。あまり完璧を求めすぎるのではなく、使えるところは機械に頼り、足りない部分を人間がフォローするのが、正しい「人間と機械の付き合い方」というもの。

機械翻訳が取りこぼしやすいポイント

では、機械翻訳が出力した日本語の文章が分かりにくくなる理由とは、いったい何だろうか。

まず、言葉の順番の問題。英語と日本語では主語や動詞が出てくる順番が違う上に、同じ意味でもさまざまな書き方をする場合があるから、日本語の文章として見ると組み立てに違和感を感じる場合がある。でも、これは単に並べ替えれば済む問題なので、まだ対応のしようがある。

むしろ、「訳さなくていいものまで訳してしまう」問題の方が大きいのではないか、というのが個人的な見解。特に、製品名とかプロトコルの名称とか製品独自の用語とかいった、IT業界では英語のまま(あるいはカタカナ表記)で通用するものまで日本語にされると、途端に意味不明な内容になってしまう。

その一例がこれ。

説明のアドレス解決プロトコル (キャッシュの動作の Windows Vista の TCP/IP 実装で ARP)
http://support.microsoft.com/kb/949589/ja

タイトルだけ見ると、判じ物のようだ。しかし、TCP/IPやARP(Address Resolution Protocol)に関連する情報らしいぞ、ということは分かる。IT業界人が一般にresolutionというと、「解像度」のことだと思ってしまうだが、実は「決意」とか「解決」といった意味もある。ついでに余談を書くと、国連の安全保障理事会で出す「決議」のこともresolutionという。

閑話休題。タイトルだけではなんなので、機械翻訳が出力した訳文も見てみよう。

Windows Vista では、ARP キャッシュの動作が変更されています。Windows Vista での TCP/IP スタックの実装を RFC4861 に準拠 (近隣探索プロトコル) for IP Version 6 [Ipv6] は、IPv4 と IPv6 近隣探索プロセス。

ARP キャッシュを Windows XP および Windows Server 2003 で維持 ArpCacheLife と ArpCacheMinReferencedLife のレジストリ エントリを確認します。これらのレジストリ エントリ Windows Vista に適用されなくなります。

昔の機械翻訳と比べると、ずいぶんと日本語としてのクオリティが上がったなあと思った。とはいえ、いまひとつスッキリしない。それに、元の英文の内容によって、出力される訳文のクオリティに影響が出るかも知れないので、必ずクオリティが上がったという保証はできないが、この記事を書くためにザッと見た範囲では、確実に向上がみられると思う。

機械翻訳によって生成した日本語訳を提供しているサポート技術情報の例。以前と比べると翻訳の品質がずいぶんと向上したと思うが、分かりにくい表現が散見されることもある。

ともあれ、この訳文を見てみると、タイトルの「説明のアドレス解決プロトコル」とか、「RFC4861 に準拠 (近隣探索プロトコル) for IP Version 6 [Ipv6] は、IPv4 と IPv6 近隣探索プロセス。」といったあたりに、訳さなくていいものまで訳してしまった部分が見受けられる。では、どうすればよいかというと、英語の原文と比べてみるのが手っ取り早い。

そこでサポート技術情報が改善したのは、[英語を並べて表示する]というアイテムを用意していること。これをクリックすると、Microsoft Translatorを使って、原文と訳文を並べて表示するようになっている。

もうひとつの方法として、URLを書き換えて、別ウィンドウで原文を見てみる方法がある。サポート技術情報のURLは、「http://http://support.microsoft.com/kb/<ID>/ja」という構成になっているが、実はIDの部分は日英とも(そしておそらくはすべての言語で)共通。だから、言語の違いを意味しているURL末尾の「ja」を「en」に書き換えるだけで、英語の原文を見られる。

しかも、今はタブブラウザが一般的になったから、話が早い。同じWebブラウザのウィンドウ内で複数のタブを開いて、それぞれに日本語訳と英語の原文を表示させておけば、タブを切り替えるだけで原文と訳文を比較できる。

日本語の訳文が分かりにくくなっている一因は「訳し過ぎ」にあるので、英語の原文と見比べてみることで、本来の意味を把握できることが多い。試してみよう。

こうすることで日本語と原文を突き合わせれば、「訳しすぎ」などの問題点を把握しやすい。まるごと英文だと大変という人でも、個別のパーツに分解してしまえば、理解しやすくなるのではないだろうか。

『TechNet Plus Direct サブスクリプション』を5名様にプレゼント!

2010年4月30日までに応募された読者の中から、抽選で5名様に「TechNet Plus Direct サブスクリプション」をプレゼントします。

TechNet Plus サブスクリプションは、情報システムの評価、導入、運用、管理を支援する IT プロフェッショナルのための年間購読サービスで、マイクロソフトの最新技術リソースや、製品評価版のソフトウェアやベータ版をダウンロードして評価目的で利用できます。

TechNet Plus サブスクリプションの詳細はこちら

ご提供: マイクロソフト

マイコミジャーナル1クリックプレゼントは、各企業様のご協力をいただいて、読者の皆様に先着&抽選で素敵な賞品がもらえるプレゼント企画です。マイコミジャーナル会員であれば誰でも申し込み可能です。奮ってご応募ください。

応募方法 : マイコミコミジャーナル会員でない方は、「プレゼントに応募する」ボタンをクリックして案内に従って会員登録を済ませてからご応募ください。※会員登録されていても追加情報の登録が必要な場合があります。

賞品名 :TechNet Plus Direct サブスクリプション(抽選・5名様)
応募締切 : 2010年4月30日(日)
発表方法 : 当選者に当選を知らせるメールをお送りしますので、これをもって発表に代えさせていただきます。