欧州委員会(EC)は18日(現地時間)、約100万の文章を22言語に翻訳した翻訳データを無料で公開すると発表した。開発者はこれを利用して、マシン翻訳やオンライン辞書など、コンピュータを利用する言語や翻訳技術に役立てることができる。これにより、文化の多様化に貢献し、少数言語の保存に役立てるという。
現在、欧州連合(EU)には27の加盟国があり、公用語は23言語。EUでは規定により、すべての法文書が公用語に翻訳されなければならない。翻訳作業としては、オリジナル言語と翻訳ターゲット言語の組み合わせは253あり、EUは多言語データを保有している世界最大の機関という。EUには1,700人以上の翻訳者が勤務するといわれており、多言語テキスト処理ツールなどの開発も進められている。
今回のイニシアティブの下、ECは翻訳者とEU内の科学者と共同で、約100万の文章につき、アイルランド語以外の22言語のデータコレクションを公開する。この中には、英語、フランス語、ドイツ語などの言語のほか、ハンガリー語、チェコ語など新加盟国の言語も含まれている。すべて公文書で、分野としてはテレコムや情報などの技術、政治、社会などをカバーする。
開発者はこれを利用して、オンライン辞書、グラマーチェッカー/スペルチェッカー、マルチ言語テキスト分類システムなどの言語ソフトウェアを作成したり、すでにあるソフトウェアの精度を向上できるという。また、公開するデータは手作業による精密な翻訳テキストであるため、自動翻訳ソフトウェアはこれを利用して「学習」し、精度を高められる。このようなニーズは、テキストマシン翻訳システム分野で高いといわれている。
ECでは、このイニシアティブにより、EUが推進する人間言語技術、文化の多様性、マルチ言語主義を支援し、コンピュータを利用した翻訳を容易に低コストに実現し、アクセスしやすくする、としている。EUでは、情報リソースの再利用にオープンなポリシーを掲げており、これに一致するものでもある、としている。
また、域内の市民の情報アクセスも改善できるという。たとえばEUの公用語であるラトビア語やルーマニア語のWebサイトやオンライン情報量は限定されているが、コンピュータ翻訳が進めば、このような言語を話す人が容易に広範な情報にアクセスできるようになるとみている。
| EU、電子政府レポートを発表 - 行政サービスの58%がオンライン化 [2007/9/21] |
| 欧州連合、YouTubeで独自チャンネル「EU Tube」を展開 [2007/7/3] |
| EU、MIT対抗の研究機関設立に向け第一歩 [2007/6/27] |
| ソニー、A4サイズの薄型軽量デジタルペーパー端末を開発 [00:00 5/18] |
| 最大2200万件のID流出の可能性 -Yahoo! JAPANのID管理サーバに不正アクセス [23:03 5/17] |
| Google、Gmailに送金機能 [19:09 5/17] |
| Firefox、プライバシー問題でCookieの実験開始へ - 22から [18:37 5/17] |
| 【レポート】"HANA"でビジネスの境界を拡大 - SAPのCTOがUIやHANAクラウドの生まれ変わりに向けた取り組みを披露 [18:00 5/17] |
|
[東京女子流]緊急降板の庄司芽生が1日でライブ復帰 体調は回復 [13:43 5/19] ホビー |
|
[ゲーム質問状]「ナルト 疾風伝 ナルティメットストーム3」 第四次忍界大戦を追体験 [13:30 5/19] ホビー |
|
近所の方への香典はいくらぐらい?【今さら聞けない社会人のマナー】 [13:30 5/19] キャリア |
|
[47都道府県芸人グルメ便]「べトコンラーメン」 岐阜・飴玉ソング [12:15 5/19] ホビー |
|
草なぎ剛「クドカンさんの渾身の一撃です」映画『中学生円山』 [12:00 5/19] エンタメ |
4つの診断で、自分の適性を見つめなおそう!
働くこと・挑戦し続けることへの思いを綴ったインタビュー
あなたにピッタリのアドバイスを読むことができます。
転職に必要な情報が収集できます
企業からアプローチのメッセージが届きます。