【コラム】

ハイテクウォーカー

52 国際化ドメインに残された波乱要素

    佐藤晃洋  [2002/12/17]

    昨今お伝えしている通り、Internetのドメイン名にアルファベットや数字以外の文字を利用可能にする「国際化ドメイン」に関する標準化作業がほぼ完了し、後は技術標準がRFCとして発行されるのを待つだけ、というところまで来ている。実際に国際化ドメインを利用するにあたってはアプリケーション側での対応が必須であり、RFC発行後、Webブラウザやメールソフトなどを順次国際化ドメイン対応のものに更新する必要があるという問題はあるが、それでも登録受付開始から既に2年以上が経過している国際化ドメインがようやくこれで利用可能になると思うと感慨深いものがある。

    ただ、国際化ドメインを巡ってはひとつだけ今回の標準化の枠組みから途中で外されたものがある。それが今回ご紹介する「IDN-admin」だ。実はこれが今後国際化ドメインを巡る波乱要素となる可能性を秘めているのだが、そもそもIDN-adminとは何なのか、またなぜ波乱要素となりうるのか、という点を今回は解説してみたい。

    ○異体字を同一のものとして処理するIDN-admin

    まずIDN-adminとは、一言で言ってしまえば「字体は違うが意味は同じ文字を同一視して処理する」ことを目指して現在検討が進められている仕組み。例えば「鉄」は旧字体では「鐵」という字になるが、このような異体字を同一視し、例えば「新日鐵.com」と「新日鉄.com」は同じドメインである、という具合に処理を行わせよう、というのがIDN-adminが目指しているところだ。

    特にこのようなニーズは中国語圏から強く出ている。というのも、中国語圏ではいわゆる「繁体字」と「簡体字」と呼ばれる2種類の字体が主に使われており、しかも字体が異なる文字でも日常的には全く同一の文字として扱われているからだ。そのため今回のIDN-adminの提案も中国語圏に属するccTLDから出されており、現在検討されているというわけだ。

    ○NAMEPREPとの違いは?

    ここで国際化ドメインに詳しい人なら、「そもそも国際化ドメインには異なる文字を正規化するための仕組みとしてNAMEPREPが用意されているのでは?」と思った方がいるかもしれない。そこでNAMEPREPとIDN-adminとの違いを整理しておこう。

    NAMEPREPで行う正規化とは「違うコードが振られている同じ文字をどれかひとつに統一する」「表記が違うが見た目が同じになる文字は同じものとみなす」といったもの。前者は例えばアルファベットの全角文字は半角文字(ASCII文字)に統一するとか、半角カナは全て全角に変換する、といったもので、後者は「ピーシーウェブ」と「ヒ゜ーシーウェフ゛」は同じものとして扱う、といった具合だ。これらはあくまで「見た目の字体が同じものを統一する」という原則に従って行われているため(一部「。」→「.」など、記号類で例外はある)、IDN-adminのような「明らかに違う形の文字を同一視する」ものとは違う。

    また、技術的な側面で言うと、NAMEPREPはあらかじめアプリケーション側に変換テーブルを持っておき、ソフト内部で文字の変換を行う仕組みなのに対し、IDN-adminはアプリケーション側では変換は行わない。ではどうやって実現するのかと言えば、「想定される異体字の組み合わせ全てを登録済みとする」という力技を使う。例えば「国鉄.com」というドメインを想定した場合、異体字の組み合わせとしては「国鉄」「国鐵」「國鉄」「國鐵」の4種類が考えられるが、このうちどれかひとつの登録の申し込みがあった時点でこの4種類を全て登録済扱いとしてしまいDNSに登録してしまうのだ。そのため後から異体字を利用して別の人間がドメイン登録を申請しても却下されてしまう、というわけ。

    ○TLDによって採用・非採用が分かれる?

    IDN-adminは上記で述べたように「ドメインの登録申請時に異体字をチェックする」という仕組みを取るため、ドメイン登録業務を行うレジストリ側は「どの字とどの字を同じとみなすか」といった情報を管理するための異体字テーブルを持つ必要がある。ただ世界中の文字を網羅するとなると異体字テーブルの量が膨大になるし、メンテナンスの手間も大変だ。IDN-adminが今回の国際化ドメインの標準化の枠組みから外されたのもそのあたりの要因が大きく、IDN-adminの採用を見送ったレジストリも多い。

    日本のJPNIC・JPRSもIDN-admin採用を見送ったレジストリのひとつだ。日本の場合は既に汎用jpドメインで以前から日本語ドメインの登録を受け付けているが、「今のところ異体字による問題が起きていない」「仮に今後問題が発生した場合でも、個別案件毎にドメイン名の紛争処理扱いとして検討すればよい」などの理由から、今後もIDN-adminを採用しない考えを明らかにしている。

    .comなどのgTLDに関するIDN-adminの取り扱いがどうなるかはまだ不明だが、このまま行けばあるgTLDではIDN-adminが採用されるが、別のgTLDではIDN-adminが使われない、といったことが起こる可能性が高い。そうなると、例えば「国鉄.com」が登録されていると「國鐵.com」は登録できないが、「国鉄.biz」が登録済でも「國鐵.biz」が登録できる、などという事態が想定される。冒頭で述べた「波乱要素」とは実はこのことを指しているのだ。

    IDN-adminに関しては現在も関係者の間で議論が続けられているが、これを「中国語圏のccTLDのみのローカルルールとする」か、もしくは「gTLDは全てIDN-adminを採用する」かのどちらかにまとめないと、それこそユーザの混乱を招きかねない。結果がどうなるかはわからないが、とにかくユーザにわかりやすい形での決着が付けられることを望みたい。

    バックナンバー
    http://pcweb.mycom.co.jp/column/hitech.html

    新着記事

    特設サイトの情報

      求人情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      転職ノウハウ

      あなたの仕事適性診断

      4つの診断で、自分の適性を見つめなおそう!

      Heroes File ~挑戦者たち~

      働くこと・挑戦し続けることへの思いを綴ったインタビュー

      はじめての転職診断

      あなたにピッタリのアドバイスを読むことができます。

      転職Q&A

      転職に必要な情報が収集できます

      スカウト転職する

      企業からアプローチのメッセージが届きます。

      マイナビニュースマガジン