仕事でPCを利用している人なら誰もが「外字」の入力で苦労した経験があるだろう。例えば、取引先担当者の名前にJIS規格のコードに含まれない外字があった場合、顧客データの入力一つにも手間がかかる。

実はこの外字問題、単に「入力の手間を増やす面倒な存在」で済むものではない。インターネットの利用が不可欠となった現在では、日本の行政や経済に影響を与える大きな問題と考えられ、2010年より経済産業省が中心となったプロジェクトが進行している。

まだ一般にはあまり知られていないこの外字/異体字(※)問題。これが「どのような影響を与えるのか」「その解決方法とは」、文字情報技術促進協議会の田丸健三郎氏に解説いただいた。

※異体字:斉/齋など、読みと意味は同じだが文字の形が異なるもの。特に人名や地名は、コードに含まれないため外字として扱われる異体字が多い。

田丸氏は2014年7月15日に東京で開催される帳票ソリューションセミナー「変化の時代にこそ必要な揺るぎない帳票基盤~ホスト印刷からPDF帳票保管、マイナンバー制度による外字問題まで対応~」(主催:ウイングアーク1st株式会社)にて、基調講演「外字と異体字と相互運用性」に登壇予定である。

情報共有の大きな弊害となる外字/異体字の存在

文字情報技術促進協議会 田丸健三郎氏

インターネットが普及する以前であれば、外字/異体字の存在は入力や印刷時に手間がかかる程度の問題で済んだ。だが、ビジネスや行政サービスにおいて、インターネットの活用が不可欠となった現在では、これが大きな問題を引き起こす。

「コードに存在しない文字があった場合、かつてはメーカーが独自の規格で外字を作成し、システムに追加していました。社内のみで利用するのであれば、これで問題はありません。しかし、インターネットを利用して他のシステムと連携しようとすると、文字化けして正しく表示されなくなります。つまり、データの相互運用ができなくなってしまうのです」(田丸氏)

この問題は、特に地方自治体においては顕著である。例えば、名前に外字が使われている人がA市からB市に転出入するケースを考えてみよう。もし、この両市の間でシステムの互換性がなければ、A市からの転出データを、B市側では読み取ることができないため、入力し直す必要がある。さらに、この外字がB市側には存在しないものだった場合、新たに外字を作成する必要が発生する。ここで発生するコストは全て税金で賄われる。

世界標準で外字/異体字のデータを共有するために

外字/異体字の問題は行政だけに影響するものではない。人名や住所を扱う必要がある業種全てに関わる問題だ。この問題を解決するためにも、外字/異体字を国際標準の文字コードで対応できる仕組みが早急に必要なのだ。

「その仕組みとして、広く使用されてきているものがIVS(Ideographic Variation Sequence)です」(田丸氏)

IVSとは基本となる文字形とバリエーション(異体字)の番号を組み合わせて世界標準の文字コードであるUnicodeで表現できる仕組みである。IVSを用いると、下図のような異体字が表示可能となる。

IVSによる表示例
出典:文字情報技術促進協議会「IVS時代のユニコード入門」
http://citpc.jp/documents/about_unicode.pdf

現在、さまざまな企業や団体がIVSに対応したソリューションを開発し、普及を進めているとのことだ。

「住民基本台帳、e-Tax、現在ではインターネットを利用した行政サービスが増え続けています。しかし、これらを全ての国民に対して平等に提供し、相互運用性を確保するためには、外字/異体字問題をクリアしなくてはなりません。そのためには、このIVSの普及が不可欠であると考えています」(田丸氏)

「変化の時代にこそ必要な揺るぎない帳票基盤」セミナーでは、田丸氏によるより詳細なIVSについての解説が行われる予定である。外字問題に頭を悩ませているシステム担当者は、情報収集のために是非とも参加していただきたい。