韓国で使われているハングルは、子音と母音(「字母」)を組み合わせることで、1つの文字が構成される仕組みとなっている。字母を多様に組み合わせることで1文字が完成し、理論的には11,172文字の表現が可能だ。

しかしハングルには、今では使わなくなってしまったものも含めば、以前はもっとたくさんの字母が存在していたようだ。韓国に残されている古い文献を見ると、現代とは異なるハングルがたくさん使われているのが分かる。こうした昔のハングルをコンピューターで利用できるようにしようと、韓国政府が動き出した。

韓国政府の産業資源部傘下にある技術標準院は、19世紀から20世紀初めの古文書で使われていた昔のハングルの字母117字を、10月初旬に国際標準の「ISO/IEC 10646 Amd5」に反映させたと発表した。

技術標準院がKS国家標準作業を進めている、昔のハングルの一例

これにより国際標準に登録されたハングルの字母は、現代ハングルも含めば計355字に拡大されたこととなり、表現可能なハングルも、現代ハングルで表現可能な11,172字を含めると計160万にも及ぶこととなった。

国際標準への登録と同時に、現代ハングルと昔のハングルをコンピューター上で混用処理できるようにする「KS国家標準(案)」も用意した。KSは"Korea Industrial Standards"の略で、産業標準化法に依拠した国家標準のことを指す。現在KS国家標準は、電気部門や金属部門、食料品部門など多様な16種類に渡る部門分けがなされており、現在コンピューターで使われているハングルも、このKS国家標準に登録され標準化されたものだ。

昔のハングルをコンピューターで利用可能とするにあたり、字母間の体系的な組み合わせや表現規則を、KS国家標準に制定する作業を行う必要がある。現代ハングルとの相互互換性を確保し、かつ国際的にも一貫性のあるハングル利用の原則が提供されるようにするためには必須の作業だ。

ところでハングルの文字セットには、完成型と組合型というのがあり、現在はほぼ完成型が使われている状態だ。完成型はハングルの一文字一文字があらかじめ完成された形で登録されている方式で2バイトを要し、組合型は字母単位で登録されている方式で4~6バイトを要する。

技術標準院では、字母の組み合わせが大変多い昔のハングルは、組合型で表現する方針を固めている。しかし一方ではコンピューターの保存領域を効率化する観点から、現代ハングルは現行の完成型のままとしたままで、昔のハングルの組合型と一緒に用いられることとなる。

現時点では「今あるキーボードで、どのように新旧のハングルを入力するのか、具体的な方法はまだ検討中」(技術標準院)とのこと。KS国家標準の最終決定は、今後2カ月に渡り各界の意見を集めて審議した後となる。また非営利組織のユニコードコンソーシアムと協力して、各OS上で昔のハングルを再現できるよう協力作業を進めていくという。

早ければ2009年頃に利用可能となる昔のハングルは、古文書をそのままデジタル化して保存するという用途はもちろん、商品やWebサイトデザインへの活用など、産業的な用途も見込まれている。