Unicode is a computing industry standard allowing computers to consistently represent and manipulate text expressed in most of the world's writing systems.

Unicodeコンソーシアムは9月30日(米国時間)、Unicodeスタンダードの最新版となる「Unicodeスタンダードバージョン6.3」を発表した。このバージョンにはブラウザ開発者から寄贈されたコードをベースにアラビア語、ヘブライ語、ペルシャ語、ウルドゥー語などの表示を改善することになる新しいアルゴリズムと5つの新しいbidiフォーマットキャラクタが含まれている。これら言語に関して従来よりもより自然な表示が可能になる。CSSとの相性もよく、これら言語における文字列の挿入処理やユーザインタフェースの組み合わせなどの処理が改善されるとみられる。

「Unicodeスタンダードバージョン6.3」では日中韓の言語に対する拡張も取り込まれている。日中韓では同じ意味を持ち形も似ているが、確かに形が異なる文字が存在する(日本語では人名などで特に見られる)。今回のバージョンにはこうした文字が標準化された状態で1,002個追加されており、これまで日中韓文字で問題視されてきた表意文字互換性に関する問題の軽減につながるとされている。文字列としては同一のものであることを表現しつつ、違う字形を指定することが可能になる。

Unicodeコンソーシアムは現在のところ2つの参照実装と改善された試験データと試験方法を提供しており、従来よりも仕様に沿った実装を提供しやすい環境が整備されている。

Announcing The Unicode Standard, Version 6.3

Unicode 6.3.0