UTF-8の普及率が60%を突破、ASCIIも含めれば80%に近づく

Unicode is a computing industry standard allowing computers to consistently represent and manipulate text expressed in most of the world's writing systems.

Googleは同社の保有しているインデックスに登録されているWebページを調査し、どのエンコーディングがどの程度の割合で使用されているのかについて分析結果を発表した。2012年1月の段階で、UTF-8を採用したページが全体の60%を超えているほか、ASCIIを採用しているページが16%ほどとなっている。ASCIIはUTF-8のサブセットでもあるため、UTF-8に組み入れてカウントすると、実にWebページの80%ほどがUTF-8を採用していることになる。

2001年の段階ではASCIIが60%近いシェアを持っていたが、ASCIIは年々割合を減らしている。代わりに2004年あたりからUTF-8の採用が増加を始め、2006年あたりから急成長を開始。現在もそのシェアは増加傾向にある。特定の言語としては、日本語(SJIS)が高い割合を持っていたが、2006年から2007年にかけて中国語(GB2312)に抜かれている。

Unicode over 60 percent of the webより抜粋

Googleではテキスト検索の処理などで従来からUnicodeを採用しており、常に最新版のUnicodeへ対応し続けている。Unicodeとしては先日最新版となる「Unicode 6.1」が公開されたばかりであり、Googleはこの最新版への移行を進めると説明している。



転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

求人情報