W3Cは15日(フランス時間)、W3C Common Web Language Incubator Groupによってまとめられた最終報告書Common Web Language (CWL)が公開されたと発表した。Common Web LanguageはWebを通じた情報交換を実現しコンピュータによるセマンティックな情報処理の実現を目指すもの。CWLを活用することでWebページのメタデータやコンテンツを特定の自然言語に縛られずに記述できるようになる。

CWL (Graph) View - Common Web Languageより抜粋

Common Web Languageは人間とコンピュータの双方に対して現在Webに存在している言語バリアと機械による解読容易性という2つの問題を解決することを目指している。現在Webコンテンツの大多数は英語で記載されているが、世界的にみた場合英語を理解しないユーザが多くを占めており、英語を使わないユーザにとってインターネットにおける情報の獲得を困難なものにしている。機械翻訳も提供されているが言語のカバー率や翻訳性能で完全な解決方法とは言えない状況にある。

HTMLタグはドキュメントの構造を明示するが、文章や単語に対してセマンティックは与えない。RDFやOWLがセマンティック情報を与えるためのフレームワークを定義しているが、同フレームワークはWebコンテンツを記述するための標準ボキャブラリは持っていない。

Common Web Languageはこういった問題を解決し、コンピュータによってコンテンツのセマンティックまで含めて処理できるようにしようということを目指している。CWL自身はセマンティックハイパーダイレクトグラフで構成されるグラフ言語。ノードがコンセプトを表現し(ノードは属性付加が可能)、円弧がノート間の関係を表現する。記述にはUNL、CDL、RDF/OWLの3つの言語が使われる。

実際にどこまで現実的な方法となるかは今後の研究開発や普及状況に委ねられることになりそうだが、言語バリアを低減させるという目的において興味深い取り組みであることには間違いなさそうだ。策定に携わってる組織が日本の組織である点も興味をひく。今後の取り組みに注目していきたい。