オンライン百科事典「Wikipedia」を運営するWikimedia Foundationはこのほど、最新プロジェクト「Wikidata」を発表した。同プロジェクトでは、280以上の言語版を持つWikipediaが全言語共通で使う構造化データベースの構築を目指す。

Wikidataは2006年以来のWikimediaプロジェクトとなり、ドイツのWikimedia非営利組織のWikipedia Deutschlandが開発を主導する。

Wikipediaは現在280言語以上で利用できるが、全言語に共通したデータベースを持っていない。セマンテック技術を利用して共通の構造化データベースを構築し、全言語が同じデータソースを利用できるようにすることで、記事の一貫性と品質を強化し、記事数が少ない言語でも情報を得やすくする。

Wikidataが実現すれば、ある人物の誕生日などのデータをすべてのWikipediaで利用可能になり、統合管理できるため、管理の簡素化やデータの重複排除にもつながりそうだ。

データはCreative Commonsライセンスで公開され、Wikimediaでは、学術分野や政府機関を中心に、外部のアプリケーションにもメリットがあるとしている。

Wikidataプロジェクトは3フェーズを踏む形で開発・実装される。フェーズ1では各言語のリンクを中央に一元化し、フェーズ2では編集者がWikidataにあるデータの利用や追加が可能となる。フェーズ3では、Wikidataのデータに基づいたリストやチャートの自動生成が加わるとしている。

Wikidataプロジェクトの初期開発は、Allen Institute for Articifial Intelligence、Gordon and Betty Moore Foundation、米Googleなどによる130万ユーロの寄贈により実現するいう。