理化学研究所(理研)は9月20日、国際連携を通じて解析された各遺伝子の機能をノックアウトしたマウスの表現型データ115万件を、Webの国際標準規格に沿ったRDF(Resource Description Framework)データとして全世界に発信したことを発表した。

同成果は、理研バイオリソースセンター マウス表現型知識化ユニット 桝屋啓志ユニットリーダーらの研究グループによるもので、9月14日付けの英国科学誌「Nature」オンライン版に掲載された。

2011年に発足した「国際マウス表現型解析コンソーシアム(IMPC)」では、遺伝子をそれぞれノックアウトしたマウスの表現型を世界共通の基準で解析し、そのマウスと解析データを世界の研究者に提供することを目的に、標準化された数百にわたる表現型解析を全遺伝子のノックアウトマウスについて網羅的に進めており、2016年4月の時点で約2432遺伝子についての検査結果約115万件を公開している。

今回、同研究グループは、IMPCのマウスリソースがさらに広い分野で利活用されるために、Webの国際標準規格に沿ったRDFデータに変換した。RDFは、データ活用を最大化するために、次世代のWebを構成する基盤のひとつとして開発された規格および技術で、人、グループ、文書、概念、ゲノム、表現型、化合物、疾患、医薬品など、さまざまな情報間の関係(リンク)を用いて、コンピュータと人間双方が扱えるような「意味」を情報モデルとして表現できる仕組みと、それらをデータベース横断的に検索する仕組みを提供するもの。データの意味をコンピュータでより容易に処理できる点においても優れているといえる。

今回の変換作業に先立ち、同研究グループはIMPCのデータ中に記述されている、表現型解析の結果、解析項目、解析方法、解析対象のマウスのグループや遺伝子、参加機関などのさまざまな概念を整理し、バイオインフォマティクスの分野で用いられる標準的な語彙(オントロジー)を用いて表現。このようなデータ標準化作業の結果、RDFの仕組みを生かし、ほかのデータベースで管理されているさまざまな生命科学データとの関係付けや、統合的な解析が容易になることが期待される。

IMPCでは、今後5年間でマウスの全遺伝子の機能解析を完了させることが計画されているという。同研究グループは今後もIMPCの最新データをRDFで公開していく予定であるとしている。

RDF技術を用いた表現型データの利用拡大(画像提供:理化学研究所)