科学技術振興機構(JST)、医薬基盤研究所(NIBIO)、農業生物資源研究所(NIAS)、産業技術総合研究所(AIST)は12月12日、文部科学省、厚生労働省、農林水産省、経済産業省が取り組む生命科学系データベース(DB)の統合化の方針や成果を紹介する合同ポータルサイト「integbio.jp」(インテグバイオ)を共同で開設したことを発表した。

生命科学におけるデータベースは、例えばiPS細胞作製の成功には遺伝子データベースの情報が不可欠であったように、研究のインフラとして世界中で活発に開発、利用されているす。その結果、現在では多数のデータベースが乱立しており、それを使いやすくするための統合化が重要な課題となっている状況だ。

日本では、第3期科学技術基本計画(平成18年3月28日閣議決定)に基づいた総合科学技術会議が策定した、ライフサイエンス分野の推進戦略における戦略重点技術の1つとして「世界最高水準のライフサイエンス基盤整備」が掲げられた。

また、科学技術連携施策群「生命科学の基礎・基盤」補完的課題「生命科学データベース統合に関する調査研究」の報告を受け、生命科学に関係した文部科学省、農林水産省、経済産業省では、統合化に向けた取り組みが、平成18年頃から平成22年度まで実施された次第である。

当初は、各省で独自に進めていたデータベースの統合化をオールジャパン体制で進めるため、内閣府総合科学技術会議のもとに統合データベースタスクフォース(座長:国立遺伝学研究所副所長・五條堀孝氏)が設置され、平成21年5月に報告書がまとめられた。そこで示された方針をもとに、省の協力体制を構築して、平成23年度より4つのステップ(カタログ、横断検索、アーカイブ、再構築)を統合データベースタスクフォース報告書に示されたロードマップに沿って進めてるという具合だ(画像1)。

画像1。データベース統合化の4つのステップ

最初のステップ「カタログ」は、データベース単位のリンク集である。しかしリンクだけでは、ユーザーはデータベースごとに検索しなければならないので、「横断検索」を用意。その名の通り、複数のデータベースの中身を一括してキーワード検索できるものだ。これにより、ユーザーは1つの窓口から入ってデータベースを検索することが可能になる。

「アーカイブ」は、データベースのフォーマットの統一と権利関係の整理などにより、データベースのダウンロードと再利用を可能にするもの。「再構築」は、複数のデータベースが有機的に組み合わされることによって、横断検索よりもさらに高度な検索、例えば「ヒトのあるタンパク質に結合する低分子を花粉に含む植物」のような検索をユーザーが行うことが可能になる。この再構築では、情報技術や計算機資源、データを整理する手間などの問題に加えて、データベースを改変する権限の有無も問題となるため、これらを1つずつ解決していく必要があるという具合だ。

そして今回解説されたのが、JSTバイオサイエンスデータベースセンター、NIBIOバイオインフォマティクスプロジェクト、NIAS農業生物先端ゲノム研究センター、およびAISTバイオメディシナル情報研究センターは、4省の生命科学系データベース合同ポータルサイトだ。合同ポータルサイトでは、4省が協調・連携して取り組んでいるカタログ、横断検索、アーカイブの方針と成果がまとめられている(画像)。

画像2。4省の生命科学系データベース合同ポータルサイトのトップページ

また、データベースの統合化に関するシンポジウムや講習会、展示会の情報を発信して、イベントカレンダーを用いて紹介。今回の取り組みに対する研究コミュニティーの関心や理解が深まるよう努めていくとしている。

今後もJSTバイオサイエンスデータベースセンター、NIBIOバイオインフォマティクスプロジェクト、NIAS農業生物先端ゲノム研究センター、AISTバイオメディシナル情報研究センターは、内閣府総合科学技術会議の示す方針に従い、合同ポータルサイトの内容を充実させ、4省が協調・連携して取り組んでいる「カタログ」、「横断検索」、「アーカイブ」をさらに進めていく予定だ。今回のような連携により、将来的には「再構築」が達成され、日本のデータベースが統合化されいっそう使いやすくなることが期待されるとしている。

なお、平成23年5月に総合科学技術会議統合データベース推進タスクフォース(座長:長浜バイオ大学 バイオサイエンス学部特別客員教授・郷通子氏)が開催され、その場において、今後も総合科学技術会議において平成26年度以降のデータベース統合の推進のあり方について検討することが確認されている。