国立遺伝学研究所(遺伝研)、北里大学、理化学研究所(理研)、アクアマリンふくしまの4者は3月8日、日本人にとって馴染み深い魚の1つである「サンマ」の全ゲノム情報を読み取り、多様な分子生物学研究のための情報基盤を整えたことを共同で発表した。
同成果は、遺伝研 分子生命史研究室の工樂樹洋教授(理研 生命機能科学研究センター 客員研究員兼任)、北里大の福田和也助教、理研 生命機能科学研究センターの門田満隆技師、アクアマリンふくしまの山内信弥上席技師らの共同研究チームによるもの。詳細は、DNAおよびゲノムに関する全般を扱う学術誌「DNA Research」に掲載された。
サンマ関連の研究はそれほど活発ではないため、その状況を打破する手立てとして、DNA配列情報の1セットである全ゲノム配列を取得することが重要と考えられたという。今回の研究では、世界で唯一サンマを長期的に継代飼育し展示している水族館であるアクアマリンふくしまの試料が用いられた。
全ゲノム解析の事前情報として、まず総塩基数の精査のためのゲノムサイズ測定が行われた。独自の最適化が施された定量PCRに基づく手法「sQuantGenomeプロトコル」が用いられた結果、サンマは約11.7億塩基(1.17Gb)だった。硬骨魚類の仲間であるメダカ(0.75Gb)やゼブラフィッシュ(1.4Gb)と比べ、想定されるゲノムサイズだったとした。
サンマの全ゲノム配列情報を新規に読み取るための技術として、今回は「一分子リアルタイム」が採用された。その結果取得された配列は、ゲノムサイズの約30倍の塩基数だった。いわゆるアセンブリと呼ばれるつなぎ合わせなどのステップにより、冗長性がほとんどなくゲノム全体を網羅したDNA配列セットに整えることができたとする。
しかし、それらDNA配列の多くは、DNAが収められている染色体としては不十分な長さのものだったという。そこで、それらの配列をコンピュータ上でさらに長くつなぎ合わせる手法「Hi-Cスキャフォルディング」が用いられ、核ゲノムを構成する24本の染色体のDNA配列情報を組み上げることに成功したという。また、今回の手順で使用されたサンマのHi-Cデータは、研究チームにおいて最適化された実験手法「iconHi-Cプロトコル」により比較的安価に取得できたとした。
続いて、全ゲノム配列情報の精査が行われた。今回のサンマのゲノム情報は、研究数の多い伝統的な実験動物のゲノム情報と比較しても、遜色がない、あるいはそれを凌ぐほどの完成度が示されていたという。
基盤情報の早期公開が目標とされていたことから、今回の研究では、基本的なゲノム構造の分析に絞って取得されたゲノム配列の解析が行われた。数百~数千塩基の繰り返し配列からなる反復配列の分量がメダカと比較されたところ、サンマにおけるその種類の全体的な割合はメダカと同程度だが、絶対的な塩基数が大きく異なっており、この差異がゲノムサイズを変動させた大きな要因だったことが解明された。一方で、染色体規模の配列の比較により、硬骨魚類のダツ目において、サンマとメダカの系統が約7000万年前に分岐した後に起きた染色体間の再構成は稀であり、サンマとメダカの系統間では、染色体の構成は大部分維持されてきたことも明らかにされた。
構築されたサンマの全ゲノム配列情報の良質であることを例証するため、水チャンネルとして機能する「アクアポリンタンパク質」をコードする遺伝子群が調べられた。サンマのゲノムに含まれるアクアポリン遺伝子をすべて検出すると共に、対応するメダカ遺伝子との比較が行われた結果、サンマのゲノム情報には、メダカと同数のアクアポリン遺伝子が含まれていて、それらのエキソンの数も目立った違いはなく、イントロンの大まかな長さも共通していることが示されたという。また、研究チームがサンマのゲノム全体を対象として推定した遺伝子構造は、NCBIデータベースによって独立に行われた推定と近いこともデータの高品質を裏付けているとした。
今回取得されたサンマの全ゲノム情報とそれに基づく遺伝子情報は、DNA Data Bank of JapanおよびNCBIにて公開中だ(情報へのリンクは、Webサイト「サンマのゲノム情報」に集積されている)。今回のゲノム情報は、外洋でのサンマの集団構造や遺伝的多様性の把握、そして、ほかの生物種との関係や集団の進化的な来歴だけでなく、サンマの種を特徴づける形質の成り立ちを知るために特定の遺伝子の機能を調べる際の基礎情報になるとしている。
なお今回の発表は、塩基配列を読み取ったに過ぎず、あくまで新たな研究基盤の一部が整ったという報告であり、読み取った配列情報の「解読」のための生物学的な研究としてはまだ出発点に過ぎないとしている。