国立遺伝学研究所(遺伝研)、北里大学、理化学研究所(理研)、アクアマリンふくしまの4者は3月8日、日本人にとって馴染み深い魚の1つである「サンマ」の全ゲノム情報を読み取り、多様な分子生物学研究のための情報基盤を整えたことを共同で発表した。

同成果は、遺伝研 分子生命史研究室の工樂樹洋教授(理研 生命機能科学研究センター 客員研究員兼任)、北里大の福田和也助教、理研 生命機能科学研究センターの門田満隆技師、アクアマリンふくしまの山内信弥上席技師らの共同研究チームによるもの。詳細は、DNAおよびゲノムに関する全般を扱う学術誌「DNA Research」に掲載された。

  • 世界で唯一サンマの継代飼育を成功させた水族館であるアクアマリンふくしまにて、陸上水槽内で人工ふ化し養成したサンマ成魚が今回の研究に用いられた

    世界で唯一サンマの継代飼育を成功させた水族館であるアクアマリンふくしまにて、陸上水槽内で人工ふ化し養成したサンマ成魚が今回の研究に用いられた(出所:遺伝研Webサイト)

サンマ関連の研究はそれほど活発ではないため、その状況を打破する手立てとして、DNA配列情報の1セットである全ゲノム配列を取得することが重要と考えられたという。今回の研究では、世界で唯一サンマを長期的に継代飼育し展示している水族館であるアクアマリンふくしまの試料が用いられた。

  • 今回の研究で使用された飼育下のサンマ

    (A)今回の研究で使用された飼育下のサンマ。アクアマリンふくしまにおいて人工ふ化し養成された成魚。(B)サンマとほかの硬骨魚類との系統関係。サンマはサヨリなどと共に、ダツ目に属する。分子系統解析に基づいて、同じくダツ目に含まれるメダカとは約7000万年前に分岐したと推定されている(出所:遺伝研Webサイト)

全ゲノム解析の事前情報として、まず総塩基数の精査のためのゲノムサイズ測定が行われた。独自の最適化が施された定量PCRに基づく手法「sQuantGenomeプロトコル」が用いられた結果、サンマは約11.7億塩基(1.17Gb)だった。硬骨魚類の仲間であるメダカ(0.75Gb)やゼブラフィッシュ(1.4Gb)と比べ、想定されるゲノムサイズだったとした。

  • サンマの全ゲノムDNA配列構築

    サンマの全ゲノムDNA配列構築。(A)サンマの組織から抽出されたDNA分子のサイズチェック結果。左に添えられた数字はDNA長のスケール(単位は塩基対)。(B)試料の確保から配列情報の仕上げまでの主な手順。赤で囲まれた左側のロングリード取得に、緑で囲まれたHi-Cデータ取得が加わってはじめて、染色体規模のDNA配列情報を構築できることが多いという。(C)サンマのクロマチン相互作用マトリクス。Hi-Cデータに基づいて作成され、染色体規模へのゲノム配列の繋ぎ合わせに利用された。対角線上の赤い正方形それぞれが1本の染色体に対応。24個の正方形が認められるため、核型は2n=48であると推定された(出所:遺伝研Webサイト)

サンマの全ゲノム配列情報を新規に読み取るための技術として、今回は「一分子リアルタイム」が採用された。その結果取得された配列は、ゲノムサイズの約30倍の塩基数だった。いわゆるアセンブリと呼ばれるつなぎ合わせなどのステップにより、冗長性がほとんどなくゲノム全体を網羅したDNA配列セットに整えることができたとする。

  • サンマの全ゲノムDNA配列情報の他生物との完成度の比較ン

    サンマの全ゲノムDNA配列情報の他生物との完成度の比較。ゲノム情報の完成度はさまざまな指標を用いて評価されるが、取得されたサンマの情報は、核型を再現できていること(C)、ほとんどのゲノム領域を染色体配列に収録できていること(D)、そして配列が未決定な領域が極少であること(I)から、伝統的な実験動物について広く利用されている情報の完成度に匹敵する、あるいは、それを凌ぐものであると考えられた。一方、ヒトで2022年に完全解読がついに達成されたことに次いで、ゼブラフィッシュやメダカなどでも、完全解読を目指した努力が続けられており、今回得られたサンマのゲノム情報についても、さらなる改善の余地は大きいともいえるとした(出所:遺伝研Webサイト)

しかし、それらDNA配列の多くは、DNAが収められている染色体としては不十分な長さのものだったという。そこで、それらの配列をコンピュータ上でさらに長くつなぎ合わせる手法「Hi-Cスキャフォルディング」が用いられ、核ゲノムを構成する24本の染色体のDNA配列情報を組み上げることに成功したという。また、今回の手順で使用されたサンマのHi-Cデータは、研究チームにおいて最適化された実験手法「iconHi-Cプロトコル」により比較的安価に取得できたとした。

続いて、全ゲノム配列情報の精査が行われた。今回のサンマのゲノム情報は、研究数の多い伝統的な実験動物のゲノム情報と比較しても、遜色がない、あるいはそれを凌ぐほどの完成度が示されていたという。

  • ゲノム配列中の反復配列の種類と量

    ゲノム配列中の反復配列の種類と量。ほかの脊椎動物のゲノム解析から知られている反復配列の種類のそれぞれについて、サンマとメダカの全ゲノム配列中の量が図示されている。これら2種共にゲノム全体の約半分弱が反復配列で占められていることに加えて、サンマでは、それぞれの種類の絶対量がメダカに対して大幅に増加していることがわかる(出所:遺伝研Webサイト)

基盤情報の早期公開が目標とされていたことから、今回の研究では、基本的なゲノム構造の分析に絞って取得されたゲノム配列の解析が行われた。数百~数千塩基の繰り返し配列からなる反復配列の分量がメダカと比較されたところ、サンマにおけるその種類の全体的な割合はメダカと同程度だが、絶対的な塩基数が大きく異なっており、この差異がゲノムサイズを変動させた大きな要因だったことが解明された。一方で、染色体規模の配列の比較により、硬骨魚類のダツ目において、サンマとメダカの系統が約7000万年前に分岐した後に起きた染色体間の再構成は稀であり、サンマとメダカの系統間では、染色体の構成は大部分維持されてきたことも明らかにされた。

  • サンマの染色体のDNA配列のメダカとの比較

    サンマの染色体のDNA配列のメダカとの比較。横軸(サンマ)と縦軸(メダカ)は、第1番染色体の端から染色体を並べた際の累積塩基数が表されており、格子の内部の斜めの線が、そのDNA配列の類似性が高い部位。サンマと同様にメダカの核型も2n=48。広い領域に渡る類似部位は種間で1対1に対応し、それが染色体を単位に生じていることから、共通の祖先に存在した染色体が若干の変更を受けながらもそれぞれの種へ引き継がれてきたことがわかる(出所:遺伝研Webサイト)

構築されたサンマの全ゲノム配列情報の良質であることを例証するため、水チャンネルとして機能する「アクアポリンタンパク質」をコードする遺伝子群が調べられた。サンマのゲノムに含まれるアクアポリン遺伝子をすべて検出すると共に、対応するメダカ遺伝子との比較が行われた結果、サンマのゲノム情報には、メダカと同数のアクアポリン遺伝子が含まれていて、それらのエキソンの数も目立った違いはなく、イントロンの大まかな長さも共通していることが示されたという。また、研究チームがサンマのゲノム全体を対象として推定した遺伝子構造は、NCBIデータベースによって独立に行われた推定と近いこともデータの高品質を裏付けているとした。

今回取得されたサンマの全ゲノム情報とそれに基づく遺伝子情報は、DNA Data Bank of JapanおよびNCBIにて公開中だ(情報へのリンクは、Webサイト「サンマのゲノム情報」に集積されている)。今回のゲノム情報は、外洋でのサンマの集団構造や遺伝的多様性の把握、そして、ほかの生物種との関係や集団の進化的な来歴だけでなく、サンマの種を特徴づける形質の成り立ちを知るために特定の遺伝子の機能を調べる際の基礎情報になるとしている。

  • 公開されているサンマの全ゲノム情報

    公開されているサンマの全ゲノム情報。(A)サンマの遺伝子配列検索用Webサイト(遺伝研 分子生命史研究室が運営。)(B)サンマの第1番染色体の中ほどの領域。NCBIにおいて近年整備されたビューワーGenome Data Viewerを通して、ゲノム配列上の遺伝子構造やGC含量や反復配列の構成、そして転写産物の組織ごとの量などを総覧することが可能(出所:遺伝研Webサイト)

なお今回の発表は、塩基配列を読み取ったに過ぎず、あくまで新たな研究基盤の一部が整ったという報告であり、読み取った配列情報の「解読」のための生物学的な研究としてはまだ出発点に過ぎないとしている。