東京大学は10月14日、47都道府県に居住する日本人約1万1000名の全ゲノムSNP遺伝子型データを用いて、都道府県レベルで日本人の遺伝的集団構造の調査を実施した結果を発表した。そしてクラスター分析により、47都道府県は沖縄県とそれ以外の都道府県に分かれ、沖縄県以外は九州・中国地方、東北・北海道地方、近畿・四国地方の3つのクラスターに大別され、関東地方や中部地方の各県はひとつのクラスター内に収まらなかったとした。また同時に、主成分分析の結果、第1主成分は沖縄県との遺伝的距離と関連しており、第2主成分は緯度・経度と関連していたことも判明した。

同成果は、同大学大学院理学系研究科の渡部裕介 大学院生、一色真理子 大学院生(ふたりとも研究当時)、大橋順 准教授らの研究チームによるもの。詳細は、ヒトの遺伝子を扱った学術誌「Journal of Human Genetics」に掲載された。

現代の日本人(アイヌ人、琉球人、本土人)は、これまでの研究から、縄文人の系統と、渡来人の系統が混血した集団の子孫であると示唆されている。しかし、日本の7つの地域間の遺伝的異質性を指摘した先行研究があるが、中国地方や四国地方の県は含まれておらず、7つの地域に分けることの妥当性を含め、日本人集団の詳細な遺伝的集団構造やかかる構造を生じさせた要因がよく理解されていなかったという。

また、地域間の遺伝的異質性が不明なため、日本人を対象とする疾患遺伝子関連研究において、集団階層化によるバイアスを避けた検体の収集が困難という課題もあった。

そうした中、研究チームはヤフー株式会社が提供するゲノム解析サービス「HealthData Lab」の顧客1万1069名の13万8688か所の常染色体SNP遺伝子型データを用いて、日本人の遺伝的集団構造の調査を実施した。SNP(single nucleotide polymorphism)とは、単塩基多型のことだ。A/T/G/Cの4種類によるヒトのDNAの塩基配列を比較すると、個人間で0.1%程度の違いがある。その塩基配列の違いを多型といい、単塩基多型とは、ひとつの塩基の違いによる多型のことをいう。

まず、個人レベルでの主成分分析が行われ、琉球人(主に沖縄県)と本土人(主に沖縄県以外の46都道府県)が遺伝的に明瞭に分かれることが確認された。なお、今回の研究に用いられたデータには、アイヌ人は含まれていないと考えられるという。

  • 全ゲノムSNP遺伝子型データ

    日本人1万1069名と、中国・北京の漢民族の主成分分析の結果。常染色体上の13万8688か所のSNP遺伝子型データから各個人の主成分得点が求められてプロットされている (出所:東京大学Webサイト)

ちなみに主成分分析とは、多数の変数(多次元データ)から全体のばらつきをよく表す順に互いに直行する変数(主成分)を合成する多変量解析手法のひとつである。主成分分析によって次元を削減することで、データ点を可視化することが可能という特徴を持つ。今回の研究では、個人単位の解析では遺伝子型が、都道府県単位での解析では「アリル頻度」が変数として用いられた。アリル頻度とは、ある集団において特定のSNPが出現する頻度のことを指す。

次に、47都道府県のそれぞれから50名ずつ無作為抽出して、各SNPのアリル頻度を計算し、中国・北京の漢民族も含めて、組み合わせ技法のひとつであるペアワイズ法に「f2統計量」を求めてのクラスター分析が実施された。またf2統計量とは、ふたつの集団間の遺伝距離を測る尺度のひとつのことだ。SNPデータに対するf2統計量は、SNPごとにアリル頻度の集団間差の2乗を計算し、それらの平均値として与えられる。

  • 全ゲノムSNP遺伝子型データ

    47都道府県と中国・北京の漢民族を対象にしたクラスター分析の結果。日本地図上の番号が各都道府県に対応している。47都道府県を4つのクラスターに分類すると、沖縄地方、東北・北海道地方、近畿・四国地方、九州・中国地方に大別されることが確認された (出所:東京大学Webサイト)

47都道府県を分類すると、沖縄地方、東北・北海道地方、近畿・四国地方、九州・中国地方の4つのクラスターに大別されたという。それに対し、関東地方や中部地方の各都県はひとつのクラスター内に収まらなかった。このことは、関東地方もしくは中部地方の都県を遺伝的に近縁な集団とみなすことはできないとする。また、そのような単位で日本人集団の遺伝的構造を論じることや、疾患遺伝子関連研究の対象検体を収集することは適切ではないことを示しているとした。

47都道府県を対象にした主成分分析も行われ、第1主成分は沖縄県と各都道府県の遺伝的距離が反映されたものだった。沖縄県に遺伝的に最も近いのは、距離的に最も近い鹿児島県と判明。画像2でクラスターを形成した地方に着目すると、九州地方と東北地方が沖縄県に遺伝的に近く、近畿地方と四国地方が遺伝的に遠いことも確認された。さらにf2統計量の解析から、近畿地方や四国地方は中国・北京の漢民族に遺伝的に近いことも確認された。第2主成分は都道府県の緯度および経度と有意に相関していることもわかったという。

  • 全ゲノムSNP遺伝子型データ

    47都道府県を対象にした主成分分析の結果 (出所:東京大学Webサイト)

今回の研究成果は、各都道府県の縄文人と大陸から来た渡来人との混血の程度の違いと地理的位置関係が、本土人の遺伝的地域差を形成した主要因であることを示唆しているという。

大部分の渡来人は、朝鮮半島経由で日本列島に到達したと考えられるが、朝鮮半島から地理的に近い九州北部ではなく、近畿地方や四国地方の人々に渡来人の遺伝的構成成分がより多く残っていることは、日本列島における縄文人と渡来人の混血過程を考えるうえで興味深いこととしている。本土人のゲノム成分の80%程度は渡来人由来であると推定されているが、近畿地方や四国地方には、さらに多くの割合の渡来人が流入したことも考えられるという。

また、地理的位置も遺伝的構造に影響していることや、沖縄県に遺伝的に近い九州地方と東北地方が互いには近縁でないことから、渡来人との混血時に縄文人は遺伝的に分化していたと考えられるとした。

今回の研究により、都道府県レベルで本土日本人の遺伝的集団構造が初めて明らかにされた。47都道府県の遺伝的近縁関係がわかったことで、日本列島全域での縄文人と渡来人の混血過程の理解が進むと期待されるという。また、日本人集団を対象にした疾患遺伝子関連研究において、集団階層化によるバイアスを極力避けた、適切な検体収集地域の選定が可能になると期待されるとしている。