理化学研究所(理研)、静岡県立総合病院、静岡県立大学、東京大学(東大)の4者は4月18日、大規模な日本人の「全ゲノムシークエンス」(WGS)情報を分析し、日本人の祖先に関わる3つの源流(縄文系祖先、関西系祖先、東北系祖先)の起源を解明、さらに現生人類(ホモ・サピエンス)の最も近縁とされる旧人ネアンデルタール人やデニソワ人から受け継いだ遺伝子領域を特定したことを共同で発表した。

同成果は、理研 生命医科学研究センター ゲノム解析応用研究チームの寺尾知可史チームリーダー(静岡県立総合病院 臨床研究部 免疫研究部長/静岡県立大学 薬学部ゲノム病態解析講座 特任教授兼任)、同・劉暁渓研究員(現・上級研究員)/静岡県立総合病院 臨床研究部 研究員兼任、東大 医科学研究所附属 ヒトゲノム解析センター シークエンス技術開発分野の松田浩一特任教授らの共同研究チームによるもの。詳細は、米国科学振興協会が刊行する「Science」系のオープンアクセスジャーナル「Science Advances」に掲載された。

日本人集団を対象としたWGS研究は、規模が限定的だったことから研究チームは今回、バイオバンク・ジャパンにより全国7地域(北海道、東北、関東、中部、関西、九州、沖縄)の医療機関に登録された合計3256人分という大規模なWGSを実施してデータセット「Japanese Encyclopedia of Whole/Exome Sequencing Library(JEWEL)」を作成し、日本人特有の遺伝的特徴を解明することにしたという。

  • 大規模な日本人のWGSから日本人集団の遺伝的構造などが解明された

    大規模な日本人のWGSから日本人集団の遺伝的構造などが解明された(出所:静岡県立大Webサイト)

JEWELの最終データセットは、4558万6919個の一塩基バリアント(SNV)と、911万3420個のindel(ゲノム配列における塩基配列の挿入または欠失のどちらかあるいは両方)を含み、そのうち1541万953個(32.7%)がJEWELで新たに観察されたバリアントだったとする。

日本人の集団構造を理解するための解析が行われた結果、日本人口は3つの祖先(以下、K1、K2、K3)の混合によって最もよくモデル化できることが示唆されたという。K1、K2、K3はそれぞれ沖縄、東北、関西で最も高まる。K1(沖縄)成分は、南(沖縄に隣接する地域)を除く本土のサブグループで比較的安定した割合の約12%を維持し、南ではより高い割合の22%が示され、K2(東北)とK3(関西)成分は西から東北へ徐々に変化していくことが確認された。

  • WGSデータを使用した日本人集団構造結果

    WGSデータを使用した日本人集団構造結果。(A)サンプルが集められた日本の7地域。(B)コモンバリアントを基にしたPCA分析が行われ、参加者が集められた地域ごとに色分けが行われた。(C)レアバリアントに基づくPCA-UMAP分析が示されている。(B)と(C)では、1つ1つの点が個人を表しており、点と点との距離は遺伝学的な違いが反映されている。近い点ほど遺伝学的には近縁である。この2つの図では、出身地を元にした遺伝背景の違いにより、色分けして表示されている。(D)ADMIXTURE分析が行われ、3つの集団(K=3)に分けられた。沖縄以外の地域からはランダムに100人が選ばれ、沖縄からは全員(28人)がそれぞれ分析された。K1は沖縄、K2とK3はそれぞれ東北と関西で最も高い値が示されている(出所:静岡県立大Webサイト)

縄文の祖先比率については、沖縄が最も高い比率(28.5%)を持ち、次いで東北(18.9%)である一方、関西が最も低い(13.4%)と推定された。これは、縄文人と沖縄の人々の間に高い遺伝的親和性があることを示す以前の研究と一致しているほか、関西地方は漢民族と遺伝的親和性が高いことが明らかにされた。

さらに、中国、韓国、日本から報告された古代人ゲノムデータを使って、東北と関西の間の遺伝的親和性の違いが評価された結果、関西人と黄河(YR)、または、その上流地域の中新石器時代および後新石器時代古代中国集団との間に顕著に密接な関係があることが見受けられたという。対照的に、東北地方の個体は、縄文人との遺伝的親和性が顕著に高く、また沖縄の宮古島の古代日本人ゲノム(高い縄文比率を持つ)や韓国三国時代(4~5世紀)の古代韓国人とも高い遺伝的親和性を持つことが示されたとした。

さらに、ネアンデルタール人やデニソワ人から引き継がれた可能性のある遺伝子配列として、ネアンデルタール人由来の約49Mb(DNAの長さの単位で1Mbは100万塩基対)とデニソワ人由来の約1.47Mbの遺伝子配列を検出。合計で、ネアンデルタール人から引き継がれた可能性が高い3079セグメント(ゲノム領域)と、デニソワ人から引き継がれた可能性の高い210セグメントが特定され、それぞれ772Mbと31.46Mbのゲノムをカバーしているとした。

  • 日本人集団におけるネアンデルタール人またはデニソワ人から混入されたDNA配列

    日本人集団におけるネアンデルタール人またはデニソワ人から混入されたDNA配列。各染色体にわたり混入された配列の分布を示す密度プロット。上部のトラック(青で示される)はネアンデルタール人から直接受け継がれたと考えられる配列が表されており、下部のトラック(赤で示される)はデニソワ人からの配列が示されている(出所:静岡県立大Webサイト)

続いて、引き継がれた配列が106の表現型に与える影響の調査が行われ、ネアンデルタール人由来の42個とデニソワ人由来の2個を含む44の領域と49の表現型とが関連付けられたとする。ネアンデルタール人由来のセグメントは2型糖尿病(T2D)、冠状動脈疾患(CAD)、安定狭心症(SAP)、アトピー性皮膚炎(AD)、グレーブス病(GD)、前立腺がん(PrCa)、関節リウマチ(RA)など、7つの病気と関連する11の領域が観察されたという。またPOLR3Eのデニソワ人由来セグメントは身長と、NKX6-1のセグメントはT2Dと関連していることが判明したとのこと。

  • デニソワ人から混入された遺伝子

    デニソワ人から混入された遺伝子。NKX6-1遺伝子の領域におけるデニソワ人から直接受け継がれたと考えられる変異は、日本人集団における2型糖尿病(T2D)と関連している。横軸にヒトゲノム染色体上の位置、縦軸に各変異のT2Dとの関連の強さが示された。三角形はデニソワ人から受け継がれた変異で、灰色の点はそれ以外の変異が示されている(出所:静岡県立大Webサイト)

さらに、関西、関東、東北、九州、沖縄の5つの代表的な地域を横断する選択プロファイルの潜在的な地域差が探られた。本州地域全体で類似の選択プロファイルが観察されたが、アルコール代謝に関係するADHクラスタシグナルは沖縄では比較的弱く、ALDH2遺伝子領域への自然選択は本土集団でのみ検出されたという。これらの差異は、沖縄のサンプルサイズが限られているため、または選択圧が異なる可能性があるため、さらなる研究が必要とする。

さらに、i過去50世代で選択の対象となった可能性がある4つの候補領域が特定された。そこに含まれるADH、ALDH2、MHCの3領域は、以前の研究でも検出されており、日本人口における自己免疫系とアルコール代謝経路への強い選択圧の存在をさらに裏付けるものとした。

  • 自然選択検出の結果

    自然選択検出の結果。(A)iHS法では、自然選択された可能性のある3つのゲノム領域が特定された。(B)FastSMC法では、自然選択された可能性のある4つのゲノム領域が特定された。グラフの横軸は染色体上の位置、縦軸は自然選択の痕跡の強さが表されている。プロットは各領域の解析結果が示されており、縦軸の値が大きいほど強く自然選択の影響を受けたことを意味するとした(出所:静岡県立大Webサイト)

今回の研究成果は、大規模な現代日本人ゲノム情報に基づいて、近年になって提唱された日本人の起源に関する「三重構造モデル」の裏付けになり、日本の人口構造をより適切に説明する可能性があることが考えられるとしている。さらに、今回の研究では初めて日本人の遺伝的構造に対する東北地方人の祖先の影響の重要性が強調され、東北地方は歴史的に蝦夷(エミシ)が居住していた地域であることから、彼らの起源を調べる必要があるとしている。