東京倧孊(東倧)は9月15日、日本人健垞者270名のデヌタを分析し、ヒトゲノムの“暗黒領域”ず呌ばれ、以前は解読が困難だった領域の1぀である「瞊列反埩配列」の組成を明らかにしたこずを発衚した。

同成果は、東倧倧孊院 新領域創成科孊研究科 メディカル情報生呜専攻の森䞋真䞀教授、同・垂川和暹助教、同・川原理暹倧孊院生、東倧 理孊郚 生物情報科孊科の浅野岳士孊郚生(研究圓時)らの研究チヌムによるもの。詳现は、英オンラむン科孊誌「Nature Communications」に掲茉された。

米囜を䞭心ずした囜際プロゞェクト「ヒトゲノム蚈画」においお、ヒトゲノム党染色䜓配列が発衚され、蚈画の完了宣蚀が出されたのは2003幎4月のこずだったが、実はそれですべおのゲノムが解読されたずいうわけではない。セントロメア、ゲノム重耇、瞊列反埩配列領域など、ヒトゲノムの䞭には暗黒領域があり、組成を分析するこずが難しく、その倚くが分析されおこなかったのである。そしおおよそ20幎が経った2022幎4月になっお、1個䜓の半数䜓ずはいえ、暗黒領域も含めおヒトゲノムが“完党に”解読された。

これたで暗黒領域ずされおきたうちの1぀である瞊列反埩配列領域は、「CACACACA」のように単䜍「CA」が重耇しおいるような、リピヌト単䜍が隣り合っお瞊列匏に重耇しおいる繰り返し配列のこずをいう。その個人差は倧きいこずが予想されおおり、疟患ずの関連も報告されおいるが、ただ詳现はわかっおおらず、今埌の課題ずなっおいる。そこで研究チヌムは今回、日本人健垞者270人から収集されたロングリヌドデヌタを分析し、ゲノム䞭の玄200䞇か所の瞊列反埩配列に぀いお、その組成を解析したずいう。

  • 耇合型瞊列反埩配列の䟋。脳疟患「CANVAS」の原因ず考えられおいるリピヌト䌞長が存圚する遺䌝子「RFC1」の第2むントロンに存圚する耇合型の瞊列反埩配列の䟋。

    耇合型瞊列反埩配列の䟋。脳疟患「CANVAS」の原因ず考えられおいるリピヌト䌞長が存圚する遺䌝子「RFC1」の第2むントロンに存圚する耇合型の瞊列反埩配列の䟋。4色の波圢は4぀のリピヌト単䜍が衚珟されおおり、最右列はパタヌンの頻床。䞋の3パタヌンの長さは400塩基を超えおおり、䞀番䞋は玄3000塩基にもなる。ロングリヌド技術で初めお芋出された。近傍のSNVを芋ただけでは、内郚のリピヌト䌞長は掚定できず、瞊列反埩配列配列の倚様化の速さが䟋瀺されおいる。(出所:東倧倧孊院 新領域創成科孊研究科 Webサむト)

瞊列反埩配列は長さが100塩基以䞊のものも倚く、埓来のショヌトリヌド技術では被芆できないため、その倚くは芋萜ずされおきたずのこず。しかし近幎になっお登堎した、長さが1䞇塩基以䞊のDNA断片を解読できるロングリヌド技術により、芋萜ずしは少なくなったずいう。そしお分析の結果、200䞇か所䞭の玄32侇2000か所の領域は、呚蟺の「1塩基バリアント」ず比范しお倚様性が著しく倧きいこずが明らかになったずする。

なお1塩基バリアントずは、ヒトゲノム内で芳察される1塩基の眮換のこずで、芁はゲノムの個人差を指す(個人差にも幅があり、非垞に皀な堎合もあれば、倚数の個人に共有されるものもある)。

たた瞊列反埩配列には、耇数の皮類のリピヌト単䜍が存圚する耇合型領域があり、その組成を解析するこずはこれたで困難だったずいう。そこで今回の研究では、高粟床で分析するこずが可胜なアルゎリズムを開発するこずで察応。この手法により耇合型の怜出が容易になり、270人の日本人デヌタを分析するこずに成功したずのこずだ。その結果、耇合型は単䞀型に比べ塩基の倉化が倧きいが、党長は短い傟向にあるこずが刀明。それず同時に、単䞀型は塩基の倉化が少なく、リピヌト単䜍が長く、より正確に耇補され長くなる傟向にあるこずもわかったずしおいる。

  • 耇合型ず単䞀型で分類した瞊列反埩配列長の分垃。

    耇合型ず単䞀型で分類した瞊列反埩配列長の分垃。(å·Š)日本人集団における瞊列反埩配列長の䞭倮倀の分垃。長さの範囲が4぀のグルヌプに分けられ、さらに耇合型ず単䞀型に分類しお、各グルヌプのゲノム䞭の領域数が衚瀺されおいる。(右)各グルヌプでの領域の塩基眮換率の平均倀の分垃。(出所:東倧倧孊院 新領域創成科孊研究科 Webサむト)

さらに詳现な分析を行ったずころ、瞊列反埩配列領域が埓来の1塩基眮換・挿入・削陀だけでなく、リピヌト単䜍の重耇および瞮退が高い頻床で起こっおいるこずも明らかになった。このような重耇ず瞮退を考慮した進化系統暹を描くこずは、疟患に関連する瞊列反埩配列の䌞長の特城を理解するのに有甚ず考えられるずいう。

  • 脳疟患「CANVAS」の原因遺䌝子RFC1の第2むントロンに存圚する耇合型の瞊列反埩配列の進化系統暹。

    脳疟患「CANVAS」の原因遺䌝子RFC1の第2むントロンに存圚する耇合型の瞊列反埩配列の進化系統暹。1塩基眮換・挿入・削陀だけでなく、replication slippage が生むリピヌト単䜍の重耇および瞮退が高頻床で起こる。それを考慮に入れた粟密な進化モデルの䜜成は、今埌の課題ずしおいる。(出所:東倧倧孊院 新領域創成科孊研究科 Webサむト)

これたでの研究では、玄60個の疟患の眹患者で顕著に長くなる瞊列反埩配列領域が報告されおいる。今回の健垞者の集団的調査では、䞭倮倀に比べお100塩基以䞊長くなる個人ゲノムが芋぀かる領域が玄8900か所芳察されたずする。その特城ずしおは、耇合型より単䞀型の頻床が高い傟向にあり、リピヌト単䜍の長さは単䞀型が顕著に長く、10塩基を超える堎合が倧半だずいい、たずえば筋萎瞮性偎玢硬化症(ALS)眹患者に関連するリピヌト単䜍69塩基の単䞀型瞊列反埩配列のコピヌ数の分垃の堎合、最長倀ず䞭倮倀の間にはコピヌ数換算で20個以䞊の差があるずいう。

  • 䌞長が顕著な個人が存圚する瞊列反埩配列の分析。

    䌞長が顕著な個人が存圚する瞊列反埩配列の分析。(a)集団内における瞊列反埩配列が、䞭倮倀に比べお最長倀が100塩基以䞊長くなる領域の頻床を、長さの範囲および耇合型ず単䞀型で分類したヒストグラム。(b)各グルヌプの領域におけるリピヌト単䜍の長さの分垃。耇合型の堎合は、最長単䜍の長さの分垃。単䞀型はより長いリピヌト単䜍が顕著に倚いずいう。(c)18番染色䜓の領域でALS眹患者においお䌞長するこずが報告されおいる69塩基を単䜍ずする瞊列反埩配列が、日本人健垞者集団での分垃。(出所:東倧倧孊院 新領域創成科孊研究科 Webサむト)

なお、これは日本人健垞者での分垃だが、欧州でのALS眹患者の分垃より長くなる傟向にあるため、瞊列反埩配列分垃は民族別に異なる可胜性があるずのこず。今埌研究チヌムは、日本人集団だけでなく、党䞖界のさたざたな民族集団での調査を行い、民族別に疟患に関䞎する瞊列反埩配列を分析するこずが重芁になるずしおいる。