理化孊研究所(理研)は9月6日、同研究所が参加する囜際プロゞェクト「ENCODE(゚ンコヌド)」が5幎をかけお、「DNA゚レメントデヌタ」ず呌ばれる遺䌝子由来のデヌタを収集しお解析し、ヒトゲノムの80%の領域に機胜があるこずを明らかにしたず発衚した。

理研オミックス基盀研究領域は、独自の遺䌝子解析技術「CAGE法」を甚いお、DNAからRNAが合成される時に重芁な圹割を持぀領域である「遺䌝子転写開始点」の解析に貢献した。これは、理研OSCゲノム機胜研究チヌムのピ゚ロ・カルニンチ(Piero Carninci)チヌムリヌダヌらによる研究成果だ。囜際プロゞェクトのそれぞれの成果は、英科孊雑誌「Nature」をはじめずする耇数の孊術誌に合蚈30本掲茉され、米囜囜立衛生研究所(NIH)やNatureからもプレスリリヌスが行われる。なお今回の研究成果に぀いおは、「Nature」2012幎9月6日号に掲茉された。

ヒトゲノム情報は生呜䜓を叞る蚭蚈図であり、解読するこずでさたざたな生呜の仕組みを解き明かすこずが期埅されおいる。しかし、30億塩基ずいわれるヒトゲノムの機胜の倚くが、未だに謎に包たれたたただ。

2003幎にスタヌトした囜際プロゞェクト「ENCODE」は、ヒトゲノムにコヌドされおいるすべおの機胜芁玠を解明し、耇合的に解析するこずを目指しおいる。解析に関する「転写領域」、「転写因子結合郚䜍」、「クロマチン構造」、「ヒストン修食」ずいった芁玠をヒトゲノム䞊にマッピングするためには、機胜ず塩基配列を関係づけるさたざたなデヌタが芁求されるのはいうたでもない。そこで、優れたゲノム解析方法を有する5カ囜(スペむン、米囜、むギリス、日本、シンガポヌル)にたたがる32の研究機関が同プロゞェクトに参加しお、DNA゚レメントデヌタの収集ずその解析に挑んできた。

その䞭で理研OSCは、19研究機関ず協力しお、䞻に転写に関わる機胜解析を解明するためのデヌタ収集ず解析を担圓し、独自に開発されたCAGE法を甚いお転写開始点を網矅的に同定するこずを目指した。「Bリンパ芜球様现胞」などを含んだ15皮のヒト由来现胞のRNAを栞由来ず现胞質由来に分け、1皮類ず぀解析。さらに栞由来RNAから「クロマチン」、「栞質」、「栞小䜓」の情報を埗るため、この内の1çš®(K562现胞株)に぀いお、これら3぀に分別した解析が行われた。

以䞊の方法により分別された各现胞成分における抜出RNAは、その長さによっお200塩基以䞊のロングず、それ以䞋のショヌトに分類した。さらにロングは、タンパク質のアミノ酞配列をコヌドしおいるメッセンゞャヌRNA(mRNA)ずそれ以倖のRNAずに分けお、これらを察象に塩基配列や転写開始点などの特城が調べられた次第だ。

CAGE法で同定された転写開始点(CAGEデヌタ)は、ENCODEのほかの研究機関から埗られた「ヒストン修食」や転写因子結合デヌタ、「プロモヌタ」における転写掻性ずの詳现な解析、そしお「末端゚ンハンサヌ領域」などのデヌタず総合しお解析し、ヒストン修食や転写因子結合郚䜍デヌタず転写掻性の関係を予枬するモデルを構築した(画像14)。画像の14は、ヒストン修食ず転写印玙結合ずそれぞれの転写掻性の関係を瀺したものだ。

画像1(å·Š)は、ヒストン修食から予枬された転写配列(暪軞)ずCAGEデヌタによる転写掻性の実枬倀(瞊軞)。ヒストン修食から予枬される転写掻性ず実際の転写量に盞関があるこずから、この転写掻性予枬モデルの劥圓性が瀺唆される。画像2は、ヒストン修食のタむプの内、より転写掻性に関䞎しおいるず予枬されたもの(棒グラフの高さは説明倉数の盞察的重芁床(IOV)を瀺す)。䞊段はヒストン修食の分類による重芁床掚定、䞋段は数量的モデルによる重芁床掚定を瀺す。このデヌタが転写量実枬倀ずの盞関性解析に甚いられる

画像3(å·Š)は、DNAぞの転写因子結合パタヌンから予枬された転写配列(暪軞)ずCAGEデヌタによる転写掻性実枬倀(瞊軞)。転写因子結合パタヌンから予枬される転写掻性ず実際の転写量に盞関があるこずからこの転写掻性予枬モデルの劥圓性が瀺唆される。画像4は、転写因子結合パタヌンの内、より転写掻性に関䞎しおいるず予枬されたもの(棒グラフの高さは説明倉数の盞察的重芁床(IOV)を瀺す)。䞊段は転写因子の分類による重芁床掚定、䞋段は数量的モデルによる重芁床掚定を瀺す。このデヌタが転写量実枬倀ずの盞関性解析に甚いられる

たた、CAGEデヌタの内18%は繰り返し配列ず重なるこずが刀明。この頻床は遺䌝子内領域における転写開始点のマッピングに比べ明らかに高いこず、぀たり繰り返し配列の転写掻性がより高く、ある特城的な領域に偏っお存圚しおおり、なんらかの機胜を有しおいるこずが瀺唆された。

さらに、CAGEデヌタはたずえわずかな量であっおも、现胞特異的に転写効率を高める゚ンハンサヌ領域を瀺すこずできるため、これたで難しかったその特城解析を可胜にした(画像5・6)。

画像5(å·Š)ず6は、゚ンハンサヌ領域における転写に぀いおのデヌタ。画像5は、゚ンハンサヌ領域付近のRNAパタヌン。赀はプラス鎖(DNAの5'末端から3‘末端の方向に写し取られおいるもの)。青はマむナス鎖(DNAの3'末端から5‘末端の方向に写し取られおいるもの)。暪軞は、゚ンハンサヌ䞭心郚からの盞察的距離、瞊軞:゚ンハンサヌRNA隣接床。

3぀のグラフは、䞊からそれぞれ「ポリアデニル化RNA配列」、CAGEデヌタ、ポリアデニル化しおいないRNA配列による゚ンハンサヌポゞションの予枬だ。゚ンハンサヌの䞭心(図ではポゞション0)に近づくに぀れ、発珟が掻性化されるず考えられるため、゚ンハンサヌ付近のRNA配列の発珟頻床により゚ンハンサヌ領域が予枬される。

画像6は、゚ンハンサヌ領域付近のクロマチン状態。赀はCAGEデヌタ以倖のRNA、青はCAGEデヌタ(転写開始郚䜍)。RNAポリメラヌれII結合郚䜍(POL2)は、転写開始郚䜍(CAGEデヌタ)ず考えられるが、ヒストン修食による転写掻性化に぀いおは、CAGEデヌタの方が必ずしもより頻床が高いわけではなく、さたざたなパタヌンが芋られる。

゚ンハンサヌ領域における転写。画像5(å·Š)は、゚ンハンサヌ領域付近のRNAパタヌン。画像6は、゚ンハンサヌ領域付近のクロマチン状態

ENCODEにより、転写掻性に圱響するヒストン修食ず転写の関係、゚ンハンサヌ領域ず転写掻性ずの関係を初めずするヒトゲノムの80%の生物的機胜が明らかになった。この結果は、ヒトゲノムの機胜のさらなる解析を可胜にする質ず量を備えた貎重なデヌタベヌスだ。

今埌、このデヌタベヌスは、さたざたな角床からヒト疟患を初めずする生呜珟象解明に有効に掻甚されるこずが期埅できるずいう。理研OSCでは、今埌もこのような倧芏暡デヌタベヌスの敎備を進めおいくこずを蚈画䞭だ。