1. トップ
  2. 語り合う
  3. ゲノムの解剖学

進化研究を覗く

顧問の西川伸一を中心に館員が、今進化研究がどのようにおこなわれているかを紹介していきます。進化研究とは何をすることなのか? 歴史的背景も含めお話しします。

バックナンバー

ゲノムの解剖学

2015年6月2日

31話でゲノムは情報だと結論した。では私たちのゲノムがどんな要素からできているのか、まず解剖学から始めよう。実際にはミトコンドリアにもゲノムはあるのだが、話を簡単にするために核内のゲノムに限る。一部の細胞(例えば赤血球)を除いて、私たちの細胞の全てに核があるが、ゲノムはこの核内にあるDNA総体が表現している情報だ。核内には46本に分かれたDNAが存在し、ヒストンをはじめとする多くのタンパク質と結合して、コンパクトに折りたたまれ、染色体を形成している(図1)。この染色体一本一本の基本的構造は同じなので、ここからはゲノムが一本の染色体からできているかのように話を進める。


図1 ヒトのゲノムは核の中に46本の染色体に分かれたDNA。

ヒトのゲノム全体は、約30億個のヌクレオチドが連なった高分子で、ヌクレオチドの持つ4種類の塩基の組み合わせが媒体となって全ての情報が書かれている。ゲノム内の情報がコードする最も重要なものが、細胞という化学反応系を形成・維持するための基本分子であるたんぱく質で、これに対応するゲノム部分をcoding DNAと呼んでいる。何をcodingと呼ぶかは定義の問題なので、ここではタンパク質まで翻訳される遺伝子をcodingDNAと呼ぶ。ただこのcoding DNAに対応する遺伝子はヒトで22000程度しかなく、全ゲノムに占める割合は1.5%もない。少数の例外を除いて、個々のたんぱく質をコードする遺伝子はエクソンと呼ばれる小さな部分に別れて存在している。一度RNAに転写されてから、たんぱく質の情報に関わらない部分を除去した一本のmRNAへとつなぎ合わせた後翻訳される。このエクソンとエクソンの間にある配列をイントロンと呼ぶ。遺伝子が情報としての機能を発揮するためには、他にも遺伝子を正しい場所からRNAに転写するための様々な指令情報が必要だ。このほとんどは、エクソンの外、すなわちイントロンや遺伝子から様々な距離で離れたnon-coding領域に存在している。これからわかるのは(図2)、たんぱく質という「モノ」に対する情報(エクソン)と、モノの情報を書き出すための様々な標識、すなわち「コト」に対する情報から一つのcoding単位ができていることだ。

図2 coding遺伝子単位の概略。調節領域の指令で遺伝子が転写されると、RNA maturation に関わる標識により、イントロンが除去された一本のmRNAが形成される。

「モノ」「コト」両方の情報を含めると、coding単位がゲノムに占める割合はずっと大きくなるが、逆にその正確なサイズは測定しにくくなる。なぜなら、「コト」に必要な情報が、ゲノムのどこからどこまで必要かを正確に算定できないからだ(これは次回に議論する)。さらに、同じ遺伝子領域に逆向きに異なる遺伝子が並んでいることもある。したがって、正確にcoding遺伝子セットが占めるゲノム上の割合を算定することは難しい。

次にcodingとは言えないが、構造的には遺伝子と呼べる単位が存在している。ただ、正常な遺伝子とは異なり、そのまま翻訳されタンパク質ができることはない。そのため、偽遺伝子と呼ばれている。ヒトでは偽遺伝子と考えられる部分がなんと1万以上も存在している。進化の過程では、coding遺伝子が重複を繰り返して多様性を拡大するのをよく見ることができる。このように重複した遺伝子に変異が導入されて機能がなくなると偽遺伝子と呼ばれるようになる。偽遺伝子が最も多いのは嗅覚受容体で、ヒトでは400の機能的遺伝子に対してなんと600もの偽遺伝子が存在している。ただ、偽遺伝子だからなんの役割もないと決め付けることはできない。成り立ちから考えても、偽遺伝子といえども、構造的には遺伝子と同じだ。しかも、機能していないことから、変異が蓄積されやすく、新しい機能を持った遺伝子を作るという目的にはうってつけの材料だ(例えば第21話参照)。この意味で、遠い将来、新しい機能を持つ分子の資源としての役割を担っているということができる(図3)。また、ニワトリの免疫グロブリン遺伝子で見られるように、機能的抗体遺伝子と遺伝子転換により部分の交換を行うことで抗体の多様性を生みだすための鋳型として働いている場合もある。このように、ゲノム各領域を、それが必要とされる時間スケールを変えて見ることは、ゲノム理解について重要で、これについても次回以降議論する予定だ。


図3 偽遺伝子が持ちうる2つの機能。

DNAにコード可能な生体機能分子はタンパクだけではない。これまで多くの機能を持つRNA分子が知られている。リボゾームRNAやトランスファーRNAなどのタンパク翻訳に関わるRNAはその代表的なものだが、他にもスプライシングやRNA編集などのRNA成熟、DNA合成、遺伝子制御、トランスポゾン制御など、多岐にわたる機能を持つRNAが知られている。機能の詳細は省いて図にまとめておくが、機能的RNAはゲノムの4%ぐらいを占めていると考えられている。これらを一つ一つ紹介するつもりはないが、この中のnoncodingRNAは、DNAが持つもう一つの顔を示していると考えており、これも次回以降議論する。


図4 様々な機能的RNA このリストは機能的RNAの一部。

ここまで主に転写される部分について見てきたが、ゲノムには多くの転写されない場所が存在する。例えば、染色体のヘテロクロマチンと呼ばれる場所に存在する繰り返し配列の集合は、全ゲノムのおおよそ6%を占めている。分裂時に染色体を引っ張る微小管の結合部位である動原体が結合するために使われているセントロメアや、分裂時に染色体が削られて重要な遺伝子が消失するのを防いでいるテロメアなどは、転写はされなくてもゲノムの複製や維持に必須の領域であることがわかっている。しかし、ヘテロクロマチンを形成する他の多くの繰り返し配列は、機能がよくわかっていない。実際、ヘテロクロマチンとそれに対応する繰り返し配列は、種を越えてひろく存在しているが、その配列自身は保存されていない。他にも、超可変ミニサテライト(hypervariable minisatellites)と呼ばれる、ユークロマチンに存在する繰り返し配列も存在する。

ヒトゲノムの解読結果を見た時の一番大きな驚きは、トランスポゾンに由来する配列が全ゲノムの5割近くを占めていたという事実だ(図5)。トランスポゾンとは、基本的には細胞の中で染色体から染色体へ伝搬できる遺伝子単位を指し、図に示すようにLINE, SINE, LTR—トランスポゾン(レトロビールス型)、そしてDNAトランスポゾンに分類されている。


図5 ヒトゲノム中に見られるトランスポゾンの種類とゲノム上の割合。

これらはレトロトランスポゾンと、DNAトランスポゾンに大別され、レトロトランスポゾンはレトロウイルスと同じように、ゲノムからはRNAとして読み出され、そのRNAが逆転写酵素でDNAに転写されたあとゲノムに挿入されることで伝搬する。完全型のレトロトランスポゾンは、従って逆転写酵素をコードしている。逆転写酵素を持たない不完全型レトロトランスポゾンの場合は、完全型のトランスポゾンが発現する逆転写酵素を利用することで伝播が可能だが、基本的には伝搬能力を失っていると見たほうがいいだろう。RNAとしてゲノムからそのまま転写されるレトロトランスポゾンと異なり、DNA型トランスポゾンは自らを正確にゲノムから切り出し、また他の箇所に挿入するためのトランスポゼースと呼ばれる酵素をコードしている。多くの種では、完全なトランスポゼースを持ったトランスポゾンがゲノム中に存在しているが、ヒトゲノム中に存在しているほぼすべてのトランスポゾンは、トランスポゼースの活性を失っている。従ってトランスポゾンの活性を失った化石といえる。

今回は話を進めるための基礎知識として、ゲノムの構造要素の概略を述べた。こうしてヒトゲノムを解剖していくと、こじつけもあるが、おおよそ6割の配列になんらかの意味を対応させることができる。ただ意味や機能が想像だにできない部分が4割近く存在する。また私たちのゲノムのほぼ9割をトランスポゾンか、意味のわからない配列が占め、これらの塩基配列に何か積極的な意味があるようには思えない。このため、ジャンクDNAと呼ばれたりしている。ただ、意味が無いのか、理解できないだけなのか、9割を占めるジャンクについて考えることが必要だ。もちろん種によって、この構造は多様で、ジャンク配列のゲノムに対する割合も大きく違う。次回からは、ゲノムを構造化することで新しい情報が生まれるようすを見ながら、さらにゲノムの理解を進めてみたい。

[ 西川 伸一 ]

進化研究を覗く最新号へ