顧問の西川伸一を中心に館員が、今進化研究がどのようにおこなわれているかを紹介していきます。進化研究とは何をすることなのか? 歴史的背景も含めお話しします。
バックナンバー
最古のゲノム
2014年12月1日
今回からは、進化の論文を気の向くままに取り上げて紹介する。しかし今回も古代のゲノムの話で、ウマのゲノムだ。これまで紹介した我々の先祖やネアンデルタール人の全ゲノム解析は、おおよそ5万年前までで、だいたいこれが古代ゲノム解析の限界だとされている。ミトコンドリアに限ると、やはりペーボさんたちがハイデルベルグ原人として知られる約30万年前の原人のゲノム解読に成功している(Nature, 505:403-6., 2014,)。しかしここまで古くなると、骨からヒト由来のDNAを回収すること自体が至難の技にで、回収できる断片の長さは短くほとんどが40bp以下だ。その上、脱アミノ酸など多くの化学変化が起こっている。このような困難を克服して、30万年前のハイデルベルグ原人が、ネアンデルタール人よりデニソーバ人に近いことを示すことに成功したこの仕事には敬意をはらう。おそらくこの限界を超えるためには、新しい技術の開発が必要だ。実際新しいシークエンサーを組み合わせて、70万年の馬の全ゲノムを解析できたという報告が2013年7月4日号のNature誌に発表された(Nature,499:74−78,2013)。現在もなお、これより古いゲノムの解析報告はなく、現時点でこの報告が古代の全ゲノム配列決定の新記録と言っていいだろう。研究はコペンハーゲンにある地球史博物館のグループを中心に行われている。この馬の骨はカナダのユーコン川近くのThistle Creek(シッスル クリーク)で2003年発見された(発見場所からTCと名付けておこう)。TCが出土した地層は約73万年前の地層で、この時期は永久凍土が溶け出した暖かい時代だ。出土した骨に関して最初に行われるのはもちろん形態の比較だ。これまでに年代測定が終わっている古代のウマや現代のウマと比較することで、この骨が後更新世後よりは古い時代のウマの骨であると結論している。次に骨をドリルで削り得られる粉末に含まれるタンパク成分を質量分析機で調べ、断片の配列から76種類のタンパク質の特定に成功している。こうして得られる様々なタンパクのペプチド配列は、遺伝子配列と対応させることができるため、貴重な情報になる。しかし、70万年を経てもタンパク質がしぶとく生き残っているのを目の当たりにすると感激する。
タンパク質の保存状況から研究グループはDNAも残っているはずだと確信し、ゲノム解読に進んでいる。この研究では他にも16種類の古代の馬のゲノムを解析して比べることで、解析に用いた方法を検証し、信頼できるDNA配列を得ようと最大の努力を払っている。確かに、DNAが残っていたとはいえ、例えばここでも紹介したデニソーバ人の骨から得られた量や質と比べるとかなり劣っていることは明らかだった。そこで、この研究では通常の次世代シークエンサーに加えて、ヘリコスバイオサイエンス社から当時発売されていたDNA断片の配列を増幅することなく解読できる一分子シークエンサーを併用することで、この問題を克服している。現在利用されている次世代シークエンサーでは、遺伝子断片を増幅した後、配列を決める。そのために何段階かの前処理が必要で、その過程でどうしてもサンプルが失われる。一方、一分子シークエンサーでは増幅を行わないため、前処理が1ステップで終わる。このおかげで、集めたDNAをほとんど解析に利用でき、この研究が成功した重要な要因となった。ただ、当時の一分子シークエンサーで決定される配列はエラー頻度が高いという問題があった。この問題を解決できなかったヘリコスバイオサイエンス社は2012年破産に追い込まれた。その意味でこの論文は、ヘリコス社シークエンサーが活躍できた珍しい例といえるかもしれない。ヘリコスは破産したが、現在別の一分子シークエンサーはパシフィックバイオサイエンス社から発売されており、5kbという長い配列の解読が可能という特徴から、現在普及しているシークエンサーの問題を補う目的で徐々に普及が進んできたようだ。この辺の栄枯盛衰についてはNature Method10月号に掲載されたコメンタリーに詳しく書かれているので参考にしてほしい(Nature Method, 11:1003-5, 2014)。
少し脱線したが、様々な条件を注意深く検討し、利用できるウマゲノムデータと比べた後、今回得られ遺伝子配列は十分信頼に足ると確信して、情報解析に進んでいる。しかし全ゲノムといっても1.12倍のカバー率をようやく達成できた程度で、集団間の比較などには向かないだろう。いずれにせよここまで来るのも大変な作業であったことが伺い知れる。では、得られた配列から何が結論できるのだろうか?まず系統樹が明らかになる。
図1 TCゲノムから換算しなおしたウマの系統樹。
図1に示すように、ウマとロバはおおよそ400万年前に別れ、その後100万年前にTCと現存するウマの先祖が分かれることがわかる。驚いたことに、TCと最も近縁なウマは蒙古馬(図2)だった。この理由の一つは、他のウマの種類では混血が進む一方、蒙古馬は純系で交配されて生きた結果、最も古代型の遺伝子構造を保っているためと想像されている。今蒙古馬は絶滅危惧種になっている。古代のウマのゲノムが最も反映されているウマとして、より一層の保護が必要だろう。
図2 蒙古馬
他のウマの種と交雑していない。現在は絶滅が危惧されている。
さて図1に示した系統樹に示された時間スケールは、これまで現代の馬ゲノムの解析から計算されていたスケールより2倍長い。これは、TCという生息年代が特定できたゲノムのおかげで、年代あたりの変異率を計算できたからだ。現代のゲノムだけを比較する系統樹では、変異率はどの動物も一定として計算する。この意味で、古代ゲノムが解読できる意味は大きい。一方この結果は、馬のゲノムの変異スピードが私たち人間よりずいぶん遅いことを示唆している。なぜそんなことが起こるのか?なかなか面白い問題だ。
ゲノムから地球上の馬の集団サイズをベイズ統計学で計算することもできる。この計算から浮かび上がる話はこうだ。氷河期を生き延びた馬の祖先は、125万年ほど前に温暖化とともに急速に個体数が増加する。従ってTCは暖かい過ごしやすい時代に生息していたはずだ。このおかげで、北極あたりまで移動できたのだろう。しかし50万ほど前、TCの子孫は気候変化に遭遇し、集団サイズは100分の1に減少する。その後ゆっくりと回復して現在に至っているが、人間のために野生の馬はほとんど消失し、今や家畜として生き延びているというのがウマ一族の歴史のようだ。地球環境の変化と集団サイズを調べて、相関性を確かめることで、逆に配列情報の信頼性も評価できることから、この計算法は重要だ。
最後に、個別の遺伝子に注目して、現代のウマへと変化する間に失われたり、得られたりした遺伝子がないか調べている。もちろん70万年ぐらいで遺伝子が大きく変化することはない。それでも、免疫機能に関わる遺伝子と、嗅覚受容体で拡張がおこり、多様性が増大している。いつもウィルスや細菌は最も恐ろしい淘汰圧で、これを生き延びるために必要な遺伝子変化だ。一方、現代の馬はほとんど人間による強い選択圧に晒されており、幾つかの領域で遺伝子の多様性が減じている。この中には、毛の色に関わるc-Kit遺伝子や、筋肉発生に関わるpalladinと呼ばれる遺伝子などが含まれている。細菌と人間を生き延びることが野生動物の生存に必須の条件のようだ。
さて話はここまでだが、おそらく読者の皆さんは野生のシマウマとTCはどのような関係にあるのか気になっているのではないだろうか。蒙古馬が人の手の入っていない野生に近い代表だとすると、当然野生を維持しているシマウマは最も近縁でも良さそうだ。残念ながらシマウマのゲノムはまだ解読されていない。しかし、ミトコンドリアゲノムなどからシマウマはウマとは随分離れた種で、系統的にはロバに近いことがわかっている。従って400万年前に馬とロバ/シマウマが別れたあと、その後ロバとシマウマが新たに分岐したと考えられる。皆さんはこれでこの論文でシマウマが全く出てこなかった理由を理解してもらえたと思う。最後に、シマウマの仲間のゲノムについての面白い逸話を紹介しよう。
南アフリカにはすでに絶滅した縞のないクアッガ(quagga)と呼ばれていたウマが存在した(図3)。
図3 残っているクアッガの写真。(Wikimedia Commonsより)
1984年、博物館に残っていた皮膚からDNAが採取され遺伝子配列が比べられ、シマウマの仲間であることが確認された(Nature, 312:282, 1984)。このように絶滅種の遺伝子配列が決められた最初の例はなんとウマ科の動物だった。今年は午年だが、このようにウマ科の動物はゲノム研究史に名を残す重要な動物であることは覚えておいて欲しい。