1. トップ
  2. 語り合う
  3. 【時代は変わっても実験でできる工夫はやり尽くすべし】

ラボ日記

研究セクターのスタッフが、日常で思ったことや実験の現場の様子を紹介します。
月二回、スタッフが交替で更新しています。

バックナンバー

【時代は変わっても実験でできる工夫はやり尽くすべし】

2014年2月3日

尾崎 克久

次世代型シークエンサーが身近な存在になり、生物学者もテキストファイルで数ギガバイトに及ぶ巨大なデータを扱う機会が増え、人力ではどうにもならない世界に突入しています。そうなると当然注目されるのがコンピューターの力です。コンピューターを使って取り組む生物学と言えば、バイオインフォマティクス(生物情報科学)です。バイオインフォマティクスという学問はまだまだ一般の方には馴染みの薄い研究分野のようですが、個人的には今後10年ほどで最近30年間の分子生物学が果たしてきた生物学への貢献を超えるような活躍をするようになると期待しています。

次世代型シークエンサーの開発速度はすさまじく、進歩の早い技術の象徴のように言われるコンピューターの処理能力向上におけるムーアの法則(参考リンク)を大きく超越しています。今年に入ってまた間もないというのに、illumina社から新型シークエンサーが発表され、スループット(データ産出能力)・費用・時間の全てで大きく改善されました。2012年に吟味に吟味を重ねて機種選考を行い、当館に導入した当時の最新機種MiSeqがもう旧型になってしまったのかと思いつつ、新機種の性能にはワクワクしてしまいました。

とはいっても、MiSeqにもまだまだ活躍してもらいます。なんと言っても、300塩基の長さのペアエンドで配列を決定できるという性能は、上手く使えば大きなメリットを生み出す潜在能力があるんです。

まずは人気のRNA-seqについて。これはある特定の組織で発現している遺伝子群を網羅的に検出できる可能性があるので、新規の遺伝子を探索するなど様々な場面で大活躍している技術です。ただ、メーカーが用意したプロトコールどおりに作業を行うと、とても短い断片のシークエンスライブラリーが作成され、MiSeqの長く読める試薬キットで配列を決定すると、ペアになるリード同士で大部分がオーバーラップしてしまうため、その性能を活かしきれません。配列を結合するソフトウエア(アセンブラー)を用いてつなぎ合わせても、長い遺伝子についてはなかなかその完全長を再現することが出来ないという残念な結果になりがちです。そこで必要になる工夫として、大凡500~550塩基の長さのライブラリーを作成すれば、ひとつの配列を両側から300塩基ずつ読んだときに末端付近だけがオーバーラップして、長く正確な配列を読み出すことが出来るようになります。これによって長い遺伝子であっても完全長が再現できる可能性がグッと高まります。

次にゲノム配列の決定について。参照できる配列が存在しない生物のゲノムを新規に決定することを de novoゲノム解読と言いますが、このときにも長いライブラリーを作ることが効果的です。今度は、MiSeqでひとつの配列を両側から300塩基ずつ読んだときに、末端がオーバーラップしない位長いものを作ることが出来れば、ゲノム配列をつなぎ合わせていってギャップが出来たときに、そのギャップの大凡の長さを推定して穴埋めを行うscaffolding という作業の効率が大幅に改善されます。

どちらの場合も、ライブラリーを作成する際の一部の行程で、加温する時間や温度をメーカーのプロトコールから少し変更するだけで実現可能です。自分のサンプルについて、どの部分を変更すると研究目的に最も合うデータになるかしっかりと工夫をし尽くしてから本番の実験に入るというのは、実験系研究の現場では至極当然のことですよね。その上でコンピューターの作業に持ち込むことで、研究の効率が最大化されるのだと思います。

コンピューターもバイオインフォマティクスという学問も万能の魔法ではありませんので、使われる技術や研究のスタイルが変化しても、やはり自信を持って「自分の実験結果が最高品質のデータだ」と言える工夫と努力をしっかり行うべきだなと、改めて感じる日々です。


参考
http://ja.wikipedia.org/wiki/ムーアの法則

[ チョウが食草を見分けるしくみを探るラボ 尾崎 克久 ]

ラボ日記最新号へ