いかにゲノムを解読するか

[ 地図から配列へ そして機能の解明へ ]

 ヒトゲノム計画の研究対象であるヒトのゲノムは30億の文字(塩基対)でできています。これは新聞で言えば、30年分近い文字数にあたり、解読することはそう簡単なことではありません。しかし、1970年代から今まで多くの目覚ましい技術的発展があり、ゲノム解析のスピードは加速度的に上がってきました。それらの技術的な発展は余りにも多岐にわたっており、この小冊子ではとても説明しきれないほどです。そこで、ここでは構造解析の考え方について簡単に述べておきたいと思います。
 大きなゲノムの解析は、ゲノムの地図作りとそれに基づく配列解析の二段階で行われています。現在の技術で、一度に配列の解読ができるのは、高々DNAの数100文字分程度の断片です。そこで、現実の巨大なDNAを小さく切断し、それらの断片の解読結果から再構成することになるのですが、これはあたかも数10年分の新聞の切り抜きにしたあと、もとの新聞を完全に再構成するような問題に相当します。すぐに分かるように、これは非常に難しい問題です。しかし、もしある切り抜きのどこかに「明日は東京オリンピック開幕……」というフレーズが含まれていたすれば、その切り抜きがどの日の新聞の中にあったかということはすぐに分かります。それと同じように、30億のDNA文字配列の中に、他にはないユニークなフレーズがたくさんあれば、解析が非常に楽になるに違いありません。実際、ヒトゲノム計画でも、まず最初にできるだけ多くのユニークなフレーズを染色体の中に見つけることが計画されましたが、この研究段階を「ゲノムの地図作り」と呼んでいます。ゲノムを地形図に見立てた言葉です。
 DNAの中には実際にユニークなフレーズがたくさんありますが、それらはどのようにしたら検出できるでしょうか。これには、DNAの示すハイブリダイゼーションという現象を使うことができます。ハイブリダイゼーションというのは、DNA分子はそれに相補的な(A−T、G−Cという対応関係のある)DNA分子と結合することをさしています。そこで、一つのユニークなフレーズに対応するDNAの断片を用意しておき、それがハイブリダイゼーションを示すかどうかを調べれば、そのフレーズがあるかどうかをたちどころに検出することができます。最近はSTSと呼ばれるDNA中のユニークなフレーズが1万個以上個見つけられており、十分細かいDNAの地図を提供しています。
 地図ができると、今度はDNAを小さな断片に切断して配列を解析していくことになります。しかし、ヒトゲノムはあまりにも大きいので、何段階かに切断し、それぞれの断片を増幅して解析していきます。100万文字くらいの大きなDNA断片に使われるベクター(一種の入れ物)としてはYAC(酵母人工染色体)が用いられます。また、より小さな断片ではコスミド、プラスミドなどのベクターが用いられます。最後に数100文字くらいの小さなDNA断片になって始めて、完全なDNAの文字配列が解読されることになります。これらの解析には、ゲル電気泳動や、PCRなどの技術が多用されますが、大量配列解析のための装置は、今では大方が自動化されています。
 このようにして構造解析で地図とシークエンス(文字配列)が得られると、次にそこに書かれた生物学的な意味を解明する機能解析の段階に進みます。モデル生物を用いたり、遺伝子の破壊実験を行ったりして、病気、発生、分化、免疫応答と遺伝子の関連を明らかにするような研究が今盛んに行われています。