Genome Informatics News, Vol. 1, No. 2, April 1994

ゲノム情報処理との出会い

内田 俊一((財)新世代コンピュータ技術開発機構)

 今から6年前の1988年頃、私は第五世代コンピュータに適した応用問題を探していました。第五世代コンピュータのプロジェクト開始から7年がたち、64台のプロセッサから成る並列推論マシンの実験機が完成し、その上で世界初の本格的な並列OSも動きだした頃のことです。まだ、最終目標の1000台規模の第五世代コンピュータプロトタイプの開発は始まっていませんでしたが、私たち担当研究者は、その成功に自信を持ち始めていたのです。しかし、同時にいくつかの心配事が頭に浮かんでいました。その一つは、このような大規模な知識処理向きのコンピュータをうまくデモできる応用問題が見つけられるだろうかということでした。
 現在の主流であるノイマン型コンピュータは、科学技術計算の類は得意ですが、知識処理の類は得意ではありません。従って、ノイマン型コンピュータの上に作られている知識処理の応用問題は、規模が小さく、第五世代コンピュータプロトタイプシステムを評価し、デモする目的には不十分なものしかありませんでした。それでは、自分たちで応用問題を見つけ、応用プログラムを作ってしまおうという方針を固めて、何がよかろうかと物色を始めました。ちょうどその頃、アルゴンヌ国立研究所(ANL)のRoss Overbeekさんから、その年の11月に、論理型言語と知識処理技術を分子生物学的解析に利用したらおもしろいと思うので、その議論をするワークショプを開くから来ないかという招待を受けました。また、その背景として、米国ではHuman Genome Projectという大きなプロジェクトが走りだしたこと、そこでは分子生物学者がヒトのゲノムをどんどん読みとり、遺伝子データベースに集積していること、ゲノムに記述されている遺伝情報の解読がむずかしく新しいコンピュータ技術が求められていることなどを伝えてきました。Overbeekさんは、このワークショプの議論をもとに、ANLで一つのプロジェクトを起こすことを狙っていたのでした。
 このANLのワークショップには、吉田かおるさん(現在、ローレンスバークレー研究所)と参加することとし、Overbeekさんが送ってくれた分子生物学の大量の入門書や論文を読みました。最初に分子生物学の用語に悩まされたことはいうまでもありません。最初から英語で勉強するのは辛すぎるということで日本語の入門書を揃えて、約1ケ月、多忙な日常業務の合間に付焼き刃ながら、DNAの構造、RNAへのコピー、蛋白質の合成などについての知識を詰込みました。この時点で、ゲノムに記述されている遺伝情報を解読しようという問題が知識処理の応用問題として魅力に富むものであることを確信しました。また、それ以上に、生物の遺伝子に関する情報処理やそれに基づいて蛋白質を合成し、生体を作りだしていくメカニズムそのものに対する興味のとりこになってしまいました。
 ゲノム情報の解析は、いろいろな「謎解き」を含んでいます。遺伝子の機能や発現の機構、蛋白質の機能と構造、酵素反応、細胞の振舞などの解明をとおして、われわれは、”超”複雑な生物のメカニズムの一端をのぞき見ることができます。たった4種の核酸から組み立てられるDNA、20種のアミノ酸からできている蛋白質、その簡素な構成要素に比べて、見事なまでに複雑でかつ効率良い生体機構、コピーミスをほとんどしない遺伝情報の複製機構、それに、自己と非自己をギリギリの線で識別する芸術的ともいえる免疫機構など。これらは、コンピュータ研究者の知識欲と好奇心をかきたてずにはおきません。コンピュータの構造との比較論、新しい情報処理機械への夢、生物である自分自身の構造を知ることによる興奮、いくらでも興味は広がります。
 ANLのワークショプは、米国の分子生物学とコンピュータ科学の双方の先端分野で活躍している人が30人ほどが集まりました。私たちは分子生物学者から、ゲノムの解析と遺伝情報の解読における問題点の解説を受け、それを解決するためにどのようなコンピュータ技術を開発しなければならないかを議論し、レポートにまとめました。議論はバラェティに富み、おもしろかったものの、まとまりを欠き、そのためかOverbeekさんの意図したようなプロジェクトは成立しなかったようです。
 我々は、帰国後、ICOTに遺伝子情報処理の研究グループを作る努力を始めました。といっても、ICOTにこのような分野の研究者はいませんから、誰か適当な先生を探して、教えてもらう必要があります。ANLやNIHの研究者とは共同研究をすることとしましたが、新人育成のためには国内の専門家の協力が不可欠でした。そこで、私と吉田さん、それに米国留学し、やはり遺伝子情報処理に感化された小長谷明彦さん(NEC)の3人で、大学の先生とICOT研究員などからなるワーキンググループ(WG)づくりを始めました。この遺伝子情報処理WGは、分子生物学の分野から、金久先生をリーダに迎え、宮澤三造さん(当時、遺伝研、現在、群馬大)、八尾徹さん(当時、蛋白工学研、現在、三菱化成)などにメンバーなってもらい、1989年7月にスタートしました。このWGの最初の頃は、コンピュータ科学と分子生物学の接点となるような研究テーマの存在を求めた勉強会であり、双方の語る言葉が通じないことも多々ありました。しかし、これらの方々の協力により、ICOT内には遺伝子情報処理に興味を持つ研究者があらわれ、1990年4月から、新田克己さん、石川幹人さんをリーダとする遺伝子情報処理の研究チームを発足させることができました。
 このころ金久先生は、文部省の重点領域研究「ゲノム情報」の準備をしていて、分子生物学とコンピュータ科学の両分野の研究者の集め、これらの二つの分野にまたがる新しい研究分野をつくろうとしていました。米国ならば、研究者の流動性は高く、ANLやNIHにみるごとく、研究資金さえあれば、分子生物学者がコンピュータ科学者を必要に応じて雇うことで、新分野の研究者を作り出すことが容易です。しかし、日本では、通常は、関連分野の研究者や学生の興味を喚起して、その新分野に移行してもらい研究者を確保するか、新たに育成するかしていかねばなりません。このような興味喚起の場として、この重点領域研究は、ICOTにとっても渡りに舟でした。その年の12月には、金久先生がゲノム情報ワークショプの第1回目を企画し、ICOTと共催で開催しました。このワークショップでゲノムの話をはじめて聞いたコンピュータ研究者も多かったことと思います。その後、双方の分野の研究者は、当初のお互の専門用語や研究のフィロソフィーの違いを乗り越え、共通の興味を見出し、本格的なゲノムの解析や情報処理の研究を開始しました。
 ICOTの研究チームも、この重点領域研究で知りあった分子生物学の研究者との共同研究を通じて、多くのことを学び、研究内容を充実させています。ゲノム情報のワークショップにおいても、並列推論マシンの上での配列解析や蛋白質の構造解析の研究成果の発表やデモも行ない、この分野の発展に貢献できるまでになりました。
 ICOTの研究グループの発足の前後では、私は、コンピュータ関係者には、遺伝子情報処理がいかに面白いか、また、第五世代コンピュータの応用分野としていかに有望かを説いてまわりました。また、分子生物学の関係者には、コンピュータの利用、特に、データベースやネットワーク、パーソナルコンピュータ、それに、第五世代コンピュータの並列処理や知識処理の技術の利用が、分子生物学の発展に不可欠であることを説いたものです。最近のゲノム情報の研究会やワークショップの発表を見ると、もはや、私が説いてまわる必要はなくなったことがわかります。東大医科研ヒトゲノム解析センターの高木先生などの活躍により、新しいコンピュータ技術の重要性は分子生物学の研究者にもよく認識してもらえるようになったと思います。ICOTの研究グループの成果も、当初の第五世代コンピュータプロトタイプの評価とデモを目的とするレベルを優に越えて、分子生物学の研究に直接的に貢献できるような成果もだせるようになりました。まさに、重点領域研究と歩調をあわせて発展してきたといえます。
 現在、ICOTは、第五世代コンピュータ技術の普及を目的とする後継プロジェクトを実施しています。これにより、汎用のワークステーションや汎用並列マシン上でも第五世代コンピュータの言語やソフトウェアが使えるようになり、その結果、ICOTの遺伝子情報処理関連のソフトウェアや、その基盤となっている知識処理の技術が、広くゲノムの情報の解読に役立つ段階となります。これは、第五世代コンピュータのソフトウェアが、評価、およびデモ用の段階を越えて、ゲノムの情報処理そのものを切り開く武器としての役割を担う段階に入ったことを意味しています。新しい武器を使う時、その使い手はその武器に習熟することが求められ、また、武器の製作者は、使い手の意見を聞いて、絶えまなく武器を改良していくことが求められます。これからも、両方の分野の研究者が協力して、この新しい武器を磨き、ゲノム情報処理の分野をさらに発展させていって欲しいものです。