日本学術振興会未来開拓学術研究推進事業

「生命システム情報統合データベースの構築とゲノム情報理学の創成」


プロジェクト・リーダー

 金久 實(京都大学・化学研究所・教授)

研究目的

 ゲノム研究およびプロテオーム研究の進展とともに、大量の配列情報、発現情報、変異情報、立体構造情報等が系統的に得られるようになり、ゲノムから生命システムへの情報構築原理を明らかにする基礎研究、ならびにそれに基づく応用のための情報技術の開発研究等、バイオインフォマティクス研究の重要性が高まっている。しかしながら、従来のように個々の分子を対象とした解析方法あるいはデータベースだけでは、ゲノムの情報を真の意味で解読すること、すなわち生命システムとしての機能や有用性を解読することは不可能である。これまでに蓄積された生命科学の膨大な知識を体系化し、自然界の法則、とくに物質間相互作用や化学反応に関する法則と関連づけて、生命のシステムを理解していく必要がある。本研究では、細胞レベルでの生命システムの機能に関する知識を分子間相互作用ネットワークの情報(PATHWAYデータベース)としてコンピュータ化し、ゲノム解析がもたらす遺伝子カタログの情報(GENESデータベース)と既知のすべてのタンパク質間の類似関係情報(SSDBデータベース)、ならびに生体関連化学物質と化学反応に関する情報(LIGANDデータベース)を統合した「生命システム情報統合データベース」KEGGを構築することを目的とする。そして、生命科学、情報科学、物理学、化学の分野を包含する「ゲノム情報理学」の研究領域を創成し、ゲノムから生命のシステムを、さらには自然界のダイナミックスを理解することを目的とする。一方、生命システム情報統合データベースは、ゲノムの配列から生命システムの機能に関する情報を解読するためのレファレンスデータベースでもあるので、ゲノム情報を医学・薬学・農学・工学等の分野で有効利用するための情報技術開発も行う。

研究計画の概要

 本研究は、ゲノムの機能解析において世界的に最も重要なデータベースの1つと位置づけられている KEGG (Kyoto Encyclopedia of Genes and Genomes) の主要部分をさらに飛躍的に発展させ、ゲノムと生命システムの統合解析により「ゲノム情報理学」の研究領域創成を行うものである。KEGG の主要部分は3つのコンポーネントから構成され、それぞれ以下のように構築する。
  1. 生命システムのはたらきの情報として、細胞機能に関する知識を分子間相互作用のネットワークとして表現し、PATHWAYデータベースとして体系化する。PATHWAY は階層的に構成され、第1階層は代謝、遺伝情報処理、環境情報処理、その他の細胞プロセスに分類されている。

  2. ゲノムシークエンシングがもたらす遺伝子カタログは生命システムの部品のカタログであり、生物種ごとにこれをGENESデータベースとして蓄積する。同時に各遺伝子の機能アノテーションを最新のものにし、記述の標準化も行う。また、GENES にあるすべての遺伝子の配列類似関係を SSDB データベースとして蓄積する。

  3. 生命システムの環境情報として、生体内・生体外の有機化合物の知識と、生体内の有機反応の知識をLIGANDデータベースに登録する。とくに薬物や環境物質に関する知識のコンピュータ化を重点的に行う。

 生命システムの配線図に相当する分子間相互作用ネットワークの情報をコンピュータ化し、それをゲノムの情報と統合していることがKEGGの大きな特色であり、国際的にも最先端のデータベースとして、またゲノムネットの中心システムとして膨大なアクセスがある。本研究ではとくに、ネットワーク表現ができる既知のデータをすべてコンピュータ化すること、遺伝子およびタンパク質のユニバースを解析すること、システムと環境との相互作用に相当する化学物質と化学反応の知識を体系化することに重点を置き、生命システム情報統合データベースを構築する。さらにグラフ比較やネットワーク予測といった新しいアルゴリズムと実用的なソフトウェアを開発し、実際のゲノムのデータを解析して再アノテーションを行うとともに、ゲノムから生命システムへの情報構築原理を明らかにすることを目指す。また、遺伝子変異や環境変化といったゆらぎに対するネットワークの安定性を明らかにし、創薬等さまざまな応用のための情報技術の開発も行う。

研究期間

 平成12〜16年度



Created on February 21, 2000
Updated on November 17, 2001

バイオインフォマティクスプロジェクト]