生命システム解明の基盤データベース構築
研究代表者
金久 實(京都大学化学研究所バイオインフォマティクスセンター)
研究目的等
本研究は、遺伝子・分子レベルの網羅的な解析から、細胞・個体・生態系レベルでの生命システムの全体像を明らかにすることを目指し、新しい情報技術の開発とともに、新しいタイプの基盤データベースを構築することを目的とする。細胞・個体レベルでの生命システム情報は、これまでのKEGGにおいてすでにデータベース化が行われているので、本研究では生物種間相互作用や環境との相互作用といったより高次レベルの生命システム情報をゲノムの情報と統合し、医療や産業をはじめ、ゲノム情報の有効利用へつなぐ基盤データベースを構築する。同時に支援班との協力の下に、様々な利用・解析ツールを開発して、特定ゲノム4領域との間でフィードバック連携をはかり、これら領域の研究推進及び成果の統合化に寄与する。
これまでの研究経過としては、全塩基配列が決定されたゲノムの遺伝子情報を蓄積したKEGG GENESから、KO (KEGG Orthology) と名付けたオーソロググループの体系化を行い、これをもとに遺伝子アノテーションとパスウェイマッピングを自動的に行うKAASツールを開発した。また、ESTのコンセンサスコンティグを自動作成するツールも開発した。一方、ケミカル情報に関してはKEGG LIGANDの化学反応情報をRC (Reaction Classification) として体系化しつつあり、反応予測等のツールも開発中である。また糖鎖についてはKEGG GLYCANとCSMツールが国際的に認知された。
平成18年度以降の研究計画・方法等
文献データやなまの実験データを蓄積した従来型のデータベースに対し、本研究のデータベースはこれらのデータから得られる「知識」を蓄積する。その知識をもとに新しい研究を推進することが可能となるように、本データベースの様々な利用ツールを開発する。具体的な内容は以下の通りである。
KEGG GENES、LIGAND、PATHWAYデータベース構築を継続して行う。
KOの体系化と、KAASの改良を行う。大量のESTクラスターからコンセンサスコンティグを自動生成するEGassemblerを完成させる。
RC の体系化と、これをもとにした反応予測ツール等の開発を行う。
KEGGをはじめとしたゲノムネットのリソースをプログラムから呼び出し、カスタマイズして利用できるインターフェースKEGG APIの開発を継続して行う。
基盤ゲノム領域及び他のゲノム領域に対して、本研究の成果を生かした支援を行う。その際、総括班情報解析・データベース構築支援委員会の下に、支援班と連携して支援を行う。また、KEGGの利用講習会やKEGG API入門コース等を開催して、その普及をはかる。
高度の専門知識を効率的に集積するために、研究コミュニティと密接に連携し、その知識を集約する「コミュニティデータベース」の枠組みをさらに発展させる。
Created on August 3, 2006
[ バイオインフォマティクスプロジェクト ]