KEGGとは


 1989年より2年間の準備研究を経て、1991年に正式発足した文部省ヒト・ゲノムプログラムでは、当初よりゲノムの機能解析に重点が置かれていました。現在は第2期の5カ年計画が重点領域研究「ゲノムサイエンス」として行われています。その中でゲノム情報に関する研究班は、ポスト・ゲノム時代への流れを先取りし、相互作用解析やパスウェイ解析に関する新しい情報処理技術の開発とともに、KEGG (Kyoto Encyclopedia of Genes and Genomes) と名付けた実用的な知識ベースの構築を開始しました。

 KEGG プロジェクトの主な内容は以下の3点です。

  1. 分子細胞生物学の広範な知識を、分子のパスウェイ情報としてコンピュータ化し、生命系の機能カタログを構築すること。
  2. あらゆる生物種で、ゲノム解析がもたらす遺伝子カタログの各部品(遺伝子産物)を、機能カタログ上に対応づけること。
  3. 相互作用データから可能なパスウェイを計算したり、ポスト・ゲノム解析に伴う新しい情報処理技術を開発すること。
 この内容を具体的な例でみてみましょう。第1に、次頁の図はリジンの合成系に関する生化学の知識をコンピュータ化したものです。四角は酵素(すなわち遺伝子産物)を示し、中に書かれた番号は EC 番号です。第2に、緑色をした四角は大腸菌のゲノムから見いだされた遺伝子に対応しています。パスがつながってきちんと合成系ができているかにより、逆に各遺伝子の機能予測の適切さを知ることができます。第3に、この例のようにパスが切れていれば、ゲノムにある遺伝子を見落としているか、あるいは別の遺伝子(酵素)による反応経路が存在するかの可能性が考えられ、それぞれについて計算で調べることができます。

 1997年6月現在、KEGG で公開されているのは代謝系だけですが、様々な制御系についても、7月から順次公開していく予定です。代謝系を構成する遺伝子の数は、バクテリアでは全遺伝子の 20-30% ですが、高等生物になればなるだけこの比率は低くなります。転写を始めとした遺伝情報発現制御のパスウェイ、シグナル伝達や細胞周期といった細胞内での分子反応パスウェイ、サイトカインネットワークのように細胞間相互作用を制御する分子パスウェイ、そして発生に関与する遺伝子パスウェイ、このような制御パスウェイの複雑さとそれを構成する遺伝子の数の多さが、生物の高等さに比例しているのかもしれません。