ゲノム研究における諸ツール開発に関する研究

三井情報開発(株)総合研究所

江口 至洋

目標

 ゲノム研究では多くの研究室で膨大なDNA断片の塩基配列が決定されるため、それら塩基配列データの整理のための計算機システムが必要とされます。また、全遺伝子情報の解読を目的としているため、遺伝子産物(蛋白質)の機能は不明なまま塩基配列が決定される場合が多くなり、塩基配列やアミノ酸配列からその機能を推定する計算機システムも必要となります。この研究ではそれら2つの計算機システムの開発研究を行い、計算機科学の立場からゲノム研究を支援します。

成果

(1)研究室ノートブック:cDNA Binder の開発

 cDNA Binder は大阪大学細胞生体工学センターのゲノム研究を支援するために長年にわたり開発されてきている膨大な計算機システムです。その主たる目的はcDNAライブラリーの配列データ処理の自動化と処理結果のデータベース化にありますが、本研究ではさらに進んでライブラリー毎にデータベース化された配列データ間の論理演算の実施、各クローン毎に整理された画像データの処理を可能とするプロトタイプ・システムを開発しました。論理演算は臓器毎にライブラリー化されたcDNAの臓器特異性の自動解析を目的としています。

(2)研究室計算解析ツール:SEDISM法の開発

 アミノ酸配列から蛋白質の機能を推定する前段階として、アミノ酸配列から重要な機能部位を予測する方法を開発研究しました。SEDISM法(SEgment DIssimilarity Search Method)では、残基数100以下の生理活性ペプチドの機能部位の予測、および100から200残基程度のプレプロペプチド中の機能部位予測で精度の高い結果がえられました。

今後は、

について精度の高い方法の研究を進める予定です。

図の解説

 プロインスリンの機能部位の予測結果。プロインスリンの機能上重要な部位ERGFFYが、グラフの最小位置として正しく予測されています。