Genome Informatics News, Vol. 1, No. 3, July 1994

機械発見の論理

有川 節夫(九州大学理学部基礎情報学研究施設)

 科学発見の論理については、今世紀の中ごろ哲学者 K.Popper 等によって盛んに議論され、また、機械発見については、最近人工知能や認知科学の研究者によって議論されている。これらは、主に機械発見の枠組や手法に関する議論である。筆者は、そうした議論の前に、機械発見の論理あるいは科学発見の計算論理とでも呼ぶべきものを確立し、どのような種類の機械発見が可能であるかについて、正確に議論すべきであると考え、Popper の科学発見の論理を計算論的観点から考察してみた。
 Popper の科学発見の論理では、仮説、すなわち科学的理論のテスト可能性、反証可能性あるいは論駁可能性に力点が置かれている。彼はまた、科学的理論は観測データによって論駁されるべきであり、科学的理論は決してその正しさが証明できないと主張している。我々は現在の理論を、それと矛盾する観測に遭遇するまでの間一時的に信じているだけであると、彼はいっている。
 そうすると、現在、計算論的学習理論の中で盛んに研究されている無矛盾で保守的な帰納推論は、Popper の論駁可能性の概念を計算論的に扱っていることになる。一般に帰納推論においては、帰納推論機械は時々入力データを要求して時々仮説を出力するわけであるが、無矛盾で保守的な帰納推論においては、出力される仮説は、それまでに読み込まれたデータと矛盾せず、また矛盾するデータに遭遇したらその仮説は棄却される。  したがって、Popper の科学発見の論理は、(彼の意図に反して)現在の計算機科学・人工知能において盛んに研究されている、帰納推論の基礎を与えていることになる。そして、その帰納推論は、機械学習の理論的な基礎を与えている。それでは、機械発見の論理あるいは科学発見の計算論理とは何であろうか。
 ここでいう機械発見とは、与えられたデータからある種の科学的発見をコンピュータにさせることをいう。したがって、機械学習は機械発見の基本的な技術となる。機械学習においては、我々はまず、コンピュータが理論、すなわち仮説を探すべき空間を設定する。その空間は当然大きいものであって欲しいし、また一方で学習を効率的にするためには、小さいものであって欲しい。データが、通常の帰納推論におけるように、その仮説空間内のある未知の仮説にしたがって与えられる限りにおいては、そのコンピュータはいつかはその仮説を同定できるので、何ら問題は生じない。しかし、機械発見においては、このことを仮定できない。
 その仮説がはじめに設定した仮説空間内になければ、学習機械は、矛盾しない仮説を求めてその空間内を永遠に空しく探し続けることになる。しかも、通常、そのような空しい探索をいつ止めればよいか知る手立てはない。これは、機械発見システムを構築する上で解決しなければならない最も重要な問題である。機械発見においては、データや事実の系列が、まず最初に、しかも仮説空間と無関係に与えられるのであって、所望の仮説を含む仮説空間を予め与えることはできないのである。もし、学習機械が、その空間内にはもはやその系列を説明する理論は有り得ないことを明確に知らせることができるならば、学習機械は機械発見のために使えることになる。
 このように考えると、科学発見の計算論理の本質は、仮説空間自体の観測データや事実による論駁可能性にあるといえる。論駁可能で豊かな仮説空間が存在するならば、そのような空間と観測データの系列をコンピュータに与えて、後は、コンピュータからの出力をただ待っていればよいことになる。コンピュータは、その系列を生成する仮説が空間内に存在すれば、それを見つけ出し、存在しなければ、ある時点で全空間を棄却して停止する。そして、空間が棄却された時には、新しい空間をコンピュータに与えて再び発見を試みればよいわけである。
 この仮説空間の論駁可能性は、もともとの科学発見の論理における論駁可能性と面白い対照をなしている。すなわち、科学者のための科学発見の論理においては、個々の仮説が観測データによって論駁できることが基本であるが、コンピュータのための科学発見の論理においては、仮説空間自体が観測データによって論駁できることが基本となる。
 以上のような考察に基づいて、仮説空間自体を論駁できる帰納推論の新しい理論を展開し、そのような仮説空間で十分広いものが存在することを明らかにした。本重点領域研究で宮野氏を中心に研究開発した、学習アルゴリズムによる機械発見システムで使われた仮説空間も、実は論駁可能な空間であった。
 このようにして、これまでの機械学習に関する豊かな展開に加えて、機械発見の論理と基礎理論ができたので、分子生物学を含んだ多くの自然科学における科学的発見をサポートすることを究極の目標にした、「発見科学」と呼ぶべき新しい永続性のある情報科学の分野が誕生したと考えている。