2017/5/5

昨日と今日で"The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World"の第7章と8章を読んでいる。7章ではアナロジーによる学習(サポートベクターマシンとか)、8章では強化学習について解説されていた。この辺りまで読んだところで学習についての大きな絵がふんわりと浮かんできた。アナロジーによって大雑把なクラスタリングを行った後、新しく出会う対象についてはベイズ推定によってそのクラスタに分類していく。形成されたそれぞれのクラスと言語化すれば記号主義的な決定木が出来上がる。そしてそのプロセスを物理的にみればコネクショニズム的な神経回路の形成が行われているのである。ただしこのプロセスは一方向に行われる必要はない。ミーム感染によって新しい記号概念を獲得すればそれを用いて新たにデータをクラス分けしていくことができる。このミームの伝播を遺伝的プログラミングと見てもいいだろう。そしてこの学習は行為へとつながらなければ適応的な意味を持てない。その意味で行為まで含めた学習プロセスを考えるとそれは強化学習となる。第9章では今まで登場した学習方法が統合されるようなのでこの絵とどう違うのか検討してみたい。