SOMの再発見をめざして

情報論的・確率論的な見地からSOMを再構築しようと格闘している.この手の試みはすでにビショップがやっており,下に書いたGTMがそれに該当するのだが,理論を調べれば調べるほど,GTMとSOMは根本的に違うとしか言いようがない.GTMは結局のところ,データフィッティングに正則化項を加えてEMアルゴリズムでパラメータ推定しているのだが,どうもSOMは,そうではない.そうではないから,かえってうまくいく.

ここ数日,ありとあらゆる角度からSOMを検証している.たぶん,今まで誰もしていなかったような角度からも検証している気がする.そして検証すればするほど,SOMがわからなくなる.そこがおもしろい.どんな角度から検証しても,SOMアルゴリズムは出てこないのだ.

つまり,根本的に何か違う原理が使われている.そりゃそうだ,通常は,視点Aからアルゴリズムが説明できるなら,視点B,視点Cからでも説明できるはず.それがconsistentであるということであり,well-definedであるということだから.逆に言えば,視点Aで説明できないのが視点Bから説明できたらかえっておかしい.SOMは,視点A,B,C......とどのように迫っても説明できない.だから「本質的に違う何か」が入っているとしか言いようがないのだ.

もしかすると自分は,日本でいちばん「SOMをわかっていないことをわかっている,いちばんわかっていない人間」になってしまったのかもしれない(笑).