久しぶりのブログ更新です
長いことブログの更新をサボっていました.「あまりにもサボりすぎだろう!」とツッコまれそうです.またぽちぽち書いていこうと思います.
SOMでワイン解析
この週末はY君の論文執筆につきあってました.彼はワインのデータをSOMで解析しています.ワインの化学成分とアロマ(「おおお,スパイシーでベリーの香りの……」)をSOMに入れました.もちろん普通のSOMではなく,素敵な工夫を凝らしています.(正確にはその工夫が研究ポイントで,ワインデータはその題材なのですが).
できあがったワインマップ,みごとにブドウ品種ごとに分かれてくれました.カベルネ・ソーヴィニョンはマップのこちら,シャルドネはマップのこちら……という具合.化学成分とアロマの情報だけなのですが,見事に分かれてくれたので,ほおおおと感心してしまいました.しかも,フランスとカリフォルニアみたいに産地も棲み分けができて,「ここまでできるの?」という感じ.
まだ研究途中なのでお見せできないのが残念.早く公開できるといいな.
論文が出ました
D3の石橋君が筆頭著者の論文,"Hierarchical Tensor SOM Network for Multilevel–Multigroup Analysis" (階層的テンソルSOMによるマルチグループ・マルチレベル解析)が出版されました.(おめでとう!)
いろんなスポーツチームと,職場の部署とか,学校のクラスとかを分析する時,個人レベルの分析とグループレベルの分析を階層的にする必要があります.そのための解析手法の提案です.
この研究のポイントは「平均値だけではグループを理解できない」という点です.あるスポーツチームと別のスポーツチームを比較する時,それぞれの選手の平均値が同じだからって,チームがまったく同じなんてことはないわけです.チームを構成するメンバーのバラエティを確率分布とみなしてグループ同士の比較することで,それぞれのグループの違いを解析できますよ,という内容です.
SOM入門
「自己組織化マップ入門」というドキュメントを公開しました.これは研究室内に入った新入生向けのドキュメントです.公開を考えていなかったので舌足らずのところもありますが,その代わり書籍にはあまり書かれていないことも書いています.
SOMの適切な日本語文献がほとんどないこともあって,学会発表等で古いSOMのプログラムを見かけることがあります.オンライン型SOMは今でも良く目にしますし,近傍半径をゼロまで落としてしまうのも見かけます(実用目的ならばバッチ型を使うべきですし,近傍半径はほどほどのところで縮小を停止しないといけません).
本当はまだまだ書き足りないのですが,このドキュメントが少しでも役に立ってもらえたらと思います.