old school magic

機械学習と統計とプログラミングについてちょっとずつ勉強していきます。

「パターン認識と機械学習」への遠回り その7 「データ解析のための統計モデリング入門」

機械学習の分野では統計学が大きな役割を果たします。
この本では生態学のデータ解析をテーマに、統計モデリングを一から学んでいきます。
ハードカバーでちょっと難しそうに見える本ですが、内容はかなり初学者向けで、分かりやすく書かれていると思います。
一般化線形モデルから始まり、統計学のあれこれを説明しつつ、階層ベイズモデルやMCMCといったベイズ関連の手法へと進んでいきます。

良いところ

説明が非常に丁寧な本です。
統計学は独学だとちょっと雲を掴むような感じがして勉強し辛いところがあるのですが、この本では理解度のフローチャートや、章ごとの内容のまとめなど、勉強の助けになる要素が散りばめられています。
統計学ベイズ統計への「一歩進んだ」入門書としては最適なのではないかと思います。

気になったところ

本書は基本的にR言語MCMCソフトとしてWinBUGSを用いているので、他言語のユーザは読み替える必要があると思います。
MCMCソフトとしては他にはStan等が有名どころだと思います。
本書に出てくるWinBUGSコードをStanコードに書き換えた方のリンク等がサポートページに掲載されています。

サポートページ
http://hosho.ees.hokudai.ac.jp/~kubo/ce/IwanamiBook.html

私のブログでもPythonを用いて本書に関する事(一般化線形モデルとMCMC)をいくつか試しているので、よろしければどうぞ。

Pythonで一般化線形モデル - old school magic
PyMC3でMCMC入門(1) - old school magic
PyMC3でMCMC入門(2) - old school magic
PyStanでMCMC入門 - old school magic

学べること

最尤推定ベイズ推定、検定、モデル選択、ロジスティクス回帰、一般化線形混合モデル、MCMC、階層ベイズモデル