old school magic

機械学習に関する備忘録です。

「パターン認識と機械学習」への遠回り 幕間 「機械学習と統計学」

機械学習の勉強を始めた当初、統計学を学ぶ必要性をあまり感じていませんでした。
というのも、統計学自体をほとんど知らなかったので、統計学についてちょっと変なイメージを持っていたからだと思います。

しかし、機械学習を勉強するにつれ、統計学機械学習が非常に似ている、というかほぼ同じ何じゃないかという考えを持つようになりました。
機械学習統計学、またデータマイニングには、「データを集め、目的を持って処理し、結果を考察する」という考え方が根幹にあるのだと思います。
これらを区別して考えるより、それぞれの立場からこの「根幹にある考え」へアプローチしたほうが有意義なのではないかと今は感じています。

また、機械学習には大きく分けて「識別モデル」と「生成モデル」の二つがあり、特に「生成モデル」と統計学に高い親和性があると思います。
しかし、機械学習パターン認識の入門書だと、紙面の都合上、どうしても「識別モデル」の説明が多いと感じました。*1
なら生成モデルの勉強の一環として、いっそ統計学を基礎から学んでしまおう!と考えました。

こういった理由から、機械学習の勉強と一環して、統計学の勉強をしていこうと思います。

*1:個人的な考えですが、生成モデル≒統計学なので、統計学をまるまる生成モデルの項に突っ込むのが本のボリューム的に厳しいのかな?と思います。というか私の偏見かもしれません。