「パターン認識と機械学習」への遠回り 幕間 「機械学習と統計学」
機械学習の勉強を始めた当初、統計学を学ぶ必要性をあまり感じていませんでした。
というのも、統計学自体をほとんど知らなかったので、統計学についてちょっと変なイメージを持っていたからだと思います。
しかし、機械学習を勉強するにつれ、統計学と機械学習が非常に似ている、というかほぼ同じ何じゃないかという考えを持つようになりました。
機械学習や統計学、またデータマイニングには、「データを集め、目的を持って処理し、結果を考察する」という考え方が根幹にあるのだと思います。
これらを区別して考えるより、それぞれの立場からこの「根幹にある考え」へアプローチしたほうが有意義なのではないかと今は感じています。
また、機械学習には大きく分けて「識別モデル」と「生成モデル」の二つがあり、特に「生成モデル」と統計学に高い親和性があると思います。
しかし、機械学習やパターン認識の入門書だと、紙面の都合上、どうしても「識別モデル」の説明が多いと感じました。*1
なら生成モデルの勉強の一環として、いっそ統計学を基礎から学んでしまおう!と考えました。