「パターン認識と機械学習」への遠回り その1 「フリーソフトでつくる音声認識システム」
機械学習の入門書として、代表的なのが「パターン認識と機械学習」という本です(通称PRML)。
先日、上巻を読み終わりました。
僕には少し早かったみたいです。。。
数式を追うのに必死になって、機械学習の概要がつかめなかったのが敗因かなーと思います。
というわけで、ちゃんと遠回りしてからPRMLに挑もうと思います。
「機械学習ってこういうのだよ!」、「こんな感じの手順だよ!」、「こういうタスクがあるよ!」、「基本的な考え方はこんな感じだよ!」、「こんな手法があるよ!」といった感じのふわっとした概要に関する本から、ちょっとずつ詳しいところに踏み込んでいくような感じで勉強していきたいと思います。
というわけで「この本を読むぞ!」という意思表明として、読もうと考えている入門書を紹介したいと思います。
(いくつか読み終えた本もあります。)
フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで
- 作者: 荒木雅弘
- 出版社/メーカー: 森北出版
- 発売日: 2007/10/17
- メディア: 単行本(ソフトカバー)
- 購入: 45人 クリック: 519回
- この商品を含むブログ (38件) を見る
どんな本?
全くのパターン認識/機械学習初心者が最初に本としておすすめなのがこの本です。
タイトルがタイトルなので、「フリーソフト...?」「音声認識はあんま興味ないなあ...」とスルーしてしまっていたのですが、手にとって見てあまりの分かりやすさに感動しました。
本の構成として「基礎編」と「実践編」に分かれています。第8章までが「基礎編」です。第9章からは実際にフリーソフトを動かして音声認識システムを構成する内容になってます。
概要
「パターン認識とは何か」の説明から始まり、アナログデータの取り込み、前処理、特徴抽出、識別部といったパターン認識システムの構成を4ページ目で超わかりやすい図で述べ、識別部以外の説明を最初の3章しっかりしています。
4章から識別部の説明が始まるのですが、最近傍法とパーセプトロンから始まり、SVMやニューラルネットへと手取り足取り誘ってくれます。
7章で統計的(確率的)な方法について簡単に述べ(PRMLは統計的手法についての機械学習入門書)、第8章でシステムの評価方法について、交差確認法などの説明をしてくれます。
第9章からは「実践編」なのですが、第9章と第10章で系列データを扱う方法や、隠れマルコフモデルについて説明しているので、実践にまだ興味がなくてもここまで読むことをおすすめします。
第10章まで130ページ足らずで、パターン認識の基本的な考え方をしっかり説明し、SVMや系列データまで誘ってくれる素晴らしい本です。
この本で「フリーソフト」と読んでいるのは、実際に広く使われているWekaなどといった機械学習の統合環境なので、それらへの入門としても役に立ちます。
メリット
一番最初に読む本として大事なのは、分かりやすさももちろんですが、「こんなことができるんだよ!」と読者の興味と意欲を掻き立ててくれることだと思います。この本はそれをバッチリみたしています。超おすすめです!
思ったより長文になってしまったので今回はここまでにします。
5冊ほど紹介しようと考えています。(5冊目はPRMLですが。。。)