old school magic

機械学習と統計とプログラミングについてちょっとずつ勉強していきます。

「パターン認識と機械学習」への遠回り その2 「自然言語処理のための機械学習入門」

その1 フリーソフトで作る音声認識システム

前回入門書への入門書まで読み終えたので、今回は入門書を読みます。

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

どんな本?

自然言語処理を題材にした機械学習の入門書です。
200Pくらいと読みやすく、式展開も自力で追え、例題も豊富なので2冊目以降に読む本としてオススメです。

扱っている手法も、自然言語処理特有なものではなく、一般的に用いられているものばかりなので、「自然言語処理に興味ないしなあ...」という方にも参考になるのではないかと思います。

いいところ

最適化手法について最初の章でちゃんと説明してるところがいいと思います。
例題が多いので、「実際に使うとこんな感じなのか」というイメージも掴めるんじゃないでしょうか。
あと、自然言語処理特有のあれこれについて補足してくれているのがポイント高いです。

気になったところ

第3章でEMアルゴリズムについて説明しているのですが、他の章では全て最尤推定を用いてるのにどうして混合分布だけEMアルゴリズムなのか、というところに説明が欲しかったです。
東工大の杉山先生の講義スライドがそれについて分かりやすかったのでご一緒にどうぞ。

あと、第5章での説明がもう少し詳しいといいのになーと思います。
特にHMMに例題がなかったのが惜しいです。
第5章については、巻末で紹介されてる参考文献を読んだりして補完しようと思います。

何が学べるか

最適化手法、自然言語処理のための特徴抽出、最尤推定、MAP推定、k-Means、混合モデル、EMアルゴリズム、ナイーブベイズSVMカーネル法対数線形モデル、HMM、分類器を組み合わせた系列データへの応用、CRF、実験の仕方、評価手法