Chainerにサクッと親しむ『Chainerによる実践深層学習』がオススメ

Chainerによる実践深層学習を読んでみました。Chainerにサクッと親しむためには非常にコスパの良い本でしたので、ここで少し内容をまとめておきたいと思います。

内容としては、Chainerの使い方(NumPyの復習から始まり、オブジェクトやChainクラス、Irisを用いた具体例)を紹介した上で、具体的な深層学習手法を実装していく流れになっています。紹介されている手法はオートエンコーダ、word2vec、Recurrent Neural Network及びLSTM、翻訳モデルです。終盤ではCaffeのモデルをChainerから利用する方法も紹介されておりました。そして最終章はGPUの利用ということで、著者の今までのGPUにまつわる経験やCUDA、CuDNN、CuPyなどの話が一通り乗っていてます。

求められる前提知識は、Pythonをデータ分析で使えること、『深層学習(機械学習プロフェッショナルシリーズ)』程度の知識があること、と感じました。載っているコードはすべて公式サイトからダウンロードすることができ、しかもsklearnのデータを用いることが多いのが利点です。なぜなら、データ分析の本を買っても、前処理で躓いてなかなか前に進めないということがたまにあるからです。(私だけでしょうか…。)今回のサンプルコードは、発売されたばかりということでバージョンの差分がゼロor小さいということもあるかもしれませんが、どれも初期状態で実行するだけでちゃんと動きました。

他の深層学習プログラミング本との違いは、解説するフレームワークをChainer一本に絞り、さらに解説する手法も絞っていることかもしれません。そのため、なかなか取り組みやすいです。私は土日に各5時間ぐらいでさっと一通り読んでみましたが、Chainerのイメージが湧いたので、読んでみてよかったですね。(ただし、パラメータの学習には数十時間かかる箇所もありましたので、その時間は除いています。)