無料ダウンロード強化学習 (機械学習プロフェッショナルシリーズ) pdf
強化学習 (機械学習プロフェッショナルシリーズ)
本, 森村 哲郎
によって 森村 哲郎
3.8 5つ星のうち 8 人の読者
ファイルサイズ : 23.9 MB
内容紹介 理論は裏切らない・強化学習で必要になる数理を広くカバーした。・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!【おもな内容】第1章 準備1.1 強化学習とは1.2 マルコフ決定過程と逐次的意思決定問題1.3 方策1.4 逐次的意思決定問題の定式化第2章 プランニング2.1 準備 2.2 動的計画法2.3 動的計画法による解法2.4 線形計画法による解法第3章 探索と活用のトレードオフ3.1 概要3.2 探索と活用のトレードオフ3.3 方策モデル第4章 モデルフリー型の強化学習4.1 データにもとづく意思決定4.2 価値関数の推定4.3 方策と行動価値関数の学習4.4 収束性4.5 アクター・クリティック法第5章 モデルベース型の強化学習5.1 問題設定の整理5.2 環境推定5.3 ブラックボックス生成モデルに対するプランニング5.4 オンラインのモデルベース型強化学習第6章 関数近似を用いた強化学習6.1 概要6.2 価値関数の関数近似6.3 方策の関数近似第7章 部分観測マルコフ決定過程7.1 部分観測マルコフ決定過程(POMDP)の基礎7.2 POMDP のプランニング7.3 POMDP の学習第8章 最近の話題8.1 分布強化学習8.2 深層強化学習付録A 補足A.1 証明A.2 ノルムA.3 線形計画法A.4 自然勾配法の補足 著者について 森村 哲郎日本アイ・ビー・エム 東京基礎研究所 研究員
ファイル名 : 強化学習-機械学習プロフェッショナルシリーズ.pdf
強化学習 (機械学習プロフェッショナルシリーズ)を読んだ後、読者のコメントの下に見つけるでしょう。 参考までにご検討ください。
8/2追記本書は、強化学習がどういうものか、ということは前提とし、それを理論的に正当化しようということがメインテーマだと、明記はされていませんが、個人的に感じます。(追記終)非常に厳密であるものの、ここまで追求する必要があったとは思いません。機械学習プロフェッショナルシリーズのコンセプトは・手に取りやすいページ数で簡潔に重要事項をまとめた・基礎理論、活用法を解説とのことです。私は購入前にこれらのコンセプトは知っていたので、もちろんこれらを期待していました。しかし、中身は厳密性を追求し過ぎて骨子が見えにくい。そういった本は嫌いではありませんが、期待した内容とはずれているというのが所感です。機械学習プロフェッショナルシリーズの中でも抜群に難しい本じゃないかな…
0コメント