強化学習エンジニアのための逆強化学習入門
強化学習エンジニアが専門家のデモンストレーションから報酬関数を推論し、ロボティクスや自律システムにおける高度な意思決定システムを構築するための逆強化学習の基礎を習得します。
...
Share
逆強化学習の基礎と概念
Unit 1: 強化学習の復習とIRLへの導入
強化学習って何だっけ?
報酬関数が鍵!
IRLって何をするの?
Unit 2: IRLの課題と理論的背景
報酬関数は一つじゃない
ロバストなIRLのために
IRLの数学的基礎
Unit 3: IRLの応用と未来
IRLが活躍する世界
IRLの未来を語ろう
主要なIRLアルゴリズムと実践的応用
Unit 1: MaxEnt IRLの基礎
MaxEnt IRLとは?
MaxEnt IRLの数理
MaxEnt IRLの実装
Unit 2: MaxEnt IRLの応用と評価
MaxEnt IRLの演習
推論された報酬の評価
Unit 3: IRLの発展と実践
MaxEnt IRLの派生
ロボット制御への応用
自動運転への応用