Grundlagen des Reinforcement Learning für KI-Forschungswissenschaftler: Markov-Entscheidungsprozesse, Bellman-Gleichungen und Policy Gradients

Meistern Sie die Kernkonzepte des Reinforcement Learning, von MDPs und Bellman-Gleichungen bis hin zu Policy Gradients, um die Entwicklung neuer KI-Algorithmen voranzutreiben.

Grundlagen von Markov-Entscheidungsprozessen und Wertfunktionen

Unit 1: Einführung in Reinforcement Learning und sequentielle Entscheidungen

Unit 2: Markov-Entscheidungsprozesse (MDPs)

Unit 3: Wertfunktionen und Bellman-Gleichungen

Unit 4: Modellbasierte vs. Modellfreie Ansätze

Policy Gradient Methoden und praktische Anwendung

Unit 1: Einführung in Policy Gradients

Unit 2: Grundlegende Policy Gradient Algorithmen

Unit 3: Praktische Anwendung und Analyse