Q-Learning on Mateusz Pieniak

Q-Learning on Mateusz Pieniakhttps://mateuszpieniak.com/tags/q-learning/Hugo -- 0.163.3en-usTue, 23 Jun 2026 00:00:00 +0000Reinforcement Learning 103: Approximate Methodshttps://mateuszpieniak.com/courses/reinforcement-learning/103-approximate-methods/Tue, 23 Jun 2026 00:00:00 +0000https://mateuszpieniak.com/courses/reinforcement-learning/103-approximate-methods/Approximate model-free RL: function approximation, regression targets, loss functions, semi-gradient TD, approximate SARSA, Expected SARSA, Q-learning, and the deadly triad.Reinforcement Learning 102: Q-learning & SARSAhttps://mateuszpieniak.com/courses/reinforcement-learning/102-q-learning-sarsa/Sun, 21 Jun 2026 00:00:00 +0000https://mateuszpieniak.com/courses/reinforcement-learning/102-q-learning-sarsa/Model-free RL: Monte Carlo and Temporal Difference control, Q-learning, SARSA, Expected SARSA, and exploration.