rl-agents

Implementations of Reinforcement Learning agents based on The Bible of Reinforcement Learning [1]

Multi-armed Bandits

Multi-armed Bandits are implemented with stationary and non-stationary environments using following action-selection methods:

Static
Random
Greedy
ε-greedy
Split
Linear decay ε-greedy
Optimistic
UCB
Gradient (w/ and w/o baseline)

Dynamic Programming

The Dynamic Programming implementation consists of an algebraic solution as well as an random agent with seperate case and in-place iterative solutions.

Monte Carlo Methods

Following agents are already implemented:

First-Visit / Every-Visit
On-Policy / Off-Policy

Temporal-Difference Learning

Following Agents are already implemented:

Sarsa
Expected Sarsa
Q-Learning
Double Q-Learning

References

[1] R. S. Sutton and A. G. Barto, Reinforcement learning: an introduction, Second edition. Cambridge, Massachusetts: The MIT Press, 2018.

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
agents		agents
bandits		bandits
environments		environments
.gitignore		.gitignore
01_multi-armed_bandits.ipynb		01_multi-armed_bandits.ipynb
02_dynamic_programming.ipynb		02_dynamic_programming.ipynb
03a_monte_carlo.ipynb		03a_monte_carlo.ipynb
03b_mc_play.ipynb		03b_mc_play.ipynb
04a_temporal_difference.ipynb		04a_temporal_difference.ipynb
04b_td_play.ipynb		04b_td_play.ipynb
05a_mcts.py		05a_mcts.py
05b_mcts_evaluations.ipynb		05b_mcts_evaluations.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rl-agents

Multi-armed Bandits

Dynamic Programming

Monte Carlo Methods

Temporal-Difference Learning

References

About

Releases

Packages

Languages

fkabs/rl-agents

Folders and files

Latest commit

History

Repository files navigation

rl-agents

Multi-armed Bandits

Dynamic Programming

Monte Carlo Methods

Temporal-Difference Learning

References

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages