Cartpole

Simple Open-AI Gym CartPole experiments.

Available Algorithms

Deeq Q-Network

DQN: Playing Atari with Deep Reinforcement Learning

python dqn.py

Advantage Actor-Critic

A2C: Asynchronous Methods for Deep Reinforcement Learning

python a2c.py

Proximal Policy Optimization

PPO: Proximal Policy Optimization Algorithms

python ppo.py

Additional Arguments

--env ENV
--batch_size BATCH_SIZE
--num_episodes NUM_EPISODES
--update_interval UPDATE_INTERVAL
--learning_rate LEARNING_RATE
--weight_decay WEIGHT_DECAY
--gamma GAMMA
--epsilon EPSILON
--seed SEED

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
logs		logs
models		models
utils		utils
.gitignore		.gitignore
README.md		README.md
a2c.py		a2c.py
a2c_share.py		a2c_share.py
config		config
dqn.py		dqn.py
evolve.py		evolve.py
ppo.py		ppo.py
ppo_dice.py		ppo_dice.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cartpole

Available Algorithms

Deeq Q-Network

Advantage Actor-Critic

Proximal Policy Optimization

Additional Arguments

About

Releases

Packages

Languages

lexiconium/cartpole

Folders and files

Latest commit

History

Repository files navigation

Cartpole

Available Algorithms

Deeq Q-Network

Advantage Actor-Critic

Proximal Policy Optimization

Additional Arguments

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages