Example Noisy DQN implementation with ReLAx

This repository contains an implementation of noisy deep q-network (Noisy DQN) with ReLAx.

Noisy DQN actor was trained on Boxing-v0 Atari Gym environment for 3m env-steps.

!Note: For demonstration purposes training was run only for 3m steps. In papers, DQN and its augmentations are trained for 200m steps, which may require several days of learning. That is why performance is lower than reported in papers.

The graph of average return vs environment step is shown below (logs done every 50k steps):

The distribution of estimated Q-values vs data Q-values is shown below:

Resulting Policy:

noisy_dqn_run.mp4

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.ipynb_checkpoints		.ipynb_checkpoints
content/video		content/video
monitor_train_logs		monitor_train_logs
tensorboard_logs/noisy_dqn_Boxing-v0		tensorboard_logs/noisy_dqn_Boxing-v0
trained_models		trained_models
README.md		README.md
noisy_dqn_q_func.png		noisy_dqn_q_func.png
noisy_dqn_training.png		noisy_dqn_training.png
noisy_dqn_tutorial.ipynb		noisy_dqn_tutorial.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Example Noisy DQN implementation with ReLAx

About

Releases

Packages

Languages

nslyubaykin/relax_noisy_dqn_example

Folders and files

Latest commit

History

Repository files navigation

Example Noisy DQN implementation with ReLAx

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages