trust-region-policy-optimization

Here are 10 public repositories matching this topic...

TianhongDai / reinforcement-learning-algorithms

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are still in progress)

algorithm deep-learning atari2600 flappy-bird deep-reinforcement-learning pytorch dqn ddpg sac actor-critic trpo dueling-dqn trust-region-policy-optimization proximal-policy-optimization ppo a2c soft-actor-critic

Updated Jan 16, 2021
Python

ikostrikov / pytorch-trpo

Star

PyTorch implementation of Trust Region Policy Optimization

reinforcement-learning deep-learning deep-reinforcement-learning pytorch continuous-control trpo mujoco trust-region-policy-optimization

Updated Sep 13, 2018
Python

funnydman / BFGS-NelderMead-TrustRegion

Star

Python implementation of some numerical (optimization) methods

python machine-learning ai optimization machine-learning-algorithms mathematics numerical-methods numerical-optimization nelder-mead bfgs dogleg-method trust-region-policy-optimization trust-region dogleg-algorithm trust-region-dogleg-algorithm

Updated Feb 4, 2021
Python

MahanFathi / TRPO-TensorFlow

Star

Trust Region Policy Optimization (TRPO) in pure TensorFlow

reinforcement-learning tensorflow policy-gradient trpo trust-region-policy-optimization

Updated Jun 7, 2018
Python

hcnoh / rl-collection-pytorch

Star

A collection of Reinforcement Learning implementations with PyTorch

reinforcement-learning deep-learning gae deep-reinforcement-learning openai-gym pytorch policy-gradient continuous-control actor-critic trpo trust-region-policy-optimization proximal-policy-optimization ppo generalized-advantage-estimation

Updated Mar 22, 2022
Python

Akella17 / Deep-Bayesian-Quadrature-Policy-Optimization

Star

Official implementation of the AAAI 2021 paper Deep Bayesian Quadrature Policy Optimization.

reinforcement-learning deep-learning monte-carlo deep-reinforcement-learning pytorch policy-gradient gaussian-processes continuous-control actor-critic mujoco trust-region-policy-optimization advantage-actor-critic roboschool probablistic-numerics bayesian-quadrature natural-policy-gradient

Updated Feb 17, 2021
Python

khansel01 / nes-npg

Star

Benchmarking the Natural Gradient in Policy Gradient Methods and Evolution Strategies

benchmarking reinforcement-learning robotics reinforcement-learning-algorithms trust-region-policy-optimization natural-evolution-strategies natural-policy-gradient quanser-robots

Updated Jan 22, 2021
Python

RLOpensource / spinning_up_kr

Star

reinforcement-learning robotics ddpg sac trpo deep-deterministic-policy-gradient trust-region-policy-optimization proximal-policy-optimization ppo td3 soft-actor-critic ppo2 spinningup ou-noise

Updated Apr 2, 2019
Python

LihangLiu / CS395T-Numerical-Optimization

Star

Course projects of CS395T Numerical Optimization, UT Austin

optimization trust-region-policy-optimization proximal-policy-optimization

Updated Dec 6, 2017
Python

dodoseung / trpo-trust-region-policy-optimization-pytorch

Star

The pytorch implemetation of trpo

deep-reinforcement-learning pytorch trpo trust-region-policy-optimization trpo-pytorch

Updated Mar 14, 2022
Python

Improve this page

Add a description, image, and links to the trust-region-policy-optimization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the trust-region-policy-optimization topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

trust-region-policy-optimization

Here are 10 public repositories matching this topic...

TianhongDai / reinforcement-learning-algorithms

ikostrikov / pytorch-trpo

funnydman / BFGS-NelderMead-TrustRegion

MahanFathi / TRPO-TensorFlow

hcnoh / rl-collection-pytorch

Akella17 / Deep-Bayesian-Quadrature-Policy-Optimization

khansel01 / nes-npg

RLOpensource / spinning_up_kr

LihangLiu / CS395T-Numerical-Optimization

dodoseung / trpo-trust-region-policy-optimization-pytorch

Improve this page

Add this topic to your repo