GitHub - ziwenhahaha/Code-of-RL-Beginning

这是一个基于emoji可视化的网格世界（gridworld）强化学习示例代码，目前已完成至第七章

并且同步附有bilibili网站的视频代码讲解，欢迎各位同学参与到讨论学习当中

欢迎各位同学加群一起讨论583867967（已有158人）5.13是107人 3.15是22人

该项目为西湖大学赵世钰老师的课程学习代码

目前该代码只完成到前7课，正在编码第8课值函数近似。预计未来一到两周内学完。届时在B站中将发一个视频进行代码介绍。

B站视频已更新到第七章，第八章真的坑，天坑，这一章的代码我写了近一个月都收敛不了。停更一段时间，一方面要准备考研复试，换个思路攻克一下第八章DQN不收敛的难题。

考研以上岸，B站视频已更新到第八章，准备开始第九章的学习，争取一周内攻克第九章第十章

已更Reinforce，下个月更PPO

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
codes		codes
images		images
.gitattributes		.gitattributes
readme.md		readme.md

Provide feedback