GitHub - LinkXuer/path_planning-Qlearning: 路径规划强化学习

path planning + Q-learning

房间例子：网上的例子，原来的代码有问题，有以下修改： 1、while循环是死循环，加上计数器，或者改为for循环 2、根据Qlearning算法原理，第二层是循环语句不是判断语句思考：第二层是判断语句也可以得到结果

test1：对比房间例子只是修改了R矩阵，相当于只是修改了迷宫

test1_v1: 实现英文论文中的算法 4.28，r矩阵和q矩阵不能同时迭代，r一定，q才会收敛

test1_v2: 实现中文论文中的算法

test1_v3: 在v2的基础上，修改了两点： 1、可以经过多次点，但是不能经过多次边 2、减少拐弯的算法，修改为在选择时增加判断（不可行） 4.27改进：1、起点为4度点 2、优先选择非桥（把4度点的奖赏调低） 3、少拐弯，内2度点第二高

test1_v4：修改r矩阵思路，r矩阵储存边与边的信息，目前看到如下几点优势： 1、边拐弯的奖赏容易设置 2、边也可以判断出桥，那么理论上也可以达到v3的结果、（注意赋值和copy的区别） 5.12完成： 1所有拐弯：0.8 2所有直线（非桥）：1 3所有桥：0.5 4去掉回头路

v5_point、v5_side: 1、整合后的版本，只需要关心图的输入，后续全部自动处理。两个方法对偶。 2、一个线段只有两个端点，区分所有与state连通的边是来自哪一个端点，加入了LandR矩阵。 3、r矩阵不通是-1，通是大于0的小数（与角度对应），而LAR矩阵大多是0，左-1右1 3、学习过程过于简单，所以更新了新的方法。 4、在学习的时候和子啊选择路径的时候都加入方向的限制（区分左右端点） 5、在考虑如果探索时无路可走后怎么办？对一笔画要有所奖励，即每一步都走到了，就加奖励

draw：后续工作，通过r矩阵画出图，或者根据图得到r矩阵。

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.idea		.idea
.gitattributes		.gitattributes
README.md		README.md
cahce.csv		cahce.csv
draw.py		draw.py
generate_r.py		generate_r.py
generate_r_v2.py		generate_r_v2.py
line.py		line.py
maze.py		maze.py
q_table.pickle		q_table.pickle
sigemaze_np.py		sigemaze_np.py
test1.py		test1.py
test1_v1.py		test1_v1.py
test1_v2.py		test1_v2.py
test1_v3.py		test1_v3.py
test1_v4.py		test1_v4.py
test2.py		test2.py
test3.py		test3.py
test4.py		test4.py
v5_point.py		v5_point.py
v5_side.py		v5_side.py
v6_addFleury_point.py		v6_addFleury_point.py
房间例子.py		房间例子.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

LinkXuer/path_planning-Qlearning

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages