SSDA实现

描述

SSDA由两部分网络组成：一个考虑稀疏权重的DA和一个SDA，前者使得SSDA和传统SDA有所不同。

两部分网络分别如下（由caffe提供的draw.py绘制）：原图原图

预处理

训练集我是从网上找了50张图片，然后resize到了80*50大小作为无噪声的输入，同时也把这些图加上噪声作为另一个输入。由于图片维度太高，所以将有噪声和无噪声的图片集都分成10 * 10大小的patch 最后把两个输入存到一个hdf5里

训练

第一个网络

第一个网络的loss function为：

由于caffe中没有KL divergence的loss layer,所以这层是我自己定义的，我参考了caffe样例里的loss.py，照猫画虎做了一个kllosslayer。

其他的layer由于有现成提供，所以就直接使用。在定义好solver和layer后，就用caffe的命令行工具进行参数的训练。

中间结果的处理

由于第二部分网络需要第一部分的中间结果h(x)和h(y)，所以我使用了caffe的python接口，定义了部分网络后，载入训练好的模型，进行forward的操作得到所需要的结果。

第二个网络

第二部分的定义方法比较常规，就是按照它的结构写出相应的prototxt文件。同样使用命令行工具进行训练

效果

训练好两个caffemodel后，我使用一个python脚本来完成使用caffemodel得到目标结果的过程主要思路如下：

将输入图片分成许多patch
将patch输入网络1的前一部分，获得中间结果tmp1
将tmp1输入网络2，获得中间结果tmp2
将tmp2输入网络1的后半部分，获得中间结果tmp3
将tmp3还原成一张原来大小的图片

遇到的问题和解决的办法

如何得到训练的结果

最开始是照着参考官方样例在做，但是一直没有搞懂怎么获取训练的结果（因为样例使用的都是命令行工具，train和test是一起做的，不是很明白中间的过程）。因为资料比较零碎不很好找，最后是在官方论坛上提问弄懂的。

不收敛的情况

在训练DA的时候，我很快遇到了参数不收敛的情况。后来发现是我自己定义的kllosslayer的backpropate写错了。

结果一片糊

把训练集的图片放进网络中forward都无法得出和原来相近的图片，感觉一片糊。不知道是正则项系数太大了还是kllayer出了问题，抑或是patch搞得太小了。

目前没做和不懂的问题

没有调参，不是很清楚正则项和KL的参数应该怎么调(电脑很慢)
没有使用L-BFGS algorithm回归
没有用PSNR评测
不是很懂finetune是什么意思

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
SDA		SDA
test		test
README.md		README.md
da_solver.prototxt		da_solver.prototxt
da_tran_test.prototxt		da_tran_test.prototxt
imm.py		imm.py
kllosslayer.py		kllosslayer.py
load1.txt		load1.txt
load2.txt		load2.txt
net.prototxt		net.prototxt
train_da.sh		train_da.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SSDA实现

描述

预处理

训练

第一个网络

中间结果的处理

第二个网络

效果

遇到的问题和解决的办法

如何得到训练的结果

不收敛的情况

结果一片糊

目前没做和不懂的问题

About

Releases

Packages

Languages

tomstream/SSDA

Folders and files

Latest commit

History

Repository files navigation

SSDA实现

描述

预处理

训练

第一个网络

中间结果的处理

第二个网络

效果

遇到的问题和解决的办法

如何得到训练的结果

不收敛的情况

结果一片糊

目前没做和不懂的问题

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages