本readme文件只起到项目概况说明作用以及一些问题的记录,具体环境搭建及数据集获取,训练推理等设置见两个子文件夹的readme。
- 阅读论文,理解算法
- 按照readme文档搭建环境。遇到包括cuda及部分python库版本不兼容等问题,但都可以解决。
- 训练模型,遇到包括数据集格式修改,代码中库函数版本修改等问题。其中数据集修改可以通过代码逻辑进行猜测,重新对数据集进行划分来解决。代码中库函数版本修改可以通过调整代码解决。另外训练速度表现不佳,经过一些超参数调整后有所改善,但似乎仍然与理论有差距。
- 模型推理,无法完全达到论文中指标,经过简单调参重新训练更久之后有所改善。部分数据集上的指标超过原论文。
- 在原论文的基础上进行一些小的改进,或许只能称之为消融实验
- 包括修改部分超参数,更改一个在另一篇文章中学到的激活函数,以及更改backbone为更大的特征抽取网络,更改优化器等。但仅仅是略有效果。这些修改仅仅是实验性质的,并没有算法理论支撑。在网络结构上没有什么重要的修改,主要时认为文章中网络结构设计的很合理了,除了加大参数量似乎没有什么明显的改进想法。
- 同样进行实验后,结果展示在pdf报告中。
由于无力在baseline做出明显的本质改进,故选择了另一篇较为新颖的同时算力要求不会过于大的文章作为改进的算法复现对象。
- 阅读论文,理解算法
- 按照readme文档搭建环境。虽然代码是tensorflow,但在搭环境时没有碰到明显问题。
- 模型训练与推理。作者提供pretrained weight,故没有再从头训练一个。另外正好作者也在O-Haze和SOTS上分别训练了模型,可以直接进行对比。
- 对比结果见pdf报告。