GitHub - hpc203/MOWA-onnxrun: 使用onnxruntime部署MOWA：多合一图像扭曲模型，能处理6种图像扭曲任务，依然是包含C++和Python两个版本的程序

paper名称是《MOWA: Multiple-in-One Image Warping Model》, ariv链接 https://arxiv.org/pdf/2404.10716 我第一次读这篇paper时，就被文章将开头的图片吸引了，图片是这样的。可以看到，它一个模型就解决多个图像扭曲任务的，并且在摘要里的最后说：“大量实验表明，我们的 MOWA 在六个多合一图像扭曲任务上进行训练，在大多数任务上都优于最先进的特定任务模型。此外，MOWA 还表现出泛化到未见过场景的潜力，跨域和零样本评估证明了这一点。”

这么好的文章，我立刻就想着导出onnx模型文件，编写推理部署程序的，经过3天的编写和调试，最后发布了这套代码。起初想用opencv-dnn做推理引擎的，可是opencv-dnn加载onnx文件报错了，看日志信息推测是在encoder模块里的LeWinTransformerBlock模块里的masked_fill在捣鬼，因此我使用onnxruntime做推理引擎。

在编写c++程序的过程中发现了一个有趣的现象，那就是在GridSamplerBilinear函数里，数组以vector的形式访问和赋值，耗时140秒，可是以指向数组的指针形式访问和赋值，耗时只有0.003秒，相差了46666倍的速度。

onnx文件在百度云盘，链接：https://pan.baidu.com/s/1fLODbgP7oMeHUXuCR3U0xQ 提取码：auhs

测试图片数量比较多，打包上传到百度云盘了，链接：https://pan.baidu.com/s/1Fq871r6TTsxcpqthgME9cg 提取码：jxk6

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
cpp		cpp
python		python
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

hpc203/MOWA-onnxrun

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages