GitHub

《深度实践OCR：基于深度学习的文字识别》随书代码

The source code and dataset of 《深度实践OCR：基于深度学的文字识别》

本书主要是面向文字识别初、中级学习从业人员，介绍了OCR的各类方法，既包括图像预处理、数据生成与增强、文字检测与识别等基础内容，又有与神经网络和目标检测相结合的内容。由于是第一版，还存在非常多的问题，我们也希望能够把这本书完善好，为国内的初学者提供一个体系化的入门路径，所以非常期待各位读者朋友提出改进意见。

环境

本书代码默认运行在ubuntu系统，主要依赖pytorch,Numpy,Opencv,Pillow。

1.安装依赖

pip install -r requirements.txt

章节安排

chapter-2 图像预处理方法
chapter-3 传统机器学习方法
chapter-4 深度学习的相关基础知识
chapter-5 数据生成
chapter-6 高级深度学习方法
chapter-7 文字检测技术
chapter-8 文字识别
chapter-9 OCR后处理的方法
chapter-10 版面分析方法

其他

在第五章节补充了数据集的部分，读者可以用于训练检测和识别网络。目前已经全部补充完整，由于部分作者不维护，导致我肝的特别累，加上996的工作，有可能无法及时反馈，读者朋友们可以发我的邮箱。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

《深度实践OCR：基于深度学习的文字识别》随书代码

环境

章节安排

其他

About

Releases

Packages

Contributors 3

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
chapter-10		chapter-10
chapter-2		chapter-2
chapter-3		chapter-3
chapter-4		chapter-4
chapter-5		chapter-5
chapter-6		chapter-6
chapter-7		chapter-7
chapter-8		chapter-8
chapter-9		chapter-9
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

ocrbook/ocrinaction

Folders and files

Latest commit

History

Repository files navigation

《深度实践OCR：基于深度学习的文字识别》 随书代码

环境

章节安排

其他

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

《深度实践OCR：基于深度学习的文字识别》随书代码

Packages