Skip to content

Commit

Permalink
fix conflict
Browse files Browse the repository at this point in the history
  • Loading branch information
littletomatodonkey committed Dec 15, 2020
2 parents 25becc0 + 4b19d37 commit 79a2a32
Show file tree
Hide file tree
Showing 3 changed files with 23 additions and 21 deletions.
2 changes: 1 addition & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -97,7 +97,7 @@ For a new language request, please refer to [Guideline for new language_requests
- [Benchmark](./doc/doc_en/benchmark_en.md)
- Data Annotation and Synthesis
- [Semi-automatic Annotation Tool: PPOCRLabel](./PPOCRLabel/README.md)
- [Data Synthesis Tool: Style_Edit](./StyleTextRec/README.md)
- [Data Synthesis Tool: Style-Text](./StyleText/README.md)
- [Other Data Annotation Tools](./doc/doc_en/data_annotation_en.md)
- [Other Data Synthesis Tools](./doc/doc_en/data_synthesis_en.md)
- Datasets
Expand Down
2 changes: 1 addition & 1 deletion StyleText/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -153,7 +153,7 @@ After adding the above synthetic data for training, the accuracy of the recognit
### Code Structure

```
style_text_rec
StyleText
|-- arch // Network module files.
| |-- base_module.py
| |-- decoder.py
Expand Down
40 changes: 21 additions & 19 deletions StyleText/README_ch.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,7 @@

## Style Text


### 目录
- [一、工具简介](#工具简介)
- [二、环境配置](#环境配置)
Expand Down Expand Up @@ -88,7 +89,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
</div>

#### 批量合成
在实际应用场景中,经常需要批量合成图片,补充到训练集中。StyleText可以使用一批风格图片和语料,批量合成数据。合成过程如下:
在实际应用场景中,经常需要批量合成图片,补充到训练集中。Style-Text可以使用一批风格图片和语料,批量合成数据。合成过程如下:

1.`configs/dataset_config.yml`中配置目标场景风格图像和语料的路径,具体如下:

Expand All @@ -103,7 +104,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
* `language`:语料的语种;
* `corpus_file`: 语料文件路径。

StyleText也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。
Style-Text也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。

中英韩5万张通用场景数据: [下载地址](https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/chkoen_5w.tar)

Expand All @@ -119,7 +120,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_

<a name="应用案例"></a>
### 四、应用案例
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用Style-Text合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:

<div align="center">
<img src="doc/images/6.png" width="800">
Expand All @@ -135,40 +136,41 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_

<a name="代码结构"></a>
### 五、代码结构

```
style_text_rec
|-- arch
StyleText
|-- arch // 网络结构定义文件
| |-- base_module.py
| |-- decoder.py
| |-- encoder.py
| |-- spectral_norm.py
| `-- style_text_rec.py
|-- configs
|-- configs // 配置文件
| |-- config.yml
| `-- dataset_config.yml
|-- engine
| |-- corpus_generators.py
| |-- predictors.py
| |-- style_samplers.py
| |-- synthesisers.py
| |-- text_drawers.py
| `-- writers.py
|-- examples
|-- engine // 数据合成引擎
| |-- corpus_generators.py // 从文本采样或随机生成语料
| |-- predictors.py // 调用网络生成数据
| |-- style_samplers.py // 采样风格图片
| |-- synthesisers.py // 调度各个模块,合成数据
| |-- text_drawers.py // 生成标准文字图片,用作输入
| `-- writers.py // 将合成的图片和标签写入本地目录
|-- examples // 示例文件
| |-- corpus
| | `-- example.txt
| |-- image_list.txt
| `-- style_images
| |-- 1.jpg
| `-- 2.jpg
|-- fonts
|-- fonts // 字体文件
| |-- ch_standard.ttf
| |-- en_standard.ttf
| `-- ko_standard.ttf
|-- tools
|-- tools // 程序入口
| |-- __init__.py
| |-- synth_dataset.py
| `-- synth_image.py
`-- utils
| |-- synth_dataset.py // 批量合成数据
| `-- synth_image.py // 合成单张图片
`-- utils // 其他基础功能模块
|-- config.py
|-- load_params.py
|-- logging.py
Expand Down

0 comments on commit 79a2a32

Please sign in to comment.