improve amp training #10119

zhangting2020 · 2023-06-08T04:07:15Z

背景：ch_PP-OCRv2_det 模型在amp fp16训练中，O1、O2都会出现nan，原因是模型中卷积层的数值范围极大，超出了fp16的表示范围，并不适合这种训练方式。我们尝试了amp bf16 训练，发现无需任何额外配置，模型未出现nan，精度和相同配置下的fp32训练可以对齐。

PR：为套件添加amp_dtype的选项，默认为float16，给ch_PP-OCRv2_det 模型配置为bfloat16

paddle-bot · 2023-06-08T04:07:19Z

Thanks for your contribution!

andyjiang1116

LGTM

improve amp training

6ea1e96

andyjiang1116 approved these changes Jun 8, 2023

View reviewed changes

andyjiang1116 merged commit 6949448 into PaddlePaddle:dygraph Jun 8, 2023
2 checks passed

Provide feedback