transformer预训练模型是如何训练的？ #61

dzyanshan · 2022-11-22T06:50:04Z

作者您好！以我目前的浅薄理解，训练的过程是transformer模型直接加载笔划权重pretrain_transformer_stroke_decomposition.pth，计算sr图与hr图的结果，l1loss回传给生成模型，预测过程是lr图经过生成模型获取sr图，使用crnn直接预测结果吗？transformer模型的参数在中途是不是不变啊，笔划部分是如何训练的呢？

liujie316316 · 2023-08-17T08:09:55Z

您好，请问一下回传给生成模型的是l1损失吗？不是l2损失吗？回传过去的是mse loss吗？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

transformer预训练模型是如何训练的？ #61

transformer预训练模型是如何训练的？ #61

dzyanshan commented Nov 22, 2022

liujie316316 commented Aug 17, 2023

transformer预训练模型是如何训练的？ #61

transformer预训练模型是如何训练的？ #61

Comments

dzyanshan commented Nov 22, 2022

liujie316316 commented Aug 17, 2023