transformer transformer resources 参考文章: BERT大火却不懂Transformer?读这一篇就够了 nlp中的Attention注意力机制+Transformer详解 深度学习中的注意力模型(2017版) Attention机制详解(一)——Seq2Seq中的Attention Attention机制详解(二)——Self-Attention与Transformer Attention机制详解(三)——Attention模型的应用 一文看懂 Attention(本质原理+3大优点+5大类型 Attention机制从入门到精通 源码解析: The Annotated Transformer The Annotated Transformer的中文注释版(1) The Annotated Transformer的中文注释版(2) The Annotated Transformer的中文注释版(3)