徐静
2017年开始关注语音识别(ASR),中间放弃了一段时间,这两年由于Transformer的流行,其端到端的ASR和基于工业应用的开源框架 层出不穷,让我们开始学习吧!
-
1.李宏毅ASR课程笔记
-
2.GMM-HMM
-
3.Tandem
-
4.DNN-HMM Hybrid
-
5.LAS
-
6.CTC
-
7.RNA
-
8.RNN-Transducer(RNN-T)
-
9.Neural Transducer
-
10.MoChA]
-
11.Conformer
-
12.Transfomer-Transducer
-
13.DeepSpeech V1,V2,V3
-
14.FSMN
-
15.TDNN
-
16.Quartznet
-
17.Jasper
-
18.Citrinet
-
19.ContextNet
-
20.WeNet_paper
-
21.WFST
-
22.Hybrid CTC/Attention
-
29.Speech-Transformer
-
30.squeezeformer
-
23.开源语音识别数据集介绍
-
24.Kaldi学习
-
25.K2学习 -
26.WeNet学习
-
27.ESPNet学习
-
28.NeMo学习
-
Triton inference server部署ASR服务(暂时不开源,可提供有偿服务)
-
TensorRT ASR模型部署(暂时不开源,可提供有偿服务)
-
31.Paraformer and FunASR
-
32.Whisper