zero to nlp

特点

注重中文的nlp建设
基于transformers库
每一个项目，都具有数据、模型训练、部署等模块
提供公开的数据
开箱即用，保证代码都是可跑通，替换数据即可训练出自己的模型
transformers库的源码级介绍
基于pytorch，不用tensorflow
模型方面，只介绍大模型，不再介绍传统文本模型
每一个项目，都会给出相关的坑和注意事项

中文名称	文件夹名称	数据	数据清洗	大模型	模型部署	图解
中文文本分类	chinese_classifier	✅	✅	✅	☑️	✅
中文gpt2	chinese_gpt2	✅	✅	✅	✅	☑️
中文clip	chinese_clip	✅	✅	✅	☑️	✅
图像生成中文文本	VisionEncoderDecoderModel	✅	✅	✅	☑️	✅
vit核心源码介绍	vit model	☑️	☑️	☑️	☑️	✅
训练Thu-ChatGlm-6b	simple_thu_chatglm6b	✅	✅	✅	✅	☑️

数据流程图解

我一直觉得，数据流程通过图解的形式表达出来，其实是最清楚的，因此我都会尽可能的把每一个任务的都图解出来。

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
.idea		.idea
chinese_classifier		chinese_classifier
chinese_clip		chinese_clip
chinese_gpt2		chinese_gpt2
images		images
simple_thu_chatglm6b		simple_thu_chatglm6b
train_thuglm(作废)		train_thuglm(作废)
vit-gpt2-image-chinese-captioning		vit-gpt2-image-chinese-captioning
vit		vit
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

zero to nlp

特点

目录

模型训练

数据流程图解

文本分类数据图解

中文gpt2

中文clip

图像生成中文文本

vit 源码

About

Releases

Packages

Languages

License

myxiaoyu/zero_nlp

Folders and files

Latest commit

History

Repository files navigation

zero to nlp

特点

目录

模型训练

数据流程图解

文本分类数据图解

中文gpt2

中文clip

图像生成中文文本

vit 源码

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages