如何让风扇转起来

适合初学者。

1. 环境配置

本地测试环境：

LAPTOP: ROG Zephyrus G15

OS: Windows 11 家庭中文版 21H2

GPU: NVIDIA GeForce RTX 3080 Laptop GPU

云端测试环境：

CPU: 18 核 Xeon Gold 6142

GPU: 3 块 RTX 3080，共 31.5 GB 显存

Docker: v20.10.10

CUDA: v11.2

PyTorch: v1.10

基本依赖：

检查清单
若torch.__version__显示cpu，请卸载torch并重装gpu版本。
若torch.cuda.is_available()显示False，请自行查阅资料安装CUDA和cuDNN。

其他依赖：

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

2. 数据准备、模型训练与模型评估

建议先跳过这一步，直接下载release中提供的预训练模型；看到最终效果后，再返工训练模型。

首先，

下载 zhvoice 中文语音数据集
根目录下新建dataset文件夹，将数据集压缩包依次解压至该文件夹
（选做）将加性噪声音频添加至dataset文件夹，相应地，修改./config/augment.yml
在终端中运行：python .\create_data.py，创建列表

其次，

在终端中运行：python .\train.py，训练模型
在终端中运行：visualdl --logdir ./log --port 8080，查看进展（http:https://127.0.0.1:8080）

最后，

在终端中运行：python eval.py，计算阈值

3. 声纹相似度量与声纹数据库

如果你跳过了第二步，请确认是否已经将models.zip解压至当前工作目录。
如果成功，./models/ecapa_tdnn中会存在model.pth文件。
相似度量：
声纹数据库注册与声纹识别：

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
DURUII/res		DURUII/res
audio		audio
audio_db		audio_db
configs		configs
data_utils		data_utils
dataset		dataset
models/ecapa_tdnn		models/ecapa_tdnn
modules		modules
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
create_data.py		create_data.py
eval.py		eval.py
infer_contrast.py		infer_contrast.py
infer_recognition.py		infer_recognition.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

如何让风扇转起来

1. 环境配置

2. 数据准备、模型训练与模型评估

3. 声纹相似度量与声纹数据库

About

Releases

Contributors 2

Languages

License

DURUII/Homework-Voiceprint-Repo-0.0

Folders and files

Latest commit

History

Repository files navigation

如何让风扇转起来

1. 环境配置

2. 数据准备、模型训练与模型评估

3. 声纹相似度量与声纹数据库

About

Resources

License

Stars

Watchers

Forks

Releases

Contributors 2

Languages