带有口型同步功能的视频翻译

English ｜中文

带有口型同步功能的视频翻译

转录视频语音并翻译
语音克隆
口型同步
压制字幕
支持中英视频互相转换

效果演示

详见res.mp4

技术栈

语音识别：fast-whisper
文本翻译：
- facebook/m2m
- translators[默认值]
音色克隆：
- openvoice（对于中文，使用微软的TTS替换openvoice自带的TTS模型）
- TTS[默认值]
口型同步：videotalking
脸部超分：gfpgan
视频整合：pyvideotrans

环境搭建

安装ffmpeg并添加到环境变量，或者是直接把相应可执行程序放到当前目录ffmpeg文件夹

ffmpeg
   |- ffmpeg.exe
   |- ffprobe.exe
...

安装依赖

git clone [email protected]:halfzm/v2vt.git

conda create -n v2vt_clone python=3.11.0
conda activate v2vt_clone

cd v2vt_clone
pip install -r requirements.txt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

把openvoice中需要的模型放到openvoice_checkpoints文件夹中，目录结构应该如下[optional]

openvoice_checkpoints
   |- base_speakers
    |- ...
   |- converter
    |- ...
...

把tts中需要的模型放到tts_models文件夹中，目录结构应该如下

tts_models
   |- tts_models--multilingual--multi-dataset--xtts_v2
    |- config.json
    |- model.pth
    |- speakers_xtts.pth
    |- vocal.json
   |- ...
...

把video_retalking中需要的模型放到video-retalking/checkpoints文件夹中，目录结构应该如下

video-retalking
   |- checkpoints
    |- ...
...

使用说明

快速启动

python app.py

关于输入
输入视频不能太短，否则语音克隆的时候报错（最好不要低于5S）
关于输出
默认是输出到当前目录下的output.mp4，也可以在webui中直接下载

其它

licence和code_of_conduct和video-retalking项目一致
详见LICENSE和CODE_OF_CONDUCT

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
OpenVoice		OpenVoice
video-retalking		video-retalking
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
LICENSE		LICENSE
app.py		app.py
clone_voice.py		clone_voice.py
clone_xtts.py		clone_xtts.py
microsoft_tts.py		microsoft_tts.py
readme-en.md		readme-en.md
readme.md		readme.md
requirements.txt		requirements.txt
res.mp4		res.mp4
s2st.py		s2st.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

带有口型同步功能的视频翻译

效果演示

技术栈

环境搭建

使用说明

其它

About

Releases

Packages

Languages

License

D3lik/v2vt

Folders and files

Latest commit

History

Repository files navigation

带有口型同步功能的视频翻译

效果演示

技术栈

环境搭建

使用说明

其它

About

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages