基于 Snowboy、Whisper、ChatYuan 和 Azure TTS 的智能语音助手
首先确保系统环境为 Ubuntu 20.04 及以上!
打开终端并克隆本仓库:
git clone https://github.com/tiansztiansz/voice-assistant.git
进入项目目录:
cd voice-assistant
然后安装依赖包:
pip install -r requirements.txt
接着运行主程序:
python3 app.py
当你看到程序显示“等待唤醒”字样时,则表明你已成功运行了程序!
接着尝试唤醒它吧,请说“小智小智”。当听到 ding 的语音提示时,请尝试说“广州在哪里”来向它提问。
或者当你想听歌的时候,请尝试说“播放音乐”
.
├── LICENSE # 协议
├── _snowboydetect.so # 依赖文件
├── app.py # 主程序
├── chatyuan.py # 聊天模块
├── readme.md # 自述文件
├── requirements.txt # 依赖包
├── resources
│ ├── common.res # 依赖文件
│ ├── ding.wav # 唤醒时的启动音频
│ ├── music.mp3 # 音乐文件
│ ├── music_list.csv # 音乐下载链接
│ ├── sst.wav # 语音转文本的音频
│ ├── tts.mp3 # 文本转语音的音频
│ └── xiaozhixiaozhi.pmdl # 唤醒模型
├── snowboy-detect-swig.cc # 依赖文件
├── snowboy-detect-swig.i # 依赖文件
├── snowboy-detect-swig.o # 依赖文件
├── snowboydecoder.py # 唤醒模块
├── snowboydetect.py # 唤醒模块
├── src # 其他文件夹
│ ├── BILIBILI_LOGO.svg
│ ├── kaggle.svg
│ ├── license.svg
│ ├── 博客园.jpg
│ ├── 抖音.svg
│ ├── 捐赠.svg
│ └── 语音助手显示视频.gif
├── tts.py # 文字转语音模块
└── whisper.py # 语音转文本模块
可在淘宝购买【带麦克风】的蓝牙音箱,连接电脑后即可实现智能音箱的效果。
- 修改唤醒时的语音
- 语音转文字的提示
- 文字转文字的提示
- 文字转语音的提示
如果这个项目对你有帮助,请给一个⭐️!
如果资金充裕,能否考虑请小弟喝杯奶茶🧋