Skip to content

重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。

Notifications You must be signed in to change notification settings

tiansztiansz/voice-assistant

Repository files navigation

智能语音助手

基于 Snowboy、Whisper、ChatYuan 和 Azure TTS 的智能语音助手

捐赠     bilibili     博客园     抖音     kaggle


如何使用

首先确保系统环境为 Ubuntu 20.04 及以上!

打开终端并克隆本仓库:

git clone https://github.com/tiansztiansz/voice-assistant.git

进入项目目录:

cd voice-assistant

然后安装依赖包:

pip install -r requirements.txt

接着运行主程序:

python3 app.py

当你看到程序显示“等待唤醒”字样时,则表明你已成功运行了程序!

接着尝试唤醒它吧,请说“小智小智”。当听到 ding 的语音提示时,请尝试说“广州在哪里”来向它提问。

或者当你想听歌的时候,请尝试说“播放音乐”


目录结构

.
├── LICENSE              # 协议
├── _snowboydetect.so    # 依赖文件
├── app.py               # 主程序
├── chatyuan.py          # 聊天模块
├── readme.md            # 自述文件
├── requirements.txt     # 依赖包
├── resources           
│   ├── common.res       # 依赖文件
│   ├── ding.wav         # 唤醒时的启动音频
│   ├── music.mp3        # 音乐文件
│   ├── music_list.csv   # 音乐下载链接
│   ├── sst.wav          # 语音转文本的音频
│   ├── tts.mp3          # 文本转语音的音频
│   └── xiaozhixiaozhi.pmdl  # 唤醒模型
├── snowboy-detect-swig.cc   # 依赖文件
├── snowboy-detect-swig.i    # 依赖文件
├── snowboy-detect-swig.o    # 依赖文件
├── snowboydecoder.py        # 唤醒模块
├── snowboydetect.py         # 唤醒模块
├── src                      # 其他文件夹
│   ├── BILIBILI_LOGO.svg
│   ├── kaggle.svg
│   ├── license.svg
│   ├── 博客园.jpg
│   ├── 抖音.svg
│   ├── 捐赠.svg
│   └── 语音助手显示视频.gif
├── tts.py        # 文字转语音模块
└── whisper.py    # 语音转文本模块

智能音箱实现

可在淘宝购买【带麦克风】的蓝牙音箱,连接电脑后即可实现智能音箱的效果。


待办事项

  • 修改唤醒时的语音
  • 语音转文字的提示
  • 文字转文字的提示
  • 文字转语音的提示

参考资料

训练唤醒模型

唤醒后录制音频

如何使用snowboy

音乐如何下载

chatyuan

killed错误

kaggle-AI


赞助

如果这个项目对你有帮助,请给一个⭐️!

如果资金充裕,能否考虑请小弟喝杯奶茶🧋

About

重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published