Skip to content
/ piRobot Public
forked from apanly/piRobot

树莓派语音识别机器人(项目转移到autohome项目)

Notifications You must be signed in to change notification settings

GlareL/piRobot

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

63 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

申明

项目转移到 autohome,目的是全新重构智能家居系统,是系统更具有扩展性

家居声控系统

目标

  • 开发一个全智能的语音识别机器人,期望安装在树莓派上,然后控制家里的家电,并且可以控制linux内核的笔记本等设备识别指令集

开发语言

  • python

python依赖包(推荐使用easy_install安装依赖)

  • requests
  • pyzmq
  • pyaudio(如若提示portaudio错误,请安装就可以了)
  • PIL(Python Imaging Library)
  • v4l2capture
  • wave
  • Internet connection
  • gntp
  • wolframalpha

linux依赖包

  • growl for linux
  • pico2wave
  • sudo apt-get install espeak

如何使用

  • 启动gol(growl on linux) 我编译安装之后路径如下/usr/local/bin/gol
  • python startup.py

系统架构图

家居声控系统图

Todolist

  • 静音判断
  • 搜索指令集需要分类(可以借助dbpedia),例如人物,音乐,学习,编程手册等等
  • 语音识别本地化,Julius speech recogition是一个开源的项目
  • 加入学习模式,例如大耳朵、可可、沪江等网站,可以获取感兴趣的每天开始学习
  • 加入新闻机器人的功能,以后看新闻就可以不用那么多网站找了(想法是可以找英文和科技)英文我发现有个拓词和百词斩非常不错
  • 命令分类:电视,空调,唱歌,编程,新闻,图片,天气预报(目前就这几类,后面可以添加),先找命令类型,然后执行详细命令 例如电视频道50(分词结果电视频道,50) 电视 先找到电视类别,然后执行频道50

has done

  • 录音功能,最长录音时间5S,如果中间停顿次数多余15次会提前终止此次录音
  • stt功能,将上一步的录音通过google api 翻译音频内容
  • command功能 根据上一步google api 返回的内容,进行简单指令操作
  • 加入Usage命令提示功能
  • 实现了 start/stop 命令功能
  • 实现了同时只有一个应用程序启动的判断
  • 在桌面环境使用growl提示用户
  • 使用pico实现了tts->修改成e-speak (例如:espeak -vzh "郭威 我爱你")
  • gntp 和 growl 共同结合 给用户有好提示信息
  • 多线程,网络模型如下:有一个栈专门用于接受音频,有很多个子线程(或者多个进程)从栈中抢取音频指令,对于阻塞的指令可能需要特殊处理,例如播放音乐
  • 利用树莓派嵌入式的优势,然后开发控制tv,空调等指令 --PS:这个已经实现了,请关注红外控制系统piInfrated

doing

  • Yahoo由14个基本大类组成,包括 Art&Humanities(艺术与人文)、Business&Economy(商业与经济)、 Computers&Internet(电脑与网际网路/网络)、Education(教育)、 Entertainment(娱乐)、Government(政府)、Health(健康与医药)、 News&Media(新闻与媒体)、Recreation&Sports(休闲与运动)、 Reference(参考资料)、Regional(国家与地区)、 Science(科学)、SocialScience(社会科学)、 Society&Culture(社会与文化)
  • 静音判断,正在研究vad技术
  • 中文文本自动纠错
  • 语音识别可以修改成Kaldi(google被墙了)

参考文档如下

How to Contact

QQ:36405410

Copying

Free use of this software is granted under the terms of the GNU Lesser General Public License (LGPL)

About

树莓派语音识别机器人(项目转移到autohome项目)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%