JP2016186516A - 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム - Google Patents
疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム Download PDFInfo
- Publication number
- JP2016186516A JP2016186516A JP2015065788A JP2015065788A JP2016186516A JP 2016186516 A JP2016186516 A JP 2016186516A JP 2015065788 A JP2015065788 A JP 2015065788A JP 2015065788 A JP2015065788 A JP 2015065788A JP 2016186516 A JP2016186516 A JP 2016186516A
- Authority
- JP
- Japan
- Prior art keywords
- pseudo
- audio signal
- signal generation
- sound
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 40
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 title abstract description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 73
- 238000006243 chemical reaction Methods 0.000 claims abstract description 20
- 239000000284 extract Substances 0.000 claims abstract description 3
- 230000006978 adaptation Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 abstract description 8
- 230000001755 vocal effect Effects 0.000 description 30
- 238000012545 processing Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】疑似音声信号生成部12は、出現頻度が低い音声現象の音響特性を表現した変換ルールに基づいて入力音声信号の音源を変換し、その音源で入力音声信号から抽出したスペクトル包絡を励振することで疑似音声信号を生成する。疑似音響特徴量生成部13は、疑似音声信号から音響特徴量を抽出し疑似音響特徴量系列を生成する。音響モデル学習部14は、疑似音響特徴量系列を用いて音響モデルを学習する。
【選択図】図1
Description
第一実施形態では、ルールベースによりささやき声の音声信号を疑似生成し、その疑似音声信号を用いて音響モデルを適応する方法について説明する。変換ルールはささやき声の音響特性に基づいて事前に作成しておき、その変換ルールに基づいて通常の発声からささやき声に変換することで、ささやき声による音声信号の疑似生成を行う。
〔参考文献1〕徳田恵一, 小林隆夫, 千葉健司, 今井 聖, “メル一般化ケプストラム分析による音声のスペクトル推定”, 電子情報通信学会論文誌.A, vol. J75-A, no. 7, pp. 1124-1134, 1992
〔参考文献2〕篠田浩一、“確率モデルによる音声認識のための話者適応化技術”、電子情報通信学会論文誌、J87-D-II(2)、pp. 371-386、2004年
第二実施形態では、ルールベースによりボーカルフライの音声信号を疑似生成し、その疑似音声信号を用いて音響モデルを適応する方法について説明する。変換ルールはボーカルフライの音響特性に基づいて事前に作成しておき、その変換ルールに基づいて通常の発声からボーカルフライに変換することで、ボーカルフライによる音声信号の疑似生成を行う。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
2 音響モデル適応装置
11 音声信号取得部
12 疑似音声信号生成部
13 疑似音響特徴量生成部
14 音響モデル学習部
21 音声信号記憶部
22 疑似音声信号記憶部
23 疑似音響特徴量記憶部
24 音響モデル記憶部
Claims (6)
- 出現頻度が低い音声現象の音響特性を表現した変換ルールに基づいて入力音声信号の音源を変換し、当該音源で上記入力音声信号から抽出したスペクトル包絡を励振することで疑似音声信号を生成する疑似音声信号生成部を含む疑似音声信号生成装置。
- 請求項1に記載の疑似音声信号生成装置であって、
上記疑似音声信号生成部は、上記入力音声信号の音源をホワイトノイズに変換し、当該音源で上記スペクトル包絡を励振することによって上記疑似音声信号を生成するものである
疑似音声信号生成装置。 - 請求項1に記載の疑似音声信号生成装置であって、
上記疑似音声信号生成部は、上記入力音声信号の音源を母音区間の基本周波数が低くなり断続的に音声が消失するように変換し、当該音源で上記入力音声信号から抽出したスペクトル包絡を励振することによって上記疑似音声信号を生成するものである
疑似音声信号生成装置。 - 請求項1から3のいずれかに記載の疑似音声信号生成装置により生成した疑似音声信号を記憶する疑似音声信号記憶部と、
上記疑似音声信号から音響特徴量を抽出し疑似音響特徴量系列を生成する疑似音響特徴量生成部と、
上記疑似音響特徴量系列を用いて音響モデルを学習する音響モデル学習部と、
を含む音響モデル適応装置。 - 疑似音声信号生成部が、出現頻度が低い音声現象の音響特性を表現した変換ルールに基づいて入力音声信号の音源を変換し、当該音源で上記入力音声信号から抽出したスペクトル包絡を励振することで疑似音声信号を生成する疑似音声信号生成ステップを含む疑似音声信号生成方法。
- 請求項1から3のいずれかに記載の疑似音声信号生成装置もしくは請求項4に記載の音響モデル適応装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015065788A JP2016186516A (ja) | 2015-03-27 | 2015-03-27 | 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015065788A JP2016186516A (ja) | 2015-03-27 | 2015-03-27 | 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016186516A true JP2016186516A (ja) | 2016-10-27 |
Family
ID=57203168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015065788A Pending JP2016186516A (ja) | 2015-03-27 | 2015-03-27 | 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016186516A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018072698A (ja) * | 2016-11-02 | 2018-05-10 | ヤマハ株式会社 | 信号処理方法、および信号処理装置 |
JP2020515877A (ja) * | 2018-04-12 | 2020-05-28 | アイフライテック カンパニー,リミテッド | ささやき声変換方法、装置、デバイス及び可読記憶媒体 |
JPWO2021044606A1 (ja) * | 2019-09-06 | 2021-03-11 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008139573A (ja) * | 2006-12-01 | 2008-06-19 | Oki Electric Ind Co Ltd | 声質変換方法、声質変換プログラム、声質変換装置 |
WO2008102594A1 (ja) * | 2007-02-19 | 2008-08-28 | Panasonic Corporation | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム |
-
2015
- 2015-03-27 JP JP2015065788A patent/JP2016186516A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008139573A (ja) * | 2006-12-01 | 2008-06-19 | Oki Electric Ind Co Ltd | 声質変換方法、声質変換プログラム、声質変換装置 |
WO2008102594A1 (ja) * | 2007-02-19 | 2008-08-28 | Panasonic Corporation | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム |
Non-Patent Citations (2)
Title |
---|
石井カルロス寿憲: "りきみの自動検出のための音響分析", 電子情報通信学会技術研究報告 VOL.106 NO.178 IEICE TECHNICAL REPORT, vol. 第106巻, JPN6017048046, 14 July 2006 (2006-07-14), JP, pages 1 - 6, ISSN: 0003702753 * |
芦原孝典: "声質変換を用いた音声特徴量疑似生成による話者適応", 電子情報通信学会技術研究報告 VOL.114 NO.411 IEICE TECHNICAL REPORT, vol. 第114巻, JPN6017048044, 22 January 2015 (2015-01-22), JP, pages 13 - 18, ISSN: 0003702752 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018072698A (ja) * | 2016-11-02 | 2018-05-10 | ヤマハ株式会社 | 信号処理方法、および信号処理装置 |
JP2020515877A (ja) * | 2018-04-12 | 2020-05-28 | アイフライテック カンパニー,リミテッド | ささやき声変換方法、装置、デバイス及び可読記憶媒体 |
JPWO2021044606A1 (ja) * | 2019-09-06 | 2021-03-11 | ||
WO2021044606A1 (ja) * | 2019-09-06 | 2021-03-11 | 日本電信電話株式会社 | 学習装置、推定装置、それらの方法、およびプログラム |
JP7279800B2 (ja) | 2019-09-06 | 2023-05-23 | 日本電信電話株式会社 | 学習装置、推定装置、それらの方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
O’Shaughnessy | Automatic speech recognition: History, methods and challenges | |
JP6305955B2 (ja) | 音響特徴量変換装置、音響モデル適応装置、音響特徴量変換方法、およびプログラム | |
Sinha et al. | Assessment of pitch-adaptive front-end signal processing for children’s speech recognition | |
Shahnawazuddin et al. | Pitch-Adaptive Front-End Features for Robust Children's ASR. | |
Deshwal et al. | Feature extraction methods in language identification: a survey | |
US11495235B2 (en) | System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks | |
US20070239444A1 (en) | Voice signal perturbation for speech recognition | |
Yadav et al. | Addressing noise and pitch sensitivity of speech recognition system through variational mode decomposition based spectral smoothing | |
Gutkin et al. | TTS for low resource languages: A Bangla synthesizer | |
Rao et al. | Speech processing in mobile environments | |
KR101068122B1 (ko) | 음성인식기에서 가비지 및 반단어 모델 기반의 거절 장치 및 방법 | |
KR102198598B1 (ko) | 합성 음성 신호 생성 방법, 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법 | |
Eringis et al. | Improving speech recognition rate through analysis parameters | |
Kathania et al. | Explicit pitch mapping for improved children’s speech recognition | |
JP2016186516A (ja) | 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム | |
Erokyar | Age and gender recognition for speech applications based on support vector machines | |
Zealouk et al. | Noise effect on Amazigh digits in speech recognition system | |
JP2006171750A (ja) | 音声認識のための特徴ベクトル抽出方法 | |
Sahoo et al. | MFCC feature with optimized frequency range: An essential step for emotion recognition | |
Kurcan | Isolated word recognition from in-ear microphone data using hidden markov models (HMM) | |
KR102198597B1 (ko) | 뉴럴 보코더 및 화자 적응형 모델을 구현하기 위한 뉴럴 보코더의 훈련 방법 | |
Fauziya et al. | A Comparative study of phoneme recognition using GMM-HMM and ANN based acoustic modeling | |
Gaudani et al. | Comparative study of robust feature extraction techniques for ASR for limited resource Hindi language | |
JP6367773B2 (ja) | 音声強調装置、音声強調方法及び音声強調プログラム | |
Kaur et al. | Power-Normalized Cepstral Coefficients (PNCC) for Punjabi automatic speech recognition using phone based modelling in HTK |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180306 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20181002 |