WO2008102594A1 - 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム - Google Patents
力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム Download PDFInfo
- Publication number
- WO2008102594A1 WO2008102594A1 PCT/JP2008/050815 JP2008050815W WO2008102594A1 WO 2008102594 A1 WO2008102594 A1 WO 2008102594A1 JP 2008050815 W JP2008050815 W JP 2008050815W WO 2008102594 A1 WO2008102594 A1 WO 2008102594A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- speech
- converting
- tense
- tenseness
- voice
- Prior art date
Links
- 206010043268 Tension Diseases 0.000 title abstract 3
- 230000002194 synthesizing effect Effects 0.000 title 2
- 230000005284 excitation Effects 0.000 abstract 3
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
- G10L2021/0135—Voice conversion or morphing
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrically Operated Instructional Devices (AREA)
- Stereophonic System (AREA)
Abstract
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/438,860 US8898062B2 (en) | 2007-02-19 | 2008-01-22 | Strained-rough-voice conversion device, voice conversion device, voice synthesis device, voice conversion method, voice synthesis method, and program |
CN2008800010519A CN101606190B (zh) | 2007-02-19 | 2008-01-22 | 用力声音转换装置、声音转换装置、声音合成装置、声音转换方法、声音合成方法 |
JP2009500111A JP4355772B2 (ja) | 2007-02-19 | 2008-01-22 | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007-038315 | 2007-02-19 | ||
JP2007038315 | 2007-02-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2008102594A1 true WO2008102594A1 (ja) | 2008-08-28 |
Family
ID=39709873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2008/050815 WO2008102594A1 (ja) | 2007-02-19 | 2008-01-22 | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8898062B2 (ja) |
JP (1) | JP4355772B2 (ja) |
CN (1) | CN101606190B (ja) |
WO (1) | WO2008102594A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016186516A (ja) * | 2015-03-27 | 2016-10-27 | 日本電信電話株式会社 | 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム |
JP2019086801A (ja) * | 2013-10-17 | 2019-06-06 | ヤマハ株式会社 | 音声処理方法および音声処理装置 |
WO2021172439A1 (ja) * | 2020-02-27 | 2021-09-02 | パナソニックIpマネジメント株式会社 | 料理レシピ表示システム、料理レシピ表示方法、プログラム、および情報端末 |
JPWO2022054414A1 (ja) * | 2020-09-08 | 2022-03-17 |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5119700B2 (ja) * | 2007-03-20 | 2013-01-16 | 富士通株式会社 | 韻律修正装置、韻律修正方法、および、韻律修正プログラム |
CN101578659B (zh) * | 2007-05-14 | 2012-01-18 | 松下电器产业株式会社 | 音质转换装置及音质转换方法 |
JP5582135B2 (ja) * | 2009-02-18 | 2014-09-03 | 日本電気株式会社 | 動作対象制御装置、動作対象制御システム、動作対象制御方法及びプログラム |
JP5625482B2 (ja) * | 2010-05-21 | 2014-11-19 | ヤマハ株式会社 | 音響処理装置、音処理システムおよび音処理方法 |
US10002608B2 (en) * | 2010-09-17 | 2018-06-19 | Nuance Communications, Inc. | System and method for using prosody for voice-enabled search |
US20140207456A1 (en) * | 2010-09-23 | 2014-07-24 | Waveform Communications, Llc | Waveform analysis of speech |
US20130030789A1 (en) * | 2011-07-29 | 2013-01-31 | Reginald Dalce | Universal Language Translator |
WO2013018294A1 (ja) * | 2011-08-01 | 2013-02-07 | パナソニック株式会社 | 音声合成装置および音声合成方法 |
CN105122351B (zh) * | 2013-01-18 | 2018-11-13 | 株式会社东芝 | 声音合成装置及声音合成方法 |
JP6263868B2 (ja) * | 2013-06-17 | 2018-01-24 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
US9310800B1 (en) * | 2013-07-30 | 2016-04-12 | The Boeing Company | Robotic platform evaluation system |
US9484036B2 (en) * | 2013-08-28 | 2016-11-01 | Nuance Communications, Inc. | Method and apparatus for detecting synthesized speech |
WO2015057661A1 (en) * | 2013-10-14 | 2015-04-23 | The Penn State Research Foundation | System and method for automated speech recognition |
JP2016080827A (ja) * | 2014-10-15 | 2016-05-16 | ヤマハ株式会社 | 音韻情報合成装置および音声合成装置 |
JP6507579B2 (ja) * | 2014-11-10 | 2019-05-08 | ヤマハ株式会社 | 音声合成方法 |
JP5995226B2 (ja) * | 2014-11-27 | 2016-09-21 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 音響モデルを改善する方法、並びに、音響モデルを改善する為のコンピュータ及びそのコンピュータ・プログラム |
CN106531191A (zh) * | 2015-09-10 | 2017-03-22 | 百度在线网络技术(北京)有限公司 | 用于提供危险报告信息的方法和装置 |
CN106980624B (zh) * | 2016-01-18 | 2021-03-26 | 阿里巴巴集团控股有限公司 | 一种文本数据的处理方法和装置 |
EP3537432A4 (en) * | 2016-11-07 | 2020-06-03 | Yamaha Corporation | LANGUAGE SYNTHESIS PROCEDURE |
WO2018090356A1 (en) * | 2016-11-21 | 2018-05-24 | Microsoft Technology Licensing, Llc | Automatic dubbing method and apparatus |
US10872598B2 (en) * | 2017-02-24 | 2020-12-22 | Baidu Usa Llc | Systems and methods for real-time neural text-to-speech |
JP2018159759A (ja) * | 2017-03-22 | 2018-10-11 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
JP6646001B2 (ja) * | 2017-03-22 | 2020-02-14 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
US10818308B1 (en) * | 2017-04-28 | 2020-10-27 | Snap Inc. | Speech characteristic recognition and conversion |
US10896669B2 (en) | 2017-05-19 | 2021-01-19 | Baidu Usa Llc | Systems and methods for multi-speaker neural text-to-speech |
US10796686B2 (en) | 2017-10-19 | 2020-10-06 | Baidu Usa Llc | Systems and methods for neural text-to-speech using convolutional sequence learning |
US10872596B2 (en) | 2017-10-19 | 2020-12-22 | Baidu Usa Llc | Systems and methods for parallel wave generation in end-to-end text-to-speech |
US11017761B2 (en) | 2017-10-19 | 2021-05-25 | Baidu Usa Llc | Parallel neural text-to-speech |
KR102348124B1 (ko) * | 2017-11-07 | 2022-01-07 | 현대자동차주식회사 | 차량의 기능 추천 장치 및 방법 |
EP3739572A4 (en) * | 2018-01-11 | 2021-09-08 | Neosapience, Inc. | METHOD AND DEVICE FOR TEXT-TO-LANGUAGE SYNTHESIS USING MACHINE LEARNING AND COMPUTER-READABLE STORAGE MEDIUM |
JP6902485B2 (ja) * | 2018-02-20 | 2021-07-14 | 日本電信電話株式会社 | 音声信号解析装置、方法、及びプログラム |
US10981073B2 (en) * | 2018-10-22 | 2021-04-20 | Disney Enterprises, Inc. | Localized and standalone semi-randomized character conversations |
CN110136687B (zh) * | 2019-05-20 | 2021-06-15 | 深圳市数字星河科技有限公司 | 一种基于语音训练克隆口音及声韵方法 |
JP2022081790A (ja) * | 2020-11-20 | 2022-06-01 | 株式会社日立製作所 | 音声合成装置、音声合成方法、および音声合成プログラム |
US11948550B2 (en) * | 2021-05-06 | 2024-04-02 | Sanas.ai Inc. | Real-time accent conversion model |
CN113793598B (zh) * | 2021-09-15 | 2023-10-27 | 北京百度网讯科技有限公司 | 语音处理模型的训练方法和数据增强方法、装置及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002006900A (ja) * | 2000-06-27 | 2002-01-11 | Megafusion Corp | 音声還元再生システム及び音声還元再生方法 |
JP2002073064A (ja) * | 2000-08-28 | 2002-03-12 | Yamaha Corp | 音声処理装置、音声処理方法および情報記録媒体 |
JP2002268699A (ja) * | 2001-03-09 | 2002-09-20 | Sony Corp | 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体 |
JP2003084798A (ja) * | 2001-09-13 | 2003-03-19 | Yamaha Corp | 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム |
WO2006123539A1 (ja) * | 2005-05-18 | 2006-11-23 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置 |
WO2007010680A1 (ja) * | 2005-07-20 | 2007-01-25 | Matsushita Electric Industrial Co., Ltd. | 声質変化箇所特定装置 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3510588A (en) * | 1967-06-16 | 1970-05-05 | Santa Rita Technology Inc | Speech synthesis methods and apparatus |
JPS5331323B2 (ja) * | 1972-11-13 | 1978-09-01 | ||
JPH03174597A (ja) | 1989-12-04 | 1991-07-29 | Ricoh Co Ltd | 音声合成装置 |
JP3070127B2 (ja) * | 1991-05-07 | 2000-07-24 | 株式会社明電舎 | 音声合成装置のアクセント成分制御方式 |
US5748838A (en) * | 1991-09-24 | 1998-05-05 | Sensimetrics Corporation | Method of speech representation and synthesis using a set of high level constrained parameters |
US5559927A (en) * | 1992-08-19 | 1996-09-24 | Clynes; Manfred | Computer system producing emotionally-expressive speech messages |
JPH0772900A (ja) | 1993-09-02 | 1995-03-17 | Nippon Hoso Kyokai <Nhk> | 音声合成の感情付与方法 |
FR2717294B1 (fr) * | 1994-03-08 | 1996-05-10 | France Telecom | Procédé et dispositif de synthèse dynamique sonore musicale et vocale par distorsion non linéaire et modulation d'amplitude. |
JPH086591A (ja) * | 1994-06-15 | 1996-01-12 | Sony Corp | 音声出力装置 |
JP3910702B2 (ja) * | 1997-01-20 | 2007-04-25 | ローランド株式会社 | 波形発生装置 |
JPH10319947A (ja) * | 1997-05-15 | 1998-12-04 | Kawai Musical Instr Mfg Co Ltd | 音域制御装置 |
US6304846B1 (en) * | 1997-10-22 | 2001-10-16 | Texas Instruments Incorporated | Singing voice synthesis |
JP3502247B2 (ja) * | 1997-10-28 | 2004-03-02 | ヤマハ株式会社 | 音声変換装置 |
US6353671B1 (en) * | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
JP3587048B2 (ja) * | 1998-03-02 | 2004-11-10 | 株式会社日立製作所 | 韻律制御方法及び音声合成装置 |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
US6289310B1 (en) * | 1998-10-07 | 2001-09-11 | Scientific Learning Corp. | Apparatus for enhancing phoneme differences according to acoustic processing profile for language learning impaired subject |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
JP4651168B2 (ja) * | 2000-08-23 | 2011-03-16 | 任天堂株式会社 | 合成音声出力装置およびその方法並びに記録媒体 |
US7139699B2 (en) * | 2000-10-06 | 2006-11-21 | Silverman Stephen E | Method for analysis of vocal jitter for near-term suicidal risk assessment |
US6629076B1 (en) * | 2000-11-27 | 2003-09-30 | Carl Herman Haken | Method and device for aiding speech |
JP3703394B2 (ja) | 2001-01-16 | 2005-10-05 | シャープ株式会社 | 声質変換装置および声質変換方法およびプログラム記憶媒体 |
JP2002258886A (ja) * | 2001-03-02 | 2002-09-11 | Sony Corp | 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体 |
US20030093280A1 (en) * | 2001-07-13 | 2003-05-15 | Pierre-Yves Oudeyer | Method and apparatus for synthesising an emotion conveyed on a sound |
US7562018B2 (en) * | 2002-11-25 | 2009-07-14 | Panasonic Corporation | Speech synthesis method and speech synthesizer |
JP3706112B2 (ja) | 2003-03-12 | 2005-10-12 | 独立行政法人科学技術振興機構 | 音声合成装置及びコンピュータプログラム |
CN100550131C (zh) * | 2003-05-20 | 2009-10-14 | 松下电器产业株式会社 | 用于扩展音频信号的频带的方法及其装置 |
JP4177751B2 (ja) | 2003-12-25 | 2008-11-05 | 株式会社国際電気通信基礎技術研究所 | 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ |
US8023673B2 (en) * | 2004-09-28 | 2011-09-20 | Hearworks Pty. Limited | Pitch perception in an auditory prosthesis |
US7561709B2 (en) * | 2003-12-31 | 2009-07-14 | Hearworks Pty Limited | Modulation depth enhancement for tone perception |
JP4829477B2 (ja) | 2004-03-18 | 2011-12-07 | 日本電気株式会社 | 声質変換装置および声質変換方法ならびに声質変換プログラム |
JP3851328B2 (ja) | 2004-09-15 | 2006-11-29 | 独立行政法人科学技術振興機構 | 音声データの息漏れ領域自動検出装置および息漏れ領域自動検出プログラム |
JP4701684B2 (ja) | 2004-11-19 | 2011-06-15 | ヤマハ株式会社 | 音声処理装置およびプログラム |
JP2006227589A (ja) | 2005-01-20 | 2006-08-31 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
-
2008
- 2008-01-22 JP JP2009500111A patent/JP4355772B2/ja not_active Expired - Fee Related
- 2008-01-22 US US12/438,860 patent/US8898062B2/en not_active Expired - Fee Related
- 2008-01-22 WO PCT/JP2008/050815 patent/WO2008102594A1/ja active Application Filing
- 2008-01-22 CN CN2008800010519A patent/CN101606190B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002006900A (ja) * | 2000-06-27 | 2002-01-11 | Megafusion Corp | 音声還元再生システム及び音声還元再生方法 |
JP2002073064A (ja) * | 2000-08-28 | 2002-03-12 | Yamaha Corp | 音声処理装置、音声処理方法および情報記録媒体 |
JP2002268699A (ja) * | 2001-03-09 | 2002-09-20 | Sony Corp | 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体 |
JP2003084798A (ja) * | 2001-09-13 | 2003-03-19 | Yamaha Corp | 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム |
WO2006123539A1 (ja) * | 2005-05-18 | 2006-11-23 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置 |
WO2007010680A1 (ja) * | 2005-07-20 | 2007-01-25 | Matsushita Electric Industrial Co., Ltd. | 声質変化箇所特定装置 |
Non-Patent Citations (1)
Title |
---|
MURAKAMI K. ET AL.: "Onsei Gosei ni Okeru All-Pass Filter ni yoru Boon Teijobu no Yuragi Gosei", THE ACOUSTICAL SOCIETY OF JAPAN (ASJ) HEISEI 5 NEN SHUKI KENKYU HAPPYOKAI KOEN RONBUNSHU -I-, 5 October 1993 (1993-10-05), pages 607 - 608 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019086801A (ja) * | 2013-10-17 | 2019-06-06 | ヤマハ株式会社 | 音声処理方法および音声処理装置 |
JP2016186516A (ja) * | 2015-03-27 | 2016-10-27 | 日本電信電話株式会社 | 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム |
WO2021172439A1 (ja) * | 2020-02-27 | 2021-09-02 | パナソニックIpマネジメント株式会社 | 料理レシピ表示システム、料理レシピ表示方法、プログラム、および情報端末 |
JP2021135729A (ja) * | 2020-02-27 | 2021-09-13 | パナソニックIpマネジメント株式会社 | 料理レシピ表示システム、料理レシピの表示方法及びプログラム |
JPWO2022054414A1 (ja) * | 2020-09-08 | 2022-03-17 | ||
WO2022054414A1 (ja) * | 2020-09-08 | 2022-03-17 | パナソニックIpマネジメント株式会社 | 音信号処理システム、及び、音信号処理方法 |
JP7394411B2 (ja) | 2020-09-08 | 2023-12-08 | パナソニックIpマネジメント株式会社 | 音信号処理システム、及び、音信号処理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101606190B (zh) | 2012-01-18 |
JPWO2008102594A1 (ja) | 2010-05-27 |
CN101606190A (zh) | 2009-12-16 |
US8898062B2 (en) | 2014-11-25 |
US20090204395A1 (en) | 2009-08-13 |
JP4355772B2 (ja) | 2009-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2008102594A1 (ja) | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム | |
WO2004100638A3 (en) | Source-dependent text-to-speech system | |
ATE311650T1 (de) | Korrektur eines von einer spracherkennung erkannten textes mittels vergleich der phonemfolgen des erkannten textes mit einer phonetischen transkription eines manuell eingegebenen korrekturwortes | |
ATE297588T1 (de) | Anpassung des phonetischen kontextes zur verbesserung der spracherkennung | |
WO2011133766A3 (en) | Methods and systems for training dictation-based speech-to-text systems using recorded samples | |
WO2007103520A3 (en) | Codebook-less speech conversion method and system | |
ATE529854T1 (de) | Signalverarbeitungsverfahren, verarbeitungsvorrichtung und sprachdecodierer | |
EP1696421A3 (en) | Learning in automatic speech recognition | |
WO2009114499A3 (en) | Methods and devices for language skill development | |
WO2008073850A3 (en) | Method and apparatus for reading education | |
SG166067A1 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
WO2008038082A3 (en) | Prosody conversion | |
WO2006023631A3 (en) | Document transcription system training | |
ATE417346T1 (de) | Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen | |
TW200601263A (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
WO2003021374A3 (en) | Language-acquisition apparatus | |
EP4325723A3 (en) | Apparatus and method for generating time-domain audio samples | |
CN102664003A (zh) | 基于谐波加噪声模型的残差激励信号合成及语音转换方法 | |
ATE514162T1 (de) | Dynamische erzeugung von kontexten zur spracherkennung | |
ATE401644T1 (de) | Verfahren zur spracherkennung | |
WO2007112176A3 (en) | System and method for altering playback speed of recorded content | |
WO2020117639A3 (en) | Text independent speaker recognition | |
ATE502380T1 (de) | Verfahren, vorrichtung und programmcode zur umwandlung von stimmen | |
ATE441918T1 (de) | Sprachdialogverfahren und -system | |
WO2007030233A3 (en) | Speech dialog method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WWE | Wipo information: entry into national phase |
Ref document number: 200880001051.9 Country of ref document: CN |
|
DPE2 | Request for preliminary examination filed before expiration of 19th month from priority date (pct application filed from 20040101) | ||
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 08703659 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2009500111 Country of ref document: JP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 12438860 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 08703659 Country of ref document: EP Kind code of ref document: A1 |