WO2008102594A1 - 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム - Google Patents

力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム Download PDF

Info

Publication number
WO2008102594A1
WO2008102594A1 PCT/JP2008/050815 JP2008050815W WO2008102594A1 WO 2008102594 A1 WO2008102594 A1 WO 2008102594A1 JP 2008050815 W JP2008050815 W JP 2008050815W WO 2008102594 A1 WO2008102594 A1 WO 2008102594A1
Authority
WO
WIPO (PCT)
Prior art keywords
speech
converting
tense
tenseness
voice
Prior art date
Application number
PCT/JP2008/050815
Other languages
English (en)
French (fr)
Inventor
Yumiko Kato
Takahiro Kamai
Original Assignee
Panasonic Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corporation filed Critical Panasonic Corporation
Priority to US12/438,860 priority Critical patent/US8898062B2/en
Priority to CN2008800010519A priority patent/CN101606190B/zh
Priority to JP2009500111A priority patent/JP4355772B2/ja
Publication of WO2008102594A1 publication Critical patent/WO2008102594A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Stereophonic System (AREA)

Abstract

 興奮、緊張、怒りまたは強調のために力を入れて話すときの音声の一部に現れる「力み」音声を生成し、怒りや興奮、勢い込んだ話し方や元気のある話し方のような音声の表情を、声質の変化により豊かに表現することができる音声変換装置に含まれる力み変換部(10)は、音声中の「力み」音声で発声すべき部分を指定する力み音韻位置決定部(11)と、周期的な振幅変動を含む変調を音声波形に付与する振幅変調部(14)とを備え、振幅変調部(14)は、力み音韻位置決定部(11)の指定に従って「力み」音声で発声すべき部分に周期的な振幅変動を含む変調を付与して「力み」音声を生成し、興奮、緊張、怒りまたは強調のために力を入れて話す音声をリアルに、表情豊かに生成する。
PCT/JP2008/050815 2007-02-19 2008-01-22 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム WO2008102594A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US12/438,860 US8898062B2 (en) 2007-02-19 2008-01-22 Strained-rough-voice conversion device, voice conversion device, voice synthesis device, voice conversion method, voice synthesis method, and program
CN2008800010519A CN101606190B (zh) 2007-02-19 2008-01-22 用力声音转换装置、声音转换装置、声音合成装置、声音转换方法、声音合成方法
JP2009500111A JP4355772B2 (ja) 2007-02-19 2008-01-22 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007-038315 2007-02-19
JP2007038315 2007-02-19

Publications (1)

Publication Number Publication Date
WO2008102594A1 true WO2008102594A1 (ja) 2008-08-28

Family

ID=39709873

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/050815 WO2008102594A1 (ja) 2007-02-19 2008-01-22 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム

Country Status (4)

Country Link
US (1) US8898062B2 (ja)
JP (1) JP4355772B2 (ja)
CN (1) CN101606190B (ja)
WO (1) WO2008102594A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016186516A (ja) * 2015-03-27 2016-10-27 日本電信電話株式会社 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム
JP2019086801A (ja) * 2013-10-17 2019-06-06 ヤマハ株式会社 音声処理方法および音声処理装置
WO2021172439A1 (ja) * 2020-02-27 2021-09-02 パナソニックIpマネジメント株式会社 料理レシピ表示システム、料理レシピ表示方法、プログラム、および情報端末
JPWO2022054414A1 (ja) * 2020-09-08 2022-03-17

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5119700B2 (ja) * 2007-03-20 2013-01-16 富士通株式会社 韻律修正装置、韻律修正方法、および、韻律修正プログラム
CN101578659B (zh) * 2007-05-14 2012-01-18 松下电器产业株式会社 音质转换装置及音质转换方法
JP5582135B2 (ja) * 2009-02-18 2014-09-03 日本電気株式会社 動作対象制御装置、動作対象制御システム、動作対象制御方法及びプログラム
JP5625482B2 (ja) * 2010-05-21 2014-11-19 ヤマハ株式会社 音響処理装置、音処理システムおよび音処理方法
US10002608B2 (en) * 2010-09-17 2018-06-19 Nuance Communications, Inc. System and method for using prosody for voice-enabled search
US20140207456A1 (en) * 2010-09-23 2014-07-24 Waveform Communications, Llc Waveform analysis of speech
US20130030789A1 (en) * 2011-07-29 2013-01-31 Reginald Dalce Universal Language Translator
WO2013018294A1 (ja) * 2011-08-01 2013-02-07 パナソニック株式会社 音声合成装置および音声合成方法
CN105122351B (zh) * 2013-01-18 2018-11-13 株式会社东芝 声音合成装置及声音合成方法
JP6263868B2 (ja) * 2013-06-17 2018-01-24 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
US9310800B1 (en) * 2013-07-30 2016-04-12 The Boeing Company Robotic platform evaluation system
US9484036B2 (en) * 2013-08-28 2016-11-01 Nuance Communications, Inc. Method and apparatus for detecting synthesized speech
WO2015057661A1 (en) * 2013-10-14 2015-04-23 The Penn State Research Foundation System and method for automated speech recognition
JP2016080827A (ja) * 2014-10-15 2016-05-16 ヤマハ株式会社 音韻情報合成装置および音声合成装置
JP6507579B2 (ja) * 2014-11-10 2019-05-08 ヤマハ株式会社 音声合成方法
JP5995226B2 (ja) * 2014-11-27 2016-09-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 音響モデルを改善する方法、並びに、音響モデルを改善する為のコンピュータ及びそのコンピュータ・プログラム
CN106531191A (zh) * 2015-09-10 2017-03-22 百度在线网络技术(北京)有限公司 用于提供危险报告信息的方法和装置
CN106980624B (zh) * 2016-01-18 2021-03-26 阿里巴巴集团控股有限公司 一种文本数据的处理方法和装置
EP3537432A4 (en) * 2016-11-07 2020-06-03 Yamaha Corporation LANGUAGE SYNTHESIS PROCEDURE
WO2018090356A1 (en) * 2016-11-21 2018-05-24 Microsoft Technology Licensing, Llc Automatic dubbing method and apparatus
US10872598B2 (en) * 2017-02-24 2020-12-22 Baidu Usa Llc Systems and methods for real-time neural text-to-speech
JP2018159759A (ja) * 2017-03-22 2018-10-11 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP6646001B2 (ja) * 2017-03-22 2020-02-14 株式会社東芝 音声処理装置、音声処理方法およびプログラム
US10818308B1 (en) * 2017-04-28 2020-10-27 Snap Inc. Speech characteristic recognition and conversion
US10896669B2 (en) 2017-05-19 2021-01-19 Baidu Usa Llc Systems and methods for multi-speaker neural text-to-speech
US10796686B2 (en) 2017-10-19 2020-10-06 Baidu Usa Llc Systems and methods for neural text-to-speech using convolutional sequence learning
US10872596B2 (en) 2017-10-19 2020-12-22 Baidu Usa Llc Systems and methods for parallel wave generation in end-to-end text-to-speech
US11017761B2 (en) 2017-10-19 2021-05-25 Baidu Usa Llc Parallel neural text-to-speech
KR102348124B1 (ko) * 2017-11-07 2022-01-07 현대자동차주식회사 차량의 기능 추천 장치 및 방법
EP3739572A4 (en) * 2018-01-11 2021-09-08 Neosapience, Inc. METHOD AND DEVICE FOR TEXT-TO-LANGUAGE SYNTHESIS USING MACHINE LEARNING AND COMPUTER-READABLE STORAGE MEDIUM
JP6902485B2 (ja) * 2018-02-20 2021-07-14 日本電信電話株式会社 音声信号解析装置、方法、及びプログラム
US10981073B2 (en) * 2018-10-22 2021-04-20 Disney Enterprises, Inc. Localized and standalone semi-randomized character conversations
CN110136687B (zh) * 2019-05-20 2021-06-15 深圳市数字星河科技有限公司 一种基于语音训练克隆口音及声韵方法
JP2022081790A (ja) * 2020-11-20 2022-06-01 株式会社日立製作所 音声合成装置、音声合成方法、および音声合成プログラム
US11948550B2 (en) * 2021-05-06 2024-04-02 Sanas.ai Inc. Real-time accent conversion model
CN113793598B (zh) * 2021-09-15 2023-10-27 北京百度网讯科技有限公司 语音处理模型的训练方法和数据增强方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002006900A (ja) * 2000-06-27 2002-01-11 Megafusion Corp 音声還元再生システム及び音声還元再生方法
JP2002073064A (ja) * 2000-08-28 2002-03-12 Yamaha Corp 音声処理装置、音声処理方法および情報記録媒体
JP2002268699A (ja) * 2001-03-09 2002-09-20 Sony Corp 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
JP2003084798A (ja) * 2001-09-13 2003-03-19 Yamaha Corp 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム
WO2006123539A1 (ja) * 2005-05-18 2006-11-23 Matsushita Electric Industrial Co., Ltd. 音声合成装置
WO2007010680A1 (ja) * 2005-07-20 2007-01-25 Matsushita Electric Industrial Co., Ltd. 声質変化箇所特定装置

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3510588A (en) * 1967-06-16 1970-05-05 Santa Rita Technology Inc Speech synthesis methods and apparatus
JPS5331323B2 (ja) * 1972-11-13 1978-09-01
JPH03174597A (ja) 1989-12-04 1991-07-29 Ricoh Co Ltd 音声合成装置
JP3070127B2 (ja) * 1991-05-07 2000-07-24 株式会社明電舎 音声合成装置のアクセント成分制御方式
US5748838A (en) * 1991-09-24 1998-05-05 Sensimetrics Corporation Method of speech representation and synthesis using a set of high level constrained parameters
US5559927A (en) * 1992-08-19 1996-09-24 Clynes; Manfred Computer system producing emotionally-expressive speech messages
JPH0772900A (ja) 1993-09-02 1995-03-17 Nippon Hoso Kyokai <Nhk> 音声合成の感情付与方法
FR2717294B1 (fr) * 1994-03-08 1996-05-10 France Telecom Procédé et dispositif de synthèse dynamique sonore musicale et vocale par distorsion non linéaire et modulation d'amplitude.
JPH086591A (ja) * 1994-06-15 1996-01-12 Sony Corp 音声出力装置
JP3910702B2 (ja) * 1997-01-20 2007-04-25 ローランド株式会社 波形発生装置
JPH10319947A (ja) * 1997-05-15 1998-12-04 Kawai Musical Instr Mfg Co Ltd 音域制御装置
US6304846B1 (en) * 1997-10-22 2001-10-16 Texas Instruments Incorporated Singing voice synthesis
JP3502247B2 (ja) * 1997-10-28 2004-03-02 ヤマハ株式会社 音声変換装置
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
JP3587048B2 (ja) * 1998-03-02 2004-11-10 株式会社日立製作所 韻律制御方法及び音声合成装置
TW430778B (en) * 1998-06-15 2001-04-21 Yamaha Corp Voice converter with extraction and modification of attribute data
US6289310B1 (en) * 1998-10-07 2001-09-11 Scientific Learning Corp. Apparatus for enhancing phoneme differences according to acoustic processing profile for language learning impaired subject
US6865533B2 (en) * 2000-04-21 2005-03-08 Lessac Technology Inc. Text to speech
JP4651168B2 (ja) * 2000-08-23 2011-03-16 任天堂株式会社 合成音声出力装置およびその方法並びに記録媒体
US7139699B2 (en) * 2000-10-06 2006-11-21 Silverman Stephen E Method for analysis of vocal jitter for near-term suicidal risk assessment
US6629076B1 (en) * 2000-11-27 2003-09-30 Carl Herman Haken Method and device for aiding speech
JP3703394B2 (ja) 2001-01-16 2005-10-05 シャープ株式会社 声質変換装置および声質変換方法およびプログラム記憶媒体
JP2002258886A (ja) * 2001-03-02 2002-09-11 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
US20030093280A1 (en) * 2001-07-13 2003-05-15 Pierre-Yves Oudeyer Method and apparatus for synthesising an emotion conveyed on a sound
US7562018B2 (en) * 2002-11-25 2009-07-14 Panasonic Corporation Speech synthesis method and speech synthesizer
JP3706112B2 (ja) 2003-03-12 2005-10-12 独立行政法人科学技術振興機構 音声合成装置及びコンピュータプログラム
CN100550131C (zh) * 2003-05-20 2009-10-14 松下电器产业株式会社 用于扩展音频信号的频带的方法及其装置
JP4177751B2 (ja) 2003-12-25 2008-11-05 株式会社国際電気通信基礎技術研究所 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ
US8023673B2 (en) * 2004-09-28 2011-09-20 Hearworks Pty. Limited Pitch perception in an auditory prosthesis
US7561709B2 (en) * 2003-12-31 2009-07-14 Hearworks Pty Limited Modulation depth enhancement for tone perception
JP4829477B2 (ja) 2004-03-18 2011-12-07 日本電気株式会社 声質変換装置および声質変換方法ならびに声質変換プログラム
JP3851328B2 (ja) 2004-09-15 2006-11-29 独立行政法人科学技術振興機構 音声データの息漏れ領域自動検出装置および息漏れ領域自動検出プログラム
JP4701684B2 (ja) 2004-11-19 2011-06-15 ヤマハ株式会社 音声処理装置およびプログラム
JP2006227589A (ja) 2005-01-20 2006-08-31 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002006900A (ja) * 2000-06-27 2002-01-11 Megafusion Corp 音声還元再生システム及び音声還元再生方法
JP2002073064A (ja) * 2000-08-28 2002-03-12 Yamaha Corp 音声処理装置、音声処理方法および情報記録媒体
JP2002268699A (ja) * 2001-03-09 2002-09-20 Sony Corp 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
JP2003084798A (ja) * 2001-09-13 2003-03-19 Yamaha Corp 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム
WO2006123539A1 (ja) * 2005-05-18 2006-11-23 Matsushita Electric Industrial Co., Ltd. 音声合成装置
WO2007010680A1 (ja) * 2005-07-20 2007-01-25 Matsushita Electric Industrial Co., Ltd. 声質変化箇所特定装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MURAKAMI K. ET AL.: "Onsei Gosei ni Okeru All-Pass Filter ni yoru Boon Teijobu no Yuragi Gosei", THE ACOUSTICAL SOCIETY OF JAPAN (ASJ) HEISEI 5 NEN SHUKI KENKYU HAPPYOKAI KOEN RONBUNSHU -I-, 5 October 1993 (1993-10-05), pages 607 - 608 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019086801A (ja) * 2013-10-17 2019-06-06 ヤマハ株式会社 音声処理方法および音声処理装置
JP2016186516A (ja) * 2015-03-27 2016-10-27 日本電信電話株式会社 疑似音声信号生成装置、音響モデル適応装置、疑似音声信号生成方法、およびプログラム
WO2021172439A1 (ja) * 2020-02-27 2021-09-02 パナソニックIpマネジメント株式会社 料理レシピ表示システム、料理レシピ表示方法、プログラム、および情報端末
JP2021135729A (ja) * 2020-02-27 2021-09-13 パナソニックIpマネジメント株式会社 料理レシピ表示システム、料理レシピの表示方法及びプログラム
JPWO2022054414A1 (ja) * 2020-09-08 2022-03-17
WO2022054414A1 (ja) * 2020-09-08 2022-03-17 パナソニックIpマネジメント株式会社 音信号処理システム、及び、音信号処理方法
JP7394411B2 (ja) 2020-09-08 2023-12-08 パナソニックIpマネジメント株式会社 音信号処理システム、及び、音信号処理方法

Also Published As

Publication number Publication date
CN101606190B (zh) 2012-01-18
JPWO2008102594A1 (ja) 2010-05-27
CN101606190A (zh) 2009-12-16
US8898062B2 (en) 2014-11-25
US20090204395A1 (en) 2009-08-13
JP4355772B2 (ja) 2009-11-04

Similar Documents

Publication Publication Date Title
WO2008102594A1 (ja) 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム
WO2004100638A3 (en) Source-dependent text-to-speech system
ATE311650T1 (de) Korrektur eines von einer spracherkennung erkannten textes mittels vergleich der phonemfolgen des erkannten textes mit einer phonetischen transkription eines manuell eingegebenen korrekturwortes
ATE297588T1 (de) Anpassung des phonetischen kontextes zur verbesserung der spracherkennung
WO2011133766A3 (en) Methods and systems for training dictation-based speech-to-text systems using recorded samples
WO2007103520A3 (en) Codebook-less speech conversion method and system
ATE529854T1 (de) Signalverarbeitungsverfahren, verarbeitungsvorrichtung und sprachdecodierer
EP1696421A3 (en) Learning in automatic speech recognition
WO2009114499A3 (en) Methods and devices for language skill development
WO2008073850A3 (en) Method and apparatus for reading education
SG166067A1 (en) System and method for distributed text-to-speech synthesis and intelligibility
WO2008038082A3 (en) Prosody conversion
WO2006023631A3 (en) Document transcription system training
ATE417346T1 (de) Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen
TW200601263A (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
WO2003021374A3 (en) Language-acquisition apparatus
EP4325723A3 (en) Apparatus and method for generating time-domain audio samples
CN102664003A (zh) 基于谐波加噪声模型的残差激励信号合成及语音转换方法
ATE514162T1 (de) Dynamische erzeugung von kontexten zur spracherkennung
ATE401644T1 (de) Verfahren zur spracherkennung
WO2007112176A3 (en) System and method for altering playback speed of recorded content
WO2020117639A3 (en) Text independent speaker recognition
ATE502380T1 (de) Verfahren, vorrichtung und programmcode zur umwandlung von stimmen
ATE441918T1 (de) Sprachdialogverfahren und -system
WO2007030233A3 (en) Speech dialog method and device

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200880001051.9

Country of ref document: CN

DPE2 Request for preliminary examination filed before expiration of 19th month from priority date (pct application filed from 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08703659

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2009500111

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 12438860

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08703659

Country of ref document: EP

Kind code of ref document: A1