JP3314058B2 - 音声合成方法及び装置 - Google Patents
音声合成方法及び装置Info
- Publication number
- JP3314058B2 JP3314058B2 JP24314099A JP24314099A JP3314058B2 JP 3314058 B2 JP3314058 B2 JP 3314058B2 JP 24314099 A JP24314099 A JP 24314099A JP 24314099 A JP24314099 A JP 24314099A JP 3314058 B2 JP3314058 B2 JP 3314058B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- information
- accent
- control information
- mora
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【発明の属する技術分野】本発明は音声合成時の音声合
成方法及び装置に関するものである。
成方法及び装置に関するものである。
【0002】
【従来の技術】従来は、入力テキストからピッチを生成
する場合にアクセント型は頭高型、起伏型、平板型の3
種、アクセントの大きさは頭高型、起伏型に対しては3
つの大きさのアクセント、平板型に対しては、2つの大
きさのアクセントという様に、前もって定めてあるアク
セント型と、アクセント型によって定まる最大3つの大
きさのアクセントのみで入力テキストに対応するアクセ
ントがすべて決まっており、前もってアクセント情報と
しての辞書を記憶しているものがあった。
する場合にアクセント型は頭高型、起伏型、平板型の3
種、アクセントの大きさは頭高型、起伏型に対しては3
つの大きさのアクセント、平板型に対しては、2つの大
きさのアクセントという様に、前もって定めてあるアク
セント型と、アクセント型によって定まる最大3つの大
きさのアクセントのみで入力テキストに対応するアクセ
ントがすべて決まっており、前もってアクセント情報と
しての辞書を記憶しているものがあった。
【0003】また、入力されたテキストに対応するアク
セント情報の辞書を有さず、テキスト入力時にアクセン
ト情報を一緒に入力するものもあったが、沿うさが非常
に困難であった。
セント情報の辞書を有さず、テキスト入力時にアクセン
ト情報を一緒に入力するものもあったが、沿うさが非常
に困難であった。
【0004】
【発明が解決しようとする課題】従来の技術では、アク
セントの型も大きさ異も前もって定まったものであり、
テキスト入力時には変更ができず、入力テキストを見た
だけではアクセントの上昇、下降が分かり難かった。ま
た、日本本来のアクセントとは違う外来語等のアクセン
トは日本のアクセント型にはまっていない為生成しにく
いという問題があった。
セントの型も大きさ異も前もって定まったものであり、
テキスト入力時には変更ができず、入力テキストを見た
だけではアクセントの上昇、下降が分かり難かった。ま
た、日本本来のアクセントとは違う外来語等のアクセン
トは日本のアクセント型にはまっていない為生成しにく
いという問題があった。
【0005】
【課題を解決するための手段】本発明は以上の点に鑑み
てなされたものであり、その請求項1に記載の発明によ
れば、合成すべき音声の音韻系列に応じて、音声素片フ
ァイルに登録された音声素片の特徴パラメータを順次接
続することによって音声合成する音声合成方法であっ
て、入力された文字情報を構成する複数の音声素片の特
徴パラメータを前記音声素片ファイルより取り出し、該
音声素片ファイルより取り出された複数の音声素片に対
応するモーラ間に、アクセントを複数段階に上昇または
下降制御するためのアクセント制御情報を挿入すること
により、前記抽出したアクセント制御情報に従って、前
記複数の音声素片に対応するモーラ単位で、前記入力し
た文字情報の音声合成時のアクセントを複数段階に制御
可能とした音声合成方法を特徴とする。
てなされたものであり、その請求項1に記載の発明によ
れば、合成すべき音声の音韻系列に応じて、音声素片フ
ァイルに登録された音声素片の特徴パラメータを順次接
続することによって音声合成する音声合成方法であっ
て、入力された文字情報を構成する複数の音声素片の特
徴パラメータを前記音声素片ファイルより取り出し、該
音声素片ファイルより取り出された複数の音声素片に対
応するモーラ間に、アクセントを複数段階に上昇または
下降制御するためのアクセント制御情報を挿入すること
により、前記抽出したアクセント制御情報に従って、前
記複数の音声素片に対応するモーラ単位で、前記入力し
た文字情報の音声合成時のアクセントを複数段階に制御
可能とした音声合成方法を特徴とする。
【0006】また本願の請求項2に記載の発明によれ
ば、前記アクセント制御情報が、前記アクセントを上昇
させるための情報と、下降させるための情報とからな
り、前記モーラ間に挿入された該情報の数にしたがって
前記アクセントを複数段階に制御する。
ば、前記アクセント制御情報が、前記アクセントを上昇
させるための情報と、下降させるための情報とからな
り、前記モーラ間に挿入された該情報の数にしたがって
前記アクセントを複数段階に制御する。
【0007】また本願の請求項3に記載の発明によれ
ば、請求項2において、前記アクセントを上昇させるた
めの情報と、前記アクセントを下降させるための情報と
は、同一のモーラ間に挿入可能とした。
ば、請求項2において、前記アクセントを上昇させるた
めの情報と、前記アクセントを下降させるための情報と
は、同一のモーラ間に挿入可能とした。
【0008】また本願の請求項4に記載の発明によれ
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成方法であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、該音声
素片ファイルより取り出された複数の音声素片に対応す
るモーラ間に、音声合成時の発声速度を複数段階に加速
または減速制御するための発声速度制御情報を挿入する
ことにより、前記抽出した発声速度制御情報に従って、
前記複数の音声素片に対応するモーラ単位で、前記入力
した文字情報の音声合成時の発声速度を複数段階に制御
可能とした音声合成方法を特徴とする。
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成方法であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、該音声
素片ファイルより取り出された複数の音声素片に対応す
るモーラ間に、音声合成時の発声速度を複数段階に加速
または減速制御するための発声速度制御情報を挿入する
ことにより、前記抽出した発声速度制御情報に従って、
前記複数の音声素片に対応するモーラ単位で、前記入力
した文字情報の音声合成時の発声速度を複数段階に制御
可能とした音声合成方法を特徴とする。
【0009】また本願の請求項5に記載の発明によれ
ば、前記発声速度制御情報が、前記発声速度を加速させ
るための情報と、減速させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記発
声速度を複数段階に制御する。
ば、前記発声速度制御情報が、前記発声速度を加速させ
るための情報と、減速させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記発
声速度を複数段階に制御する。
【0010】また本願の請求項6に記載の発明によれ
ば、前記発声速度を加速させるための情報と、前記発声
速度を減速させるための情報は、同一のモーラ間に挿入
可能とした。
ば、前記発声速度を加速させるための情報と、前記発声
速度を減速させるための情報は、同一のモーラ間に挿入
可能とした。
【0011】また本願の請求項7に記載の発明によれ
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成装置であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、
該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報を挿入する手
段とを備えることにより、前記抽出したアクセント制御
情報に従って、前記複数の音声素片に対応するモーラ単
位で、前記入力された文字情報の音声合成時のアクセン
トを複数段階に制御可能とした音声合成装置を特徴とす
る。
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成装置であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、
該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報を挿入する手
段とを備えることにより、前記抽出したアクセント制御
情報に従って、前記複数の音声素片に対応するモーラ単
位で、前記入力された文字情報の音声合成時のアクセン
トを複数段階に制御可能とした音声合成装置を特徴とす
る。
【0012】本願の請求項8に記載の発明によれば、前
記アクセント制御情報は、前記アクセントを上昇させる
ための情報と、下降させるための情報とからなり、前記
モーラ間に挿入された該情報の数にしたがって前記アク
セントを複数段階に制御する。
記アクセント制御情報は、前記アクセントを上昇させる
ための情報と、下降させるための情報とからなり、前記
モーラ間に挿入された該情報の数にしたがって前記アク
セントを複数段階に制御する。
【0013】また本願の請求項9に記載の発明によれ
ば、前記アクセントを上昇させるための情報と、前記ア
クセントを下降させるための情報は、同一のモーラ間に
挿入可能とした。
ば、前記アクセントを上昇させるための情報と、前記ア
クセントを下降させるための情報は、同一のモーラ間に
挿入可能とした。
【0014】また本願の請求項10に記載の発明によれ
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成装置であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、
該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、音声合成時の発声速度を複数段階
に加速または減速制御するための発声速度制御情報を挿
入する手段とを備えることにより、前記抽出した発声速
度制御情報に従って、前記複数の音声素片に対応するモ
ーラ単位で、前記入力した文字情報の音声合成時の発声
速度を複数段階に制御可能とした音声合成装置を特徴と
する。
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成装置であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、
該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、音声合成時の発声速度を複数段階
に加速または減速制御するための発声速度制御情報を挿
入する手段とを備えることにより、前記抽出した発声速
度制御情報に従って、前記複数の音声素片に対応するモ
ーラ単位で、前記入力した文字情報の音声合成時の発声
速度を複数段階に制御可能とした音声合成装置を特徴と
する。
【0015】また請求項11に記載の発明によれば、前
記発声速度制御情報が、前記発声速度を加速させるため
の情報と、減速させるための情報とからなり、前記モー
ラ間に挿入された該情報の数にしたがって前記発声速度
を複数段階に制御する。
記発声速度制御情報が、前記発声速度を加速させるため
の情報と、減速させるための情報とからなり、前記モー
ラ間に挿入された該情報の数にしたがって前記発声速度
を複数段階に制御する。
【0016】また請求項12に記載の発明によれば、前
記発声速度を加速させるための情報と、前記発声速度を
減速させるための情報は、同一のモーラ間に挿入可能と
した。
記発声速度を加速させるための情報と、前記発声速度を
減速させるための情報は、同一のモーラ間に挿入可能と
した。
【0017】また本願の請求項13に記載の発明によれ
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成方法であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、該音声
素片ファイルより取り出された複数の音声素片に対応す
るモーラ間に、アクセントを複数段階に上昇または下降
制御するためのアクセント制御情報と、発声速度を複数
段階に加速または減速制御するための発声速度制御情報
とを挿入することにより、前記抽出したアクセント制御
情報及び発声速度制御情報に従って、前記複数の音声素
片に対応するモーラ単位で、前記入力された文字情報の
音声合成時のアクセント及び発声速度を複数段階に制御
可能とした音声合成方法を特徴とする。
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成方法であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、該音声
素片ファイルより取り出された複数の音声素片に対応す
るモーラ間に、アクセントを複数段階に上昇または下降
制御するためのアクセント制御情報と、発声速度を複数
段階に加速または減速制御するための発声速度制御情報
とを挿入することにより、前記抽出したアクセント制御
情報及び発声速度制御情報に従って、前記複数の音声素
片に対応するモーラ単位で、前記入力された文字情報の
音声合成時のアクセント及び発声速度を複数段階に制御
可能とした音声合成方法を特徴とする。
【0018】また本願の請求項14に記載の発明によれ
ば、前記アクセント制御情報は、前記アクセントを上昇
させるための情報と、下降させるための情報とからな
り、前記モーラ間に挿入された該情報の数にしたがって
前記アクセントを複数段階に制御し、前記発声速度制御
情報は、前記発声速度を加速させるための情報と、減速
させるための情報とからなり、前記モーラ間に挿入され
た該情報の数にしたがって前記発声速度を複数段階に制
御する。
ば、前記アクセント制御情報は、前記アクセントを上昇
させるための情報と、下降させるための情報とからな
り、前記モーラ間に挿入された該情報の数にしたがって
前記アクセントを複数段階に制御し、前記発声速度制御
情報は、前記発声速度を加速させるための情報と、減速
させるための情報とからなり、前記モーラ間に挿入され
た該情報の数にしたがって前記発声速度を複数段階に制
御する。
【0019】また本願の請求項15に記載の発明によれ
ば、前記アクセントを上昇または下降させるための情報
と、前記発生速度を加速または減速するための制御情報
とは、同一のモーラ間にそれぞれ複数個挿入可能である
ことを特徴とする。
ば、前記アクセントを上昇または下降させるための情報
と、前記発生速度を加速または減速するための制御情報
とは、同一のモーラ間にそれぞれ複数個挿入可能である
ことを特徴とする。
【0020】また本願の請求項16に記載の発明によれ
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成方法であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、
該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報と、発声速度
を複数段階に加速または減速制御するための発声速度制
御情報とを挿入する手段とを備えることにより、前記抽
出したアクセント制御情報及び発声速度制御情報に従っ
て、前記複数の音声素片に対応するモーラ単位で、前記
入力された文字情報の音声合成時のアクセント及び発声
速度を複数段階に制御可能とした音声合成装置を特徴と
する。
ば、合成すべき音声の音韻系列に応じて、音声素片ファ
イルに登録された音声素片の特徴パラメータを順次接続
することによって音声合成する音声合成方法であって、
入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、
該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報と、発声速度
を複数段階に加速または減速制御するための発声速度制
御情報とを挿入する手段とを備えることにより、前記抽
出したアクセント制御情報及び発声速度制御情報に従っ
て、前記複数の音声素片に対応するモーラ単位で、前記
入力された文字情報の音声合成時のアクセント及び発声
速度を複数段階に制御可能とした音声合成装置を特徴と
する。
【0021】本願の請求項17に記載の発明によれば、
前記アクセント制御情報は、前記アクセントを上昇させ
るための情報と、下降させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記ア
クセントを複数段階に制御し、前記発声速度制御情報
は、前記発声速度を加速させるための情報と、減速させ
るための情報とからなり、前記モーラ間に挿入された該
情報の数にしたがって前記発声速度を複数段階に制御す
る。
前記アクセント制御情報は、前記アクセントを上昇させ
るための情報と、下降させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記ア
クセントを複数段階に制御し、前記発声速度制御情報
は、前記発声速度を加速させるための情報と、減速させ
るための情報とからなり、前記モーラ間に挿入された該
情報の数にしたがって前記発声速度を複数段階に制御す
る。
【0022】本願の請求項18に記載の発明によれば、
前記アクセントを上昇または下降させるための情報と、
前記発生速度を加速または減速するための制御情報と
を、同一のモーラ間にそれぞれ複数個挿入可能とした。
前記アクセントを上昇または下降させるための情報と、
前記発生速度を加速または減速するための制御情報と
を、同一のモーラ間にそれぞれ複数個挿入可能とした。
【0023】
【発明の実施の形態】本実施形態では、文字列データの
情報により、音声素片のファイルに登録された音声素片
の特徴パラメータ(LPC,PARCOR,LSP,メ
ルケプストラムなど。以下単にパラメータと呼ぶことに
する)を取り出し、一定の規則に基いてパラメータと駆
動音源信号(有声音声区間ではインパルス列、無声音声
区間ではノイズ)を合成音声の発声速度に応じて伸縮さ
せて結合し、音声合成器に与えることにより合成音声を
得ている音声合成方式において、アクセントと発声速度
を所望の状態に指示する方式について説明する。
情報により、音声素片のファイルに登録された音声素片
の特徴パラメータ(LPC,PARCOR,LSP,メ
ルケプストラムなど。以下単にパラメータと呼ぶことに
する)を取り出し、一定の規則に基いてパラメータと駆
動音源信号(有声音声区間ではインパルス列、無声音声
区間ではノイズ)を合成音声の発声速度に応じて伸縮さ
せて結合し、音声合成器に与えることにより合成音声を
得ている音声合成方式において、アクセントと発声速度
を所望の状態に指示する方式について説明する。
【0024】図1は本実施例の構成を示すブロック図で
あり、1は入力テキスト解析部、2はパラメータ接続
部、3はピッチ生成部、4は音声信号生成部である。ロ
ーマ字とコントロール文字から成る入力テキストは、1
の入力テキスト解析部でVcV(音声素片)単位で切り
出され、2のパラメータ接続部でVcVパラメータ(ケ
プストラム方式で蓄積されている)伸縮接続され、音声
パラメータとなり、3のピッチ生成部でピッチパタンが
付加されて、4の音声信号生成部に送られて音声出力さ
れる。
あり、1は入力テキスト解析部、2はパラメータ接続
部、3はピッチ生成部、4は音声信号生成部である。ロ
ーマ字とコントロール文字から成る入力テキストは、1
の入力テキスト解析部でVcV(音声素片)単位で切り
出され、2のパラメータ接続部でVcVパラメータ(ケ
プストラム方式で蓄積されている)伸縮接続され、音声
パラメータとなり、3のピッチ生成部でピッチパタンが
付加されて、4の音声信号生成部に送られて音声出力さ
れる。
【0025】図2は1の入力テキスト解析部の詳しい説
明部であり、入力テキストは文字種判別部11で文字種
の判別が行われ、モーラ区切り文字(母音、撥音、長
音、促音)ならば、VcV番号取り出し部13におい
て、VcV番号からVcV素片のパラメータを呼び出せ
る様に記憶してあるVcVテーブルをアクセスし、入力
テキスト解析出力データにVcV番号をセットし、Vc
V番号取り出し部13で取り出したVcV番号に対し
て、VcV型設定部14でVcV型(有声/無声、長音
/促音、無音、語頭/語尾、連母音、文末)をセット
し、仮定拍同期点振り付け部15で仮定拍同期点をセッ
トし、フレーズ設定部17でフレーズ(息継ぎ)をセッ
トする。
明部であり、入力テキストは文字種判別部11で文字種
の判別が行われ、モーラ区切り文字(母音、撥音、長
音、促音)ならば、VcV番号取り出し部13におい
て、VcV番号からVcV素片のパラメータを呼び出せ
る様に記憶してあるVcVテーブルをアクセスし、入力
テキスト解析出力データにVcV番号をセットし、Vc
V番号取り出し部13で取り出したVcV番号に対し
て、VcV型設定部14でVcV型(有声/無声、長音
/促音、無音、語頭/語尾、連母音、文末)をセット
し、仮定拍同期点振り付け部15で仮定拍同期点をセッ
トし、フレーズ設定部17でフレーズ(息継ぎ)をセッ
トする。
【0026】本発明は、1の入力解析部においての、ア
クセントと仮定拍同期点のセットに関するものである。
アクセントと仮定拍同期点は各モーラごとにセットされ
てピッチ生成部3に送られる。入力テキストでアクセン
トをセットする場合には、例えば東京方言の場合には、
「橋」を“HA/SHI”、「箸」を“/HA¥SH
I”と記述して入力する。アクセントのコントロールは
コントロール文字“/”と“¥”によって行われ、
“/”によってアクセントは1単位上昇し、“¥”によ
ってアクセントは1単位下降する。“//”ではアクセ
ントは2単位上昇し、し、“//¥”や“/¥/”では
アクセントは1単位上昇する。
クセントと仮定拍同期点のセットに関するものである。
アクセントと仮定拍同期点は各モーラごとにセットされ
てピッチ生成部3に送られる。入力テキストでアクセン
トをセットする場合には、例えば東京方言の場合には、
「橋」を“HA/SHI”、「箸」を“/HA¥SH
I”と記述して入力する。アクセントのコントロールは
コントロール文字“/”と“¥”によって行われ、
“/”によってアクセントは1単位上昇し、“¥”によ
ってアクセントは1単位下降する。“//”ではアクセ
ントは2単位上昇し、し、“//¥”や“/¥/”では
アクセントは1単位上昇する。
【0027】図3はアクセントセットのフローチャート
である。
である。
【0028】まず、モーラ番号とアクセントが初期化さ
れ(S31)、入力テキストから1文字づつ読み込んで
(S32)、文字種の判別が行われ(S33)、入力文
字がアクセントコントロール記号ならばアクセント上昇
記号かアクセント下降記号か判別され(S34)、アク
セント上昇記号ならばアクセントを1単位上昇させ(S
36)、アクセント下降記号ならばアクセントを1単位
下降させる(S37)。入力文字がアクセントコントロ
ール記号でないと判別されたならば(S33)文末かど
うかが判別され(S35)、文末ならば終了し、文末で
なければアクセントをVcVデータにセットする(S3
8)。
れ(S31)、入力テキストから1文字づつ読み込んで
(S32)、文字種の判別が行われ(S33)、入力文
字がアクセントコントロール記号ならばアクセント上昇
記号かアクセント下降記号か判別され(S34)、アク
セント上昇記号ならばアクセントを1単位上昇させ(S
36)、アクセント下降記号ならばアクセントを1単位
下降させる(S37)。入力文字がアクセントコントロ
ール記号でないと判別されたならば(S33)文末かど
うかが判別され(S35)、文末ならば終了し、文末で
なければアクセントをVcVデータにセットする(S3
8)。
【0029】次に入力テキストで、“KO//RE¥W
A¥//PE¥N¥/DE¥SU/KA/.”と入力さ
れたときの、入力テキスト解析部の出力を示す。図3で
示したフローチャートに従って処理手順を説明する。ま
ずアクセントが0に初期化される(S31)。
A¥//PE¥N¥/DE¥SU/KA/.”と入力さ
れたときの、入力テキスト解析部の出力を示す。図3で
示したフローチャートに従って処理手順を説明する。ま
ずアクセントが0に初期化される(S31)。
【0030】次に文字“K”が入力され(S32)文字
種判別部11で文字種が判別され(S33)、“K”は
コントロール記号ではなくモーラ区切り文字でもないの
でVcVバッファにプッシュされる。次に文字“O”は
コントロール文字でなくモーラ区切り文字なのでVcV
バッファにプッシュされて、VcVバッファ内の文字列
“KO”をキーとしてVcV番号取り出し部13にはV
cVテーブル12をアクセスしてVcV番号が取得され
(S38)、“KO”に対する入力テキスト解析出力デ
ータに、アクセントの値0がセットされ、VcVバッフ
ァがクリアされてVcVバッファに“0”がプッシュさ
れる(S31)。
種判別部11で文字種が判別され(S33)、“K”は
コントロール記号ではなくモーラ区切り文字でもないの
でVcVバッファにプッシュされる。次に文字“O”は
コントロール文字でなくモーラ区切り文字なのでVcV
バッファにプッシュされて、VcVバッファ内の文字列
“KO”をキーとしてVcV番号取り出し部13にはV
cVテーブル12をアクセスしてVcV番号が取得され
(S38)、“KO”に対する入力テキスト解析出力デ
ータに、アクセントの値0がセットされ、VcVバッフ
ァがクリアされてVcVバッファに“0”がプッシュさ
れる(S31)。
【0031】次に文字“/”が入力されて文字種が判別
され(S33)、“/”はアクセントを上昇させるコン
トロール文字なので(S34)アクセントの値に1が加
えられ(S36)、更に文字“/”が入力されてアクセ
ントの値に1が加えられ(S36)、アクセントの値は
2になる。
され(S33)、“/”はアクセントを上昇させるコン
トロール文字なので(S34)アクセントの値に1が加
えられ(S36)、更に文字“/”が入力されてアクセ
ントの値に1が加えられ(S36)、アクセントの値は
2になる。
【0032】次に“R”が入力されて文字種が判別され
てVcVバッファにプッシュされる。
てVcVバッファにプッシュされる。
【0033】次に“E”が入力されて文字種が判別され
“E”はローマ字で区切り文字なのでVcVバッファに
プッシュされてVcVバッファ内の文字列“ORE”を
キーとしてVcVテーブルをアクセスしてVcV番号が
取得され、“ORE”に対する入力テキスト解析出力デ
ータにアクセント値2と共にセットされ(S38)、V
cVバッファがクリアされてVcVバッファに“E”が
プッシュされる。
“E”はローマ字で区切り文字なのでVcVバッファに
プッシュされてVcVバッファ内の文字列“ORE”を
キーとしてVcVテーブルをアクセスしてVcV番号が
取得され、“ORE”に対する入力テキスト解析出力デ
ータにアクセント値2と共にセットされ(S38)、V
cVバッファがクリアされてVcVバッファに“E”が
プッシュされる。
【0034】次に文字“¥”が入力されて(S32)文
字種が判別され(S33)、“¥"はアクセントを下降
させるコントロール文字なので(S34)アクセントの
値から1が引かれ(S37)アクセントの値は1にな
る。以下同様の処理が行われて、”EWA“の入力テキ
スト解析出力データのアクセント値は1がセットされ
る。スペース(n+1)個をnモーラとしてカウントす
ると、”KO/RE¥WA¥ //PEN¥N¥ /D
E¥SU/KA.“という入力は、 “KO”+“ORE”+“EWA”+“A”+“PE”
+“EN”+“NDE”+“ESU”+“UKA”+
“A” のようにモーラ分解され、各モーラのアクセントの値は
()内の値にセットされて、 “KO(0)”+“ORE(2)”+“EWA(1)”
+“A(0)”+“PE(2)”+“EN(1)”+
“NDE(1)”+“ESU(0)”+“UKA
(1)”+“A(2)” のようになり、3のピッチ生成部に送られて図5に示す
ようなアクセント成分が生成される。
字種が判別され(S33)、“¥"はアクセントを下降
させるコントロール文字なので(S34)アクセントの
値から1が引かれ(S37)アクセントの値は1にな
る。以下同様の処理が行われて、”EWA“の入力テキ
スト解析出力データのアクセント値は1がセットされ
る。スペース(n+1)個をnモーラとしてカウントす
ると、”KO/RE¥WA¥ //PEN¥N¥ /D
E¥SU/KA.“という入力は、 “KO”+“ORE”+“EWA”+“A”+“PE”
+“EN”+“NDE”+“ESU”+“UKA”+
“A” のようにモーラ分解され、各モーラのアクセントの値は
()内の値にセットされて、 “KO(0)”+“ORE(2)”+“EWA(1)”
+“A(0)”+“PE(2)”+“EN(1)”+
“NDE(1)”+“ESU(0)”+“UKA
(1)”+“A(2)” のようになり、3のピッチ生成部に送られて図5に示す
ようなアクセント成分が生成される。
【0035】図4は発声速度をセットするフローチャー
トである。
トである。
【0036】モーラ間隔と発声速度のコントロールはア
クセントのコントロールと同様に、コントロール文字
“−”と“+”によって行われ、“−”によって拍同期
点間隔から1が引かれて発声速度が加速され“+”によ
って拍同期点間隔に1が加えられて発声速度が減速され
る。
クセントのコントロールと同様に、コントロール文字
“−”と“+”によって行われ、“−”によって拍同期
点間隔から1が引かれて発声速度が加速され“+”によ
って拍同期点間隔に1が加えられて発声速度が減速され
る。
【0037】入力テキスト解析部1に入力された文字列
はモーラ単位で切り出され、各モーラに拍同期点と拍同
期点間隔が付加されてセットされ、パラメータ接続部2
とピッチ生成部3に送られる。
はモーラ単位で切り出され、各モーラに拍同期点と拍同
期点間隔が付加されてセットされ、パラメータ接続部2
とピッチ生成部3に送られる。
【0038】まず、拍同期点が0(msec)に、拍同
期点間隔が16(160msec)に初期化される。
期点間隔が16(160msec)に初期化される。
【0039】今、“A+IU−−E−0.”と入力され
たとすると、モーラ単位に切り出され、発生速度のコン
トロールコードにより変化される前の基準となる仮定拍
同期点の位置([ ]で囲んで示す)が付加されて、次の
入力テキスト解析出力データが作成される。 “A[16]”+“AI[33]”+“IU[50]”
+“UE[65]”+“EO[79]”+“O[9
4]”
たとすると、モーラ単位に切り出され、発生速度のコン
トロールコードにより変化される前の基準となる仮定拍
同期点の位置([ ]で囲んで示す)が付加されて、次の
入力テキスト解析出力データが作成される。 “A[16]”+“AI[33]”+“IU[50]”
+“UE[65]”+“EO[79]”+“O[9
4]”
【0040】図4に示した発声速度(モーラ間隔)セット
のフローチャートに従って動作を説明する。
のフローチャートに従って動作を説明する。
【0041】まず、拍同期点を0(msec)に、仮の
拍同期点を16(160msec)に初期化する(S4
1)。ローマ字とコントロール文字からなるテキストが
入力され(S42)、文字種判別部11に入力テキスト
から1文字づつ読み込んで文字種の判別が行われる(S
43)。入力文字がモーラ間隔コントロール記号である
ならば(S43)、減速記号であるか加速記号であるか
判別する(S44)。減速記号であるならば、拍同期点
間隔を1単位増加させ(S46)、加速記号であるなら
ば、拍同期点間隔を1単位減少させる(S47)。拍同
期点間隔を変更したら(S46、S47)、次の1文字
を入力テキストから文字種判別部11に読み込む(S4
2)。S43において文字種がモーラ間隔コントロール
記号でないと判断されたならば、文末であるかどうか判
断し(S45)、文末でないならば(S45)仮定拍同
期点間隔を変更せずにVcVデータにセットする(S4
8)。S45で文末であると判断されたならば、終了す
る。
拍同期点を16(160msec)に初期化する(S4
1)。ローマ字とコントロール文字からなるテキストが
入力され(S42)、文字種判別部11に入力テキスト
から1文字づつ読み込んで文字種の判別が行われる(S
43)。入力文字がモーラ間隔コントロール記号である
ならば(S43)、減速記号であるか加速記号であるか
判別する(S44)。減速記号であるならば、拍同期点
間隔を1単位増加させ(S46)、加速記号であるなら
ば、拍同期点間隔を1単位減少させる(S47)。拍同
期点間隔を変更したら(S46、S47)、次の1文字
を入力テキストから文字種判別部11に読み込む(S4
2)。S43において文字種がモーラ間隔コントロール
記号でないと判断されたならば、文末であるかどうか判
断し(S45)、文末でないならば(S45)仮定拍同
期点間隔を変更せずにVcVデータにセットする(S4
8)。S45で文末であると判断されたならば、終了す
る。
【0042】この、発声速度セットの処理において拍同
期点間隔が変更された場合、それに伴って前記した仮定
拍同期点の位置も変化する。
期点間隔が変更された場合、それに伴って前記した仮定
拍同期点の位置も変化する。
【0043】これらのアクセント、速度変更処理は、C
PU(中央制御装置)にて行われる。
PU(中央制御装置)にて行われる。
【0044】
【発明の効果】以上述べたように、本発明によれば、入
力された文字情報を構成する複数の音声素片に対応する
モーラ間に、アクセント及び/または発声速度を複数段
階に制御可能な制御情報を挿入したので、入力文字情報
の音声合成時、アクセント及び/または発声速度を、モ
ーラ単位で且つ複数段階に容易に変更することの可能な
音声合成方法及び装置を提供することができる。
力された文字情報を構成する複数の音声素片に対応する
モーラ間に、アクセント及び/または発声速度を複数段
階に制御可能な制御情報を挿入したので、入力文字情報
の音声合成時、アクセント及び/または発声速度を、モ
ーラ単位で且つ複数段階に容易に変更することの可能な
音声合成方法及び装置を提供することができる。
【図1】本実施例の構成を示すブロック図である。
【図2】図1における入力テキスト解析部1の詳しい説
明図である。
明図である。
【図3】アクセントセットのフローチャートである。
【図4】発声速度(モーラ間隔)セットのフローチャー
トである。
トである。
【図5】本発明の一例を説明するためのアクセント成分
を示す図である。
を示す図である。
1 入力テキスト解析部 2 パラメータ接続部 3 ピッチ生成部 4 音声信号生成部 11 文字種判別部 12 VcVテーブル 13 VcV番号取り出し部 14 VcV型設定部 15 仮定拍同期点振り付け部 16 アクセント設定部 17 フレーズ設定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 麻生 隆 東京都大田区下丸子3丁目30番2号キヤ ノン株式会社内 (56)参考文献 特開 昭61−70597(JP,A) 特開 昭57−93441(JP,A) 特開 平2−195397(JP,A) 特開 平3−203799(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/06 - 13/08
Claims (18)
- 【請求項1】 合成すべき音声の音韻系列に応じて、音
声素片ファイルに登録された音声素片の特徴パラメータ
を順次接続することによって音声合成する音声合成方法
であって、 入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、 該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報を挿 入することにより、前記抽出したアクセント制御情報に
従って、前記複数の音声素片に対応するモーラ単位で、
前記入力された文字情報の音声合成時のアクセントを複
数段階に制御可能としたことを特徴とする音声合成方
法。 - 【請求項2】 請求項1において、 前記アクセント制御情報は、前記アクセントを上昇させ
るための情報と、下降させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記ア
クセントを複数段階に制御することを特徴とする音声合
成方法。 - 【請求項3】 請求項2において、 前記アクセントを上昇させるための情報と、前記アクセ
ントを下降させるための情報は、同一のモーラ間に挿入
可能であることを特徴とする音声合成方法。 - 【請求項4】 合成すべき音声の音韻系列に応じて、音
声素片ファイルに登録された音声素片の特徴パラメータ
を順次接続することによって音声合成する音声合成方法
であって、 入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、 該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、音声合成時の発声速度を複数段階
に加速または減速制御するための発声速度制御情報を挿
入することにより、 前記抽出した発声速度制御情報に従って、前記複数の音
声素片に対応するモーラ単位で、前記入力された文字情
報の音声合成時の発声速度を複数段階に制御可能とした
ことを特徴とする音声合成方法。 - 【請求項5】 請求項4において、 前記発声速度制御情報は、前記発声速度を加速させるた
めの情報と、減速させるための情報とからなり、前記モ
ーラ間に挿入された該情報の数にしたがって前記発声速
度を複数段階に制御することを特徴とする音声合成方
法。 - 【請求項6】 請求項5において、 前記発声速度を加速させるための情報と、前記発声速度
を減速させるための情報は、同一のモーラ間に挿入可能
であることを特徴とする音声合成方法。 - 【請求項7】 合成すべき音声の音韻系列に応じて、音
声素片ファイルに登録された音声素片の特徴パラメータ
を順次接続することによって音声合成する音声合成装置
であって、 入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、 該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報を挿入する手
段とを備えることにより、 前記抽出したアクセント制御情報に従って、前記複数の
音声素片に対応するモーラ単位で、前記入力された文字
情報の音声合成時のアクセントを複数段階に制御可能と
したことを特徴とする音声合成装置。 - 【請求項8】 請求項7において、 前記アクセント制御情報は、前記アクセントを上昇させ
るための情報と、下降させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記ア
クセントを複数段階に制御することを特徴とする音声合
成装置。 - 【請求項9】 請求項8において、 前記アクセントを上昇させるための情報と、前記アクセ
ントを下降させるための情報は、同一のモーラ間に挿入
可能であることを特徴とする音声合成装置。 - 【請求項10】 合成すべき音声の音韻系列に応じて、
音声素片ファイルに登録された音声素片の特徴パラメー
タを順次接続することによって音声合成する音声合成装
置であって、 入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、 該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、音声合成時の発声速度を複数段階
に加速または減速制御するための発声速度制御情報を挿
入する手段とを備えることにより、 前記抽出した発声速度制御情報に従って、前記複数の音
声素片に対応するモーラ単位で、前記入力された文字情
報の音声合成時の発声速度を複数段階に制御可能とした
ことを特徴とする音声合成装置。 - 【請求項11】 請求項10において、 前記発声速度制御情報は、前記発声速度を加速させるた
めの情報と、減速させるための情報とからなり、前記モ
ーラ間に挿入された該情報の数にしたがって前記発声速
度を複数段階に制御することを特徴とする音声合成装
置。 - 【請求項12】 請求項11において、 前記発声速度を加速させるための情報と、前記発声速度
を減速させるための情報は、同一のモーラ間に挿入可能
であることを特徴とする音声合成装置。 - 【請求項13】 合成すべき音声の音韻系列に応じて、
音声素片ファイルに登録された音声素片の特徴パラメー
タを順次接続することによって音声合成する音声合成方
法であって、 入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出し、 該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報と、発声速度
を複数段階に加速または減速制御するための発声速度制
御情報とを挿入することにより、 前記抽出したアクセント制御情報及び発声速度制御情報
に従って、前記複数の音声素片に対応するモーラ単位
で、前記入力された文字情報の音声合成時のアクセント
及び発声速度を複数段階に制御可能としたことを特徴と
する音声合成方法。 - 【請求項14】 請求項13において、 前記アクセント制御情報は、前記アクセントを上昇させ
るための情報と、下降させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記ア
クセントを複数段階に制御し、 前記発声速度制御情報は、前記発声速度を加速させるた
めの情報と、減速させるための情報とからなり、前記モ
ーラ間に挿入された該情報の数にしたがって前記発声速
度を複数段階に制御することを特徴とする音声合成方
法。 - 【請求項15】 請求項14において、 前記アクセントを上昇または下降させるための情報と、
前記発生速度を加速または減速するための制御情報と
は、同一のモーラ間にそれぞれ複数個挿入可能であるこ
とを特徴とする音声合成方法。 - 【請求項16】 合成すべき音声の音韻系列に応じて、
音声素片ファイルに登録された音声素片の特徴パラメー
タを順次接続することによって音声合成する音声合成方
法であって、 入力された文字情報を構成する複数の音声素片の特徴パ
ラメータを前記音声素片ファイルより取り出す手段と、 該音声素片ファイルより取り出された複数の音声素片に
対応するモーラ間に、アクセントを複数段階に上昇また
は下降制御するためのアクセント制御情報と、発声速度
を複数段階に加速または減速制御するための発声速度制
御情報とを挿入する手段とを備えることにより、 前記抽出したアクセント制御情報及び発声速度制御情報
に従って、前記複数の音声素片に対応するモーラ単位
で、前記入力された文字情報の音声合成時のアクセント
及び発声速度を複数段階に制御可能としたことを特徴と
する音声合成装置。 - 【請求項17】 請求項16において、 前記アクセント制御情報は、前記アクセントを上昇させ
るための情報と、下降させるための情報とからなり、前
記モーラ間に挿入された該情報の数にしたがって前記ア
クセントを複数段階に制御し、 前記発声速度制御情報は、前記発声速度を加速させるた
めの情報と、減速させるための情報とからなり、前記モ
ーラ間に挿入された該情報の数にしたがって前記発声速
度を複数段階に制御することを特徴とする音声合成装
置。 - 【請求項18】 請求項17において、 前記アクセントを上昇または下降させるための情報と、
前記発生速度を加速または減速するための制御情報と
は、同一のモーラ間にそれぞれ複数個挿入可能であるこ
とを特徴とする音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24314099A JP3314058B2 (ja) | 1999-08-30 | 1999-08-30 | 音声合成方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24314099A JP3314058B2 (ja) | 1999-08-30 | 1999-08-30 | 音声合成方法及び装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01343113A Division JP3109807B2 (ja) | 1989-11-06 | 1989-12-29 | 音声合成方式及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000075882A JP2000075882A (ja) | 2000-03-14 |
JP3314058B2 true JP3314058B2 (ja) | 2002-08-12 |
Family
ID=17099395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24314099A Expired - Fee Related JP3314058B2 (ja) | 1999-08-30 | 1999-08-30 | 音声合成方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3314058B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100463655B1 (ko) * | 2002-11-15 | 2004-12-29 | 삼성전자주식회사 | 부가 정보 제공 기능이 있는 텍스트/음성 변환장치 및 방법 |
JP4744338B2 (ja) | 2006-03-31 | 2011-08-10 | 富士通株式会社 | 合成音声生成装置 |
KR100811226B1 (ko) * | 2006-08-14 | 2008-03-07 | 주식회사 보이스웨어 | 악센트구 매칭 사전선택을 이용한 일본어음성합성방법 및시스템 |
-
1999
- 1999-08-30 JP JP24314099A patent/JP3314058B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000075882A (ja) | 2000-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
JP3361066B2 (ja) | 音声合成方法および装置 | |
EP0880127A2 (en) | Method and apparatus for editing/creating synthetic speech message and recording medium with the method recorded thereon | |
JP5198046B2 (ja) | 音声処理装置及びそのプログラム | |
US6212501B1 (en) | Speech synthesis apparatus and method | |
US20020193995A1 (en) | Method and apparatus for recording prosody for fully concatenated speech | |
JPH11202884A (ja) | 合成音声メッセージ編集作成方法、その装置及びその方法を記録した記録媒体 | |
JP2002258885A (ja) | テキスト音声合成装置およびプログラム記録媒体 | |
JP3314058B2 (ja) | 音声合成方法及び装置 | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JP3006240B2 (ja) | 音声合成方法および装置 | |
JP3681111B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP3109807B2 (ja) | 音声合成方式及び装置 | |
JP3113101B2 (ja) | 音声合成装置 | |
JP3870583B2 (ja) | 音声合成装置および記憶媒体 | |
US20240153482A1 (en) | Non-transitory computer-readable medium and voice generating system | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JPH11282494A (ja) | 音声合成装置および記憶媒体 | |
JP2002311979A (ja) | 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JPH09230892A (ja) | テキスト・音声変換装置 | |
JP3314106B2 (ja) | 音声規則合成装置 | |
JP2581130B2 (ja) | 音韻継続時間長決定装置 | |
JP2995814B2 (ja) | 音声合成方法 | |
JP3406230B2 (ja) | 音声出力装置及び音声変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020514 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090531 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |