JP7200483B2 - 音声処理方法、音声処理装置およびプログラム - Google Patents
音声処理方法、音声処理装置およびプログラム Download PDFInfo
- Publication number
- JP7200483B2 JP7200483B2 JP2018043118A JP2018043118A JP7200483B2 JP 7200483 B2 JP7200483 B2 JP 7200483B2 JP 2018043118 A JP2018043118 A JP 2018043118A JP 2018043118 A JP2018043118 A JP 2018043118A JP 7200483 B2 JP7200483 B2 JP 7200483B2
- Authority
- JP
- Japan
- Prior art keywords
- period
- sound signal
- time
- processing
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 205
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000005236 sound signal Effects 0.000 claims description 245
- 230000003595 spectral effect Effects 0.000 claims description 84
- 230000014509 gene expression Effects 0.000 claims description 74
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 238000003786 synthesis reaction Methods 0.000 claims description 36
- 238000001228 spectrum Methods 0.000 claims description 28
- 230000002194 synthesizing effect Effects 0.000 claims description 13
- 230000007423 decrease Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 description 47
- 238000000034 method Methods 0.000 description 33
- 230000008859 change Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000009499 grossing Methods 0.000 description 4
- 206010013952 Dysphonia Diseases 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 208000027498 hoarse voice Diseases 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000010473 Hoarseness Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
図7は、リリース処理部32が実行するリリース処理S2の具体的な内容を例示するフローチャートである。第1音信号X1の定常期間Q1毎に図7のリリース処理S2が実行される。
[条件Cr1]定常期間Q1の時間長が所定値を下回る。
[条件Cr2]定常期間Q1の直後の無声期間の時間長が所定値を下回る。
[条件Cr3]定常期間Q1に後続する有声期間Vrの時間長が所定値を上回る。
リリース処理部32は、第1音信号X1のうち第2音信号X2の音表現が付加される期間(以下「処理期間」という)Z1_Rを時間軸上で伸縮する(S24)。図8に例示される通り、処理期間Z1_Rは、音表現の付加が開始される時刻(以下「合成開始時刻」という)Tm_Rから定常期間Q1の直後の有声期間Vrの終点時刻τ1_Rまでの期間である。合成開始時刻Tm_Rは、歌唱音声の定常期間Q1の始点時刻T1_Sと参照音声の定常期間Q2の始点時刻T2_Sとのうち後方の時刻である。図8の例示の通り、定常期間Q2の始点時刻T2_Sが定常期間Q1の始点時刻T1_Sの後方に位置する場合には、定常期間Q2の始点時刻T2_Sが合成開始時刻Tm_Rとして設定される。ただし、合成開始時刻Tm_Rは始点時刻T2_Sに限定されない。
リリース処理部32は、歌唱音声の伸長後の処理期間Z1_Rと参照音声の表現期間Z2_Rとの間でスペクトル包絡概形を合成する。第1音信号X1のスペクトル包絡概形G1は、図9に例示される通り、第1音信号X1の周波数スペクトルg1の概形であるスペクトル包絡g2を周波数領域で更に平滑化した強度分布を意味する。具体的には、音韻性(音韻に依存した差異)および個人性(発声者に依存した差異)が知覚できなくなる程度にスペクトル包絡g2を平滑化した強度分布がスペクトル包絡概形G1である。例えばスペクトル包絡g2を表すメルケプストラムの複数の係数のうち低次側に位置する所定個の係数によりスペクトル包絡概形G1が表現される。以上の説明では第1音信号X1のスペクトル包絡概形G1に着目したが、第2音信号X2のスペクトル包絡概形G2も同様である。
図10は、アタック処理部31が実行するアタック処理S1の具体的な内容を例示するフローチャートである。第1音信号X1の定常期間Q1毎に図10のアタック処理S1が実行される。なお、アタック処理S1の具体的な手順はリリース処理S2と同様である。
[条件Ca1]定常期間Q1の時間長が所定値を下回る。
[条件Ca2]定常期間Q1内で平滑化した基本周波数f1の変動幅が所定値を上回る。
[条件Ca3]定常期間Q1のうち始点を含む所定長の期間内で平滑化した基本周波数f1の変動幅が所定値を上回る。
[条件Ca4]定常期間Q1の直前の有声期間Vaの時間長が所定値を上回る。
[条件Ca5]定常期間Q1の直前の有声期間Vaにおける基本周波数f1の変動幅が所定値を上回る。
アタック処理部31は、第1音信号X1のうち第2音信号X2の音表現が付加される処理期間Z1_Aを時間軸上で伸長する(S14)。処理期間Z1_Aは、定常期間Q1の直前の有声期間Vaの始点時刻τ1_Aから音表現の付加が終了される時刻(以下「合成終了時刻」という)Tm_Aまでの期間である。合成終了時刻Tm_Aは、例えば定常期間Q1の始点時刻T1_S(定常期間Q2の始点時刻T2_S)である。すなわち、アタック処理S1においては、定常期間Q1の前方の有声期間Vaが処理期間Z1_Aとして伸長される。前述の通り、定常期間Q1は楽曲の音符に相当する期間である。有声期間Vaを伸長し、定常期間Q1は伸長しない構成によれば、定常期間Q1の始点時刻T1_Sの変化が抑制される。すなわち、歌唱音声における音符の先頭が前後に移動する可能性を低減できる。
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
以上に例示した形態から、例えば以下の構成が把握される。
Claims (10)
- 歌唱音声を表す第1音信号において基本周波数およびスペクトル形状が時間的に安定している第1定常期間の終点と、前記歌唱音声とは音響特性が相違する参照音声を表す第2音信号において基本周波数およびスペクトル形状が時間的に安定している第2定常期間の終点とが時間軸上で一致するように、前記第1定常期間と前記第2定常期間との時間軸上の位置を調整した状態において、前記第1音信号のうち前記第1定常期間の終点に対して特定の時間だけ前方の時点から前記歌唱音声が消音する時点までの処理期間を、前記第2音信号のうち前記第2定常期間の終点に対して前記特定の時間だけ前方の時点から前記参照音声が消音する時点までの表現期間の時間長に伸長し、
前記第2音信号の前記表現期間における声質に関する音響特性を、前記伸長後の前記第1音信号における前記処理期間に付加する、
コンピュータにより実現される音声処理方法。 - 前記処理期間の伸長においては、当該処理期間の終点に近い位置ほど伸長の度合が小さくなるように前記処理期間を伸長する
請求項1の音声処理方法。 - 歌唱音声を表す第1音信号のうち当該歌唱音声が開始する時点から、前記第1音信号において基本周波数およびスペクトル形状が時間的に安定している第1定常期間の始点までの処理期間を、前記歌唱音声とは音響特性が相違する参照音声を表す第2音信号のうち前記参照音声が開始する時点から、前記第2音信号において基本周波数およびスペクトル形状が時間的に安定している第2定常期間の始点までの表現期間の時間長に伸長し、
前記第2音信号の前記表現期間における声質に関する音響特性を、前記伸長後の前記第1音信号における前記処理期間に付加する、
コンピュータにより実現される音声処理方法。 - 前記処理期間の伸長においては、前記処理期間の始点に近い位置ほど伸長の度合が小さくなるように前記処理期間を伸長する
請求項3の音声処理方法。 - 歌唱音声を表す第1音信号において基本周波数およびスペクトル形状が時間的に安定している第1定常期間の終点と、前記歌唱音声とは音響特性が相違する参照音声を表す第2音信号において基本周波数およびスペクトル形状が時間的に安定している第2定常期間の終点とが時間軸上で一致するように、前記第1定常期間と前記第2定常期間との時間軸上の位置を調整した状態において、前記第1音信号のうち前記第1定常期間の終点に対して特定の時間だけ前方の時点から前記歌唱音声が消音する時点までの処理期間を、前記第2音信号のうち前記第2定常期間の終点に対して前記特定の時間だけ前方の時点から前記参照音声が消音する時点までの表現期間の時間長に伸長し、前記第2音信号の前記表現期間における声質に関する音響特性を、前記伸長後の前記第1音信号における前記処理期間に付加する合成処理部
を具備する音声処理装置。 - 前記合成処理部は、当該処理期間の終点に近い位置ほど伸長の度合が小さくなるように前記処理期間を伸長する
請求項5の音声処理装置。 - 歌唱音声を表す第1音信号のうち当該歌唱音声が開始する時点から、前記第1音信号において基本周波数およびスペクトル形状が時間的に安定している第1定常期間の始点までの処理期間を、前記歌唱音声とは音響特性が相違する参照音声を表す第2音信号のうち前記参照音声が開始する時点から、前記第2音信号において基本周波数およびスペクトル形状が時間的に安定している第2定常期間の始点までの表現期間の時間長に伸長し、前記第2音信号の前記表現期間における声質に関する音響特性を、前記伸長後の前記第1音信号における前記処理期間に付加する合成処理部
を具備する音声処理装置。 - 前記合成処理部は、前記処理期間の始点に近い位置ほど伸長の度合が小さくなるように前記処理期間を伸長する
請求項7の音声処理装置。 - 歌唱音声を表す第1音信号において基本周波数およびスペクトル形状が時間的に安定している第1定常期間の終点と、前記歌唱音声とは音響特性が相違する参照音声を表す第2音信号において基本周波数およびスペクトル形状が時間的に安定している第2定常期間の終点とが時間軸上で一致するように、前記第1定常期間と前記第2定常期間との時間軸上の位置を調整した状態において、前記第1音信号のうち前記第1定常期間の終点に対して特定の時間だけ前方の時点から前記歌唱音声が消音する時点までの処理期間を、前記第2音信号のうち前記第2定常期間の終点に対して前記特定の時間だけ前方の時点から前記参照音声が消音する時点までの表現期間の時間長に伸長し、前記第2音信号の前記表現期間における声質に関する音響特性を、前記伸長後の前記第1音信号における前記処理期間に付加する合成処理部、
としてコンピュータを機能させるプログラム。 - 歌唱音声を表す第1音信号のうち当該歌唱音声が開始する時点から、前記第1音信号において基本周波数およびスペクトル形状が時間的に安定している第1定常期間の始点までの処理期間を、前記歌唱音声とは音響特性が相違する参照音声を表す第2音信号のうち前記参照音声が開始する時点から、前記第2音信号において基本周波数およびスペクトル形状が時間的に安定している第2定常期間の始点までの表現期間の時間長に伸長し、前記第2音信号の前記表現期間における声質に関する音響特性を、前記伸長後の前記第1音信号における前記処理期間に付加する合成処理部、
としてコンピュータを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043118A JP7200483B2 (ja) | 2018-03-09 | 2018-03-09 | 音声処理方法、音声処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043118A JP7200483B2 (ja) | 2018-03-09 | 2018-03-09 | 音声処理方法、音声処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159014A JP2019159014A (ja) | 2019-09-19 |
JP7200483B2 true JP7200483B2 (ja) | 2023-01-10 |
Family
ID=67994001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018043118A Active JP7200483B2 (ja) | 2018-03-09 | 2018-03-09 | 音声処理方法、音声処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7200483B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001242900A (ja) | 2000-02-25 | 2001-09-07 | Yamaha Corp | 音の時間伸長装置、方法、および音の時間伸長プログラムを記録した記録媒体 |
WO2008142836A1 (ja) | 2007-05-14 | 2008-11-27 | Panasonic Corporation | 声質変換装置および声質変換方法 |
-
2018
- 2018-03-09 JP JP2018043118A patent/JP7200483B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001242900A (ja) | 2000-02-25 | 2001-09-07 | Yamaha Corp | 音の時間伸長装置、方法、および音の時間伸長プログラムを記録した記録媒体 |
WO2008142836A1 (ja) | 2007-05-14 | 2008-11-27 | Panasonic Corporation | 声質変換装置および声質変換方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2019159014A (ja) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5961950B2 (ja) | 音声処理装置 | |
EP3065130B1 (en) | Voice synthesis | |
JP6724932B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
US11289066B2 (en) | Voice synthesis apparatus and voice synthesis method utilizing diphones or triphones and machine learning | |
JP2010014913A (ja) | 声質変換音声生成装置および声質変換音声生成システム | |
US11646044B2 (en) | Sound processing method, sound processing apparatus, and recording medium | |
JP7147211B2 (ja) | 情報処理方法および情報処理装置 | |
JP7200483B2 (ja) | 音声処理方法、音声処理装置およびプログラム | |
JP7106897B2 (ja) | 音声処理方法、音声処理装置およびプログラム | |
JP6011039B2 (ja) | 音声合成装置および音声合成方法 | |
JP6747236B2 (ja) | 音響解析方法および音響解析装置 | |
JP5573529B2 (ja) | 音声処理装置およびプログラム | |
WO2019172396A1 (ja) | 音声処理方法、音声処理装置および記録媒体 | |
JP6234134B2 (ja) | 音声合成装置 | |
JP6191094B2 (ja) | 音声素片切出装置 | |
WO2022190403A1 (ja) | 信号処理システム、信号処理方法およびプログラム | |
JP2001312300A (ja) | 音声合成装置 | |
JP2004287350A (ja) | 音声変換装置、音声効果付与装置、及びプログラム | |
JP2018072370A (ja) | 音響解析方法および音響解析装置 | |
JP2018072369A (ja) | 音響解析方法および音響解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221205 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7200483 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |