JP2002149200A - 音声処理装置及び音声処理方法 - Google Patents
音声処理装置及び音声処理方法Info
- Publication number
- JP2002149200A JP2002149200A JP2001259473A JP2001259473A JP2002149200A JP 2002149200 A JP2002149200 A JP 2002149200A JP 2001259473 A JP2001259473 A JP 2001259473A JP 2001259473 A JP2001259473 A JP 2001259473A JP 2002149200 A JP2002149200 A JP 2002149200A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- voice
- noise
- comb filter
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 190
- 238000000034 method Methods 0.000 title claims description 90
- 238000001228 spectrum Methods 0.000 claims abstract description 410
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims description 56
- 230000001629 suppression Effects 0.000 claims description 39
- 238000012937 correction Methods 0.000 claims description 29
- 230000002238 attenuated effect Effects 0.000 claims description 25
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 9
- 238000003672 processing method Methods 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000000926 separation method Methods 0.000 description 53
- 238000004364 calculation method Methods 0.000 description 51
- 238000010586 diagram Methods 0.000 description 49
- 230000000694 effects Effects 0.000 description 19
- 230000008859 change Effects 0.000 description 13
- 239000000284 extract Substances 0.000 description 11
- 230000000903 blocking effect Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000008439 repair process Effects 0.000 description 3
- 238000011410 subtraction method Methods 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 241001481828 Glyptocephalus cynoglossus Species 0.000 description 1
- 101000585359 Homo sapiens Suppressor of tumorigenicity 20 protein Proteins 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
(57)【要約】
【課題】 音声の歪みが少なくかつノイズを十分に
除去すること 【解決手段】 音声非音声識別部106は、音声スペク
トル信号とノイズベースの値の差が所定の閾値以上であ
る場合、音声成分を含む有音部分と判定し、それ以外の
場合、音声成分を含まない雑音のみの無音部分であると
判定する。コムフィルタ生成部107は、各周波数成分
における音声成分の有無に基づいて音声ピッチを強調す
るコムフィルタを生成する。減衰係数計算部108は、
コムフィルタに周波数特性に基づいた減衰係数を乗算し
て、各周波数成分毎に入力信号の減衰係数の設定を行
い、各周波数成分の減衰係数を乗算部109に出力す
る。乗算部109は、音声スペクトルに減衰係数を周波
数成分単位で乗算する。周波数合成部110は、乗算の
結果得られた周波数成分単位のスペクトルを所定の処理
時間単位で、周波数領域で連続する音声スペクトルに合
成する。
除去すること 【解決手段】 音声非音声識別部106は、音声スペク
トル信号とノイズベースの値の差が所定の閾値以上であ
る場合、音声成分を含む有音部分と判定し、それ以外の
場合、音声成分を含まない雑音のみの無音部分であると
判定する。コムフィルタ生成部107は、各周波数成分
における音声成分の有無に基づいて音声ピッチを強調す
るコムフィルタを生成する。減衰係数計算部108は、
コムフィルタに周波数特性に基づいた減衰係数を乗算し
て、各周波数成分毎に入力信号の減衰係数の設定を行
い、各周波数成分の減衰係数を乗算部109に出力す
る。乗算部109は、音声スペクトルに減衰係数を周波
数成分単位で乗算する。周波数合成部110は、乗算の
結果得られた周波数成分単位のスペクトルを所定の処理
時間単位で、周波数領域で連続する音声スペクトルに合
成する。
Description
【0001】
【発明の属する技術分野】本発明は、雑音を抑圧する音
声処理装置及び音声処理方法に関し、特に通信システム
における音声処理装置及び音声処理方法に関する。
声処理装置及び音声処理方法に関し、特に通信システム
における音声処理装置及び音声処理方法に関する。
【0002】
【従来の技術】従来の音声符号化技術では、雑音のない
音声に対しては高品質な音声で通話することができる
が、雑音等が含まれた音声に対してはデジタル通話特有
の耳障りな雑音が生じ、音質が劣化する問題があった。
音声に対しては高品質な音声で通話することができる
が、雑音等が含まれた音声に対してはデジタル通話特有
の耳障りな雑音が生じ、音質が劣化する問題があった。
【0003】このような雑音を抑圧する音声強調技術と
してスペクトルサブトラクション法、コムフィルタ法が
ある。
してスペクトルサブトラクション法、コムフィルタ法が
ある。
【0004】スペクトルサブトラクション法は、雑音情
報に着目して無音区間で雑音の性質を推定して雑音を含
む音声信号の短時間パワースペクトルから雑音の短時間
パワースペクトルを減算する、または減衰係数を乗算す
ることにより音声信号のパワースペクトルを推定して雑
音を抑圧する方法である。スペクトルサブトラクション
法は、例えば、文献(S.Boll,Suppression of acoustic
noise in speech using spectral subtraction,IEEE T
rans.Acoustics,Speech,and Signal Processing,vol.AS
SP-27,pp.113-120,1979)、文献(R.J.McAulay,M.L.Malp
ass,Speech enhancement using a soft-decision noise
suppression filter,IEEE.Trans.Acoustics,Speech,an
d Signal Processing,vol.ASSP-28,pp.137-145.1980)、
特許第2714656号と、特願平9−518820号
に記載されているものがある。
報に着目して無音区間で雑音の性質を推定して雑音を含
む音声信号の短時間パワースペクトルから雑音の短時間
パワースペクトルを減算する、または減衰係数を乗算す
ることにより音声信号のパワースペクトルを推定して雑
音を抑圧する方法である。スペクトルサブトラクション
法は、例えば、文献(S.Boll,Suppression of acoustic
noise in speech using spectral subtraction,IEEE T
rans.Acoustics,Speech,and Signal Processing,vol.AS
SP-27,pp.113-120,1979)、文献(R.J.McAulay,M.L.Malp
ass,Speech enhancement using a soft-decision noise
suppression filter,IEEE.Trans.Acoustics,Speech,an
d Signal Processing,vol.ASSP-28,pp.137-145.1980)、
特許第2714656号と、特願平9−518820号
に記載されているものがある。
【0005】一方、コムフィルタ法は、音声情報に着目
し、音声スペクトルのピッチにコムフィルタをかけるこ
とにより雑音減衰を行う。コムフィルタ法に関する文献
として、例えば、文献(J.S.Lim etc.,Evaluation of an
adaptive comb filtering method for enhancing spee
ch degraded by white noise addition,IEEE Trans.Aco
ustics,Speech,and Signal Processing,vol.ASSP26,pp.
354-358,1978)がある。
し、音声スペクトルのピッチにコムフィルタをかけるこ
とにより雑音減衰を行う。コムフィルタ法に関する文献
として、例えば、文献(J.S.Lim etc.,Evaluation of an
adaptive comb filtering method for enhancing spee
ch degraded by white noise addition,IEEE Trans.Aco
ustics,Speech,and Signal Processing,vol.ASSP26,pp.
354-358,1978)がある。
【0006】コムフィルタとは、周波数領域単位で入力
された信号を所定の比率で減衰させ、または減衰させず
に信号を出力するフィルタであり、櫛状の減衰特性をも
つ。デジタルデータ処理でコムフィルタ法を実現する場
合、コムフィルタの減衰特性を周波数領域毎に減衰特性
のデータを作成し、周波数毎に音声スペクトルを乗算す
ることにより雑音を抑圧できる。
された信号を所定の比率で減衰させ、または減衰させず
に信号を出力するフィルタであり、櫛状の減衰特性をも
つ。デジタルデータ処理でコムフィルタ法を実現する場
合、コムフィルタの減衰特性を周波数領域毎に減衰特性
のデータを作成し、周波数毎に音声スペクトルを乗算す
ることにより雑音を抑圧できる。
【0007】図28は、従来のコムフィルタ法を用いた
音声処理装置の例を示す図である。図28において、切
り替え器11は、入力信号に準周期性を持たない音声成
分(例えば子音)が含まれている場合、入力信号をその
まま出力し、入力信号に準周期性を持つ音声成分が含ま
れている場合、入力信号をコムフィルタ12に出力す
る。コムフィルタ12は、ピッチ周期の情報に基づいた
減衰特性で入力信号に対して周波数領域で雑音部分に減
衰を行って出力する。
音声処理装置の例を示す図である。図28において、切
り替え器11は、入力信号に準周期性を持たない音声成
分(例えば子音)が含まれている場合、入力信号をその
まま出力し、入力信号に準周期性を持つ音声成分が含ま
れている場合、入力信号をコムフィルタ12に出力す
る。コムフィルタ12は、ピッチ周期の情報に基づいた
減衰特性で入力信号に対して周波数領域で雑音部分に減
衰を行って出力する。
【0008】図29は、コムフィルタの減衰特性を示す
図である。縦軸は信号の減衰特性を示し、横軸は周波数
を示す。図29においてコムフィルタには、周波数領域
毎に信号を減衰させる領域と信号を減衰させない領域が
存在する。
図である。縦軸は信号の減衰特性を示し、横軸は周波数
を示す。図29においてコムフィルタには、周波数領域
毎に信号を減衰させる領域と信号を減衰させない領域が
存在する。
【0009】コムフィルタ法では、入力された信号にコ
ムフィルタをかけることにより、入力信号の中で音声成
分の存在する周波数領域を減衰せず、音声成分の存在し
ない周波数領域を減衰することにより雑音を抑圧して音
声を強調する。
ムフィルタをかけることにより、入力信号の中で音声成
分の存在する周波数領域を減衰せず、音声成分の存在し
ない周波数領域を減衰することにより雑音を抑圧して音
声を強調する。
【0010】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声処理方法には次のような解決すべき課題
があった。まず、文献1に示したSS法は、ノイズ情報
のみに着目し、短時間のノイズ特性を定常と見なして、
音声とノイズを区別せず、一律にノイズベース(推定さ
れたノイズのスペクトル特性)を差し引く方法である。
音声の情報(例えば、音声のピッチ)は利用されていな
い。実際には、ノイズの特性は定常でないため、差し引
かれた後の残留ノイズ、特にピッチ調波間の残留ノイズ
は処理方法によって、いわゆる「ミュジカルノイズ」と
呼ばれる不自然な歪のある雑音を生じる原因と考えられ
る。
うな従来の音声処理方法には次のような解決すべき課題
があった。まず、文献1に示したSS法は、ノイズ情報
のみに着目し、短時間のノイズ特性を定常と見なして、
音声とノイズを区別せず、一律にノイズベース(推定さ
れたノイズのスペクトル特性)を差し引く方法である。
音声の情報(例えば、音声のピッチ)は利用されていな
い。実際には、ノイズの特性は定常でないため、差し引
かれた後の残留ノイズ、特にピッチ調波間の残留ノイズ
は処理方法によって、いわゆる「ミュジカルノイズ」と
呼ばれる不自然な歪のある雑音を生じる原因と考えられ
る。
【0011】その改善法として、音声パワー対ノイズパ
ワー比(SNR)に基づき、減衰係数を乗じてノイズを
減衰する方法、例えば、特許第2714656号と、特
願平9−518820号に示したものが提案された。音
声の大きい帯域(SNRは大きい)とノイズの大きい帯
域(SNRは小さい)を区別して異なる減衰係数を用い
るため、ミュジカルノイズを抑制し、音質を向上させ
た。しかし、特許第2714656号と、特願平9−5
18820号に示した方法は、音声情報の一部(SN
R)が利用されているものの、処理する周波数チャネル
数(16チャネル)は十分でないので、ピッチ調波情報
を雑音から分離し抽出することは困難であり、また、音
声とノイズ両方の帯域に減衰係数を用いるため、互いに
影響を及ぼし合う結果、減衰係数は大きくすることがで
きない。つまり、減衰係数を大きくすると、SNR推定
の誤りによって、音声の歪みを生じる可能性がある。結
果として、ノイズの減衰は不十分である。
ワー比(SNR)に基づき、減衰係数を乗じてノイズを
減衰する方法、例えば、特許第2714656号と、特
願平9−518820号に示したものが提案された。音
声の大きい帯域(SNRは大きい)とノイズの大きい帯
域(SNRは小さい)を区別して異なる減衰係数を用い
るため、ミュジカルノイズを抑制し、音質を向上させ
た。しかし、特許第2714656号と、特願平9−5
18820号に示した方法は、音声情報の一部(SN
R)が利用されているものの、処理する周波数チャネル
数(16チャネル)は十分でないので、ピッチ調波情報
を雑音から分離し抽出することは困難であり、また、音
声とノイズ両方の帯域に減衰係数を用いるため、互いに
影響を及ぼし合う結果、減衰係数は大きくすることがで
きない。つまり、減衰係数を大きくすると、SNR推定
の誤りによって、音声の歪みを生じる可能性がある。結
果として、ノイズの減衰は不十分である。
【0012】また、従来のコムフィルタ法では、基本周
波数であるピッチに推定誤差があると、その高調波では
誤差分が拡大し、本来の高調波成分がその通過帯域から
はずれる可能性がより大きくなる。また、準周期性を持
つ音声とそうでない音声を判別する必要があるため、実
現性に問題がある。
波数であるピッチに推定誤差があると、その高調波では
誤差分が拡大し、本来の高調波成分がその通過帯域から
はずれる可能性がより大きくなる。また、準周期性を持
つ音声とそうでない音声を判別する必要があるため、実
現性に問題がある。
【0013】本発明は、かかる点に鑑みてなされたもの
であり、音声の歪みが少なくかつノイズを十分に除去す
ることができる音声処理装置及び音声処理方法を提供す
ることを目的とする。
であり、音声の歪みが少なくかつノイズを十分に除去す
ることができる音声処理装置及び音声処理方法を提供す
ることを目的とする。
【0014】
【課題を解決するための手段】本発明の音声処理装置
は、入力音声信号の音声スペクトルを所定の周波数単位
で分割する周波数分割手段と、前記周波数分割手段にお
いて周波数分割された音声スペクトル及び雑音成分のス
ペクトルであるノイズベースに基づいて前記音声スペク
トルに音声成分が含まれているか否か識別する音声識別
手段と、前記音声識別手段の識別結果に基づいて所定の
周波数単位でスペクトルパワの減衰を行う第一コムフィ
ルタを生成する第一コムフィルタ生成手段と、前記第一
コムフィルタを用いて前記音声スペクトルの雑音成分を
抑圧する雑音抑圧手段と、前記雑音成分が抑圧された音
声スペクトルを周波数領域で連続した音声スペクトルに
合成する周波数合成手段と、前記音声識別手段により音
声成分が含まれないとされた音声スペクトルを用いて前
記ノイズベースを更新するノイズベース推定手段と、を
具備する構成を採る。
は、入力音声信号の音声スペクトルを所定の周波数単位
で分割する周波数分割手段と、前記周波数分割手段にお
いて周波数分割された音声スペクトル及び雑音成分のス
ペクトルであるノイズベースに基づいて前記音声スペク
トルに音声成分が含まれているか否か識別する音声識別
手段と、前記音声識別手段の識別結果に基づいて所定の
周波数単位でスペクトルパワの減衰を行う第一コムフィ
ルタを生成する第一コムフィルタ生成手段と、前記第一
コムフィルタを用いて前記音声スペクトルの雑音成分を
抑圧する雑音抑圧手段と、前記雑音成分が抑圧された音
声スペクトルを周波数領域で連続した音声スペクトルに
合成する周波数合成手段と、前記音声識別手段により音
声成分が含まれないとされた音声スペクトルを用いて前
記ノイズベースを更新するノイズベース推定手段と、を
具備する構成を採る。
【0015】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
【0016】本発明の音声処理装置は、ノイズベース推
定手段は、過去に推定したノイズベースの平均値と処理
する音声スペクトルのパワを加重平均した平均値に基づ
いてノイズベースを推定して更新する構成を採る。
定手段は、過去に推定したノイズベースの平均値と処理
する音声スペクトルのパワを加重平均した平均値に基づ
いてノイズベースを推定して更新する構成を採る。
【0017】この構成によれば、各周波数成分における
音声スペクトルのパワ平均値又は過去に処理を行ったフ
レームと処理を行うフレームのパワ平均値を求めること
により、突発性雑音成分の影響は小さくなり、正確なコ
ムフィルタを構成することができる。
音声スペクトルのパワ平均値又は過去に処理を行ったフ
レームと処理を行うフレームのパワ平均値を求めること
により、突発性雑音成分の影響は小さくなり、正確なコ
ムフィルタを構成することができる。
【0018】本発明の音声処理装置は、音声識別手段
は、音声スペクトルのパワとノイズベースのパワとの差
分値が所定の閾値より大きい場合に音声スペクトルに音
声成分が含まれていると判断し、前記差分値が前記閾値
以下の場合に音声スペクトルに音声成分が含まれていな
いと判断する構成を採る。
は、音声スペクトルのパワとノイズベースのパワとの差
分値が所定の閾値より大きい場合に音声スペクトルに音
声成分が含まれていると判断し、前記差分値が前記閾値
以下の場合に音声スペクトルに音声成分が含まれていな
いと判断する構成を採る。
【0019】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
【0020】本発明の音声処理装置は、音声識別手段
は、音声スペクトルのパワとノイズベースのパワとの差
分値が所定の第一閾値より大きい場合には音声スペクト
ルに音声成分が含まれていると判断し、前記第一閾値よ
り小さい第二閾値より前記差分値が小さい場合には音声
スペクトルに音声成分が含まれていないと判断し、上記
いずれの条件をも満たさない場合には過去に行った判断
を判断結果とする構成を採る。
は、音声スペクトルのパワとノイズベースのパワとの差
分値が所定の第一閾値より大きい場合には音声スペクト
ルに音声成分が含まれていると判断し、前記第一閾値よ
り小さい第二閾値より前記差分値が小さい場合には音声
スペクトルに音声成分が含まれていないと判断し、上記
いずれの条件をも満たさない場合には過去に行った判断
を判断結果とする構成を採る。
【0021】この構成によれば、2つの閾値を設けるこ
とにより、精度の高い音声非音声の判別ができる。
とにより、精度の高い音声非音声の判別ができる。
【0022】本発明の音声処理装置は、第一コムフィル
タ生成手段は、音声成分の含まれる周波数領域のスペク
トルを強調し、雑音成分の含まれる周波数領域のスペク
トルを減衰する構成を採る。
タ生成手段は、音声成分の含まれる周波数領域のスペク
トルを強調し、雑音成分の含まれる周波数領域のスペク
トルを減衰する構成を採る。
【0023】本発明の音声処理装置は、所定の周波数単
位でスペクトルパワの減衰の度合いである減衰係数を設
定する減衰係数計算手段を具備し、雑音抑圧手段は、音
声スペクトルに前記減衰係数を乗算して雑音を抑圧する
構成を採る。
位でスペクトルパワの減衰の度合いである減衰係数を設
定する減衰係数計算手段を具備し、雑音抑圧手段は、音
声スペクトルに前記減衰係数を乗算して雑音を抑圧する
構成を採る。
【0024】これらの構成によれば、周波数成分単位で
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調を
行うことができる。
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調を
行うことができる。
【0025】本発明の音声処理装置は、所定の時間単位
で音声信号に音声成分が含まれているか否かを判断する
第二音声識別手段を具備し、ノイズベース推定手段は、
音声信号が音声を含む音声区間から音声を含まない無音
区間に移った場合に、無音区間の音声スペクトルに基づ
いてノイズベースを推定して更新する構成を採る。
で音声信号に音声成分が含まれているか否かを判断する
第二音声識別手段を具備し、ノイズベース推定手段は、
音声信号が音声を含む音声区間から音声を含まない無音
区間に移った場合に、無音区間の音声スペクトルに基づ
いてノイズベースを推定して更新する構成を採る。
【0026】この構成によれば、入力された信号から推
定した雑音スペクトルの値を大きく反映させてノイズベ
ースの更新を行うことにより、ノイズレベルの急激な変
化に対応したノイズベースの更新を行うことができ、音
声歪の少ない音声強調を行うことができる。
定した雑音スペクトルの値を大きく反映させてノイズベ
ースの更新を行うことにより、ノイズレベルの急激な変
化に対応したノイズベースの更新を行うことができ、音
声歪の少ない音声強調を行うことができる。
【0027】本発明の音声処理装置は、所定の周波数単
位で音声スペクトルのパワの平均値をとる第一平均値計
算手段を具備し、ノイズベース手段は、前記平均値に基
づいてノイズベースを推定して更新する構成を採る。
位で音声スペクトルのパワの平均値をとる第一平均値計
算手段を具備し、ノイズベース手段は、前記平均値に基
づいてノイズベースを推定して更新する構成を採る。
【0028】本発明の音声処理装置は、音声識別手段
は、音声スペクトルのパワの平均値に基づいて音声信号
に音声成分が含まれているか否か識別する構成を採る。
は、音声スペクトルのパワの平均値に基づいて音声信号
に音声成分が含まれているか否か識別する構成を採る。
【0029】これらの構成によれば、各周波数成分にお
ける音声スペクトルのパワ平均値又は過去に処理を行っ
たフレームと処理を行うフレームのパワ平均値を求める
ことにより、突発性雑音成分の影響は小さくなり、より
正確なコムフィルタを構成することができる。
ける音声スペクトルのパワ平均値又は過去に処理を行っ
たフレームと処理を行うフレームのパワ平均値を求める
ことにより、突発性雑音成分の影響は小さくなり、より
正確なコムフィルタを構成することができる。
【0030】本発明の音声処理装置は、雑音抑圧手段
は、音声成分を含まない音声スペクトルの全周波数領域
に減衰を行う構成を採る。
は、音声成分を含まない音声スペクトルの全周波数領域
に減衰を行う構成を採る。
【0031】この構成によれば、音声成分を含まないフ
レームに全周波数成分で減衰を行い、音声を含まない信
号区間でノイズを全帯域でカットすることにより、音声
抑圧処理に起因するノイズの発生を防ぐことができるの
で、音声歪の少ない音声強調を行うことができる構成を
採る。
レームに全周波数成分で減衰を行い、音声を含まない信
号区間でノイズを全帯域でカットすることにより、音声
抑圧処理に起因するノイズの発生を防ぐことができるの
で、音声歪の少ない音声強調を行うことができる構成を
採る。
【0032】本発明の音声処理装置は、生成された第一
コムフィルタのピッチ周期情報に基づいて失われたコム
フィルタのピッチ調波情報を修正する第一ピッチ修正手
段を具備する構成を採る。
コムフィルタのピッチ周期情報に基づいて失われたコム
フィルタのピッチ調波情報を修正する第一ピッチ修正手
段を具備する構成を採る。
【0033】この構成によれば、ピッチ周期情報を推定
して、ノイズと判別されて失われたピッチ調波情報を補
うことにより、原音声に近い音声の状態で、かつ音声歪
の少ない音声強調を行うことができる。
して、ノイズと判別されて失われたピッチ調波情報を補
うことにより、原音声に近い音声の状態で、かつ音声歪
の少ない音声強調を行うことができる。
【0034】本発明の音声処理装置は、生成された第一
コムフィルタにおいて減衰を行わない周波数成分の数が
所定の数より大きい場合、第一識別手段の閾値を大きく
し、前記減衰を行わない周波数成分の数が前記所定の数
以下の場合、前記第一識別手段の閾値を小さくする閾値
調整手段を具備する構成をとる。
コムフィルタにおいて減衰を行わない周波数成分の数が
所定の数より大きい場合、第一識別手段の閾値を大きく
し、前記減衰を行わない周波数成分の数が前記所定の数
以下の場合、前記第一識別手段の閾値を小さくする閾値
調整手段を具備する構成をとる。
【0035】この構成によれば、音声を含まないフレー
ムの中で音声が含まれると誤って判断される周波数成分
の数に基づいて、音声スペクトルの音声非音声識別に用
いる閾値の変更を行うことにより、ノイズの種類に対応
した音声の判別を行い、音声歪の少ない音声強調を行う
ことができる。
ムの中で音声が含まれると誤って判断される周波数成分
の数に基づいて、音声スペクトルの音声非音声識別に用
いる閾値の変更を行うことにより、ノイズの種類に対応
した音声の判別を行い、音声歪の少ない音声強調を行う
ことができる。
【0036】本発明の音声処理装置は、生成された第一
コムフィルタにおいて減衰を行わない周波数成分の数が
所定の数以下の場合、コムフィルタを音声スペクトルの
全周波数領域に対して減衰を行う第一コムフィルタリセ
ット手段を具備する構成を採る。
コムフィルタにおいて減衰を行わない周波数成分の数が
所定の数以下の場合、コムフィルタを音声スペクトルの
全周波数領域に対して減衰を行う第一コムフィルタリセ
ット手段を具備する構成を採る。
【0037】本発明の音声処理装置は、第一コムフィル
タにおいて音声を通過する帯域が所定の数以下である場
合、突発性のノイズが発生していると判断し、生成され
たコムフィルタを全ての領域の入力音声信号を減衰する
コムフィルタに設定する第一ミュジカルノイズ抑圧手段
を具備する構成を採る。
タにおいて音声を通過する帯域が所定の数以下である場
合、突発性のノイズが発生していると判断し、生成され
たコムフィルタを全ての領域の入力音声信号を減衰する
コムフィルタに設定する第一ミュジカルノイズ抑圧手段
を具備する構成を採る。
【0038】この構成によれば、コムフィルタの生成結
果からミュジカルノイズ発生を判断することにより、ノ
イズが音声信号と誤判断されることを防ぎ、音声歪の少
ない音声強調を行うことができる。
果からミュジカルノイズ発生を判断することにより、ノ
イズが音声信号と誤判断されることを防ぎ、音声歪の少
ない音声強調を行うことができる。
【0039】本発明の音声処理装置は、所定の周波数単
位で音声スペクトルとノイズベースに基づいて音声識別
手段と異なる条件で前記音声スペクトルに音声成分が含
まれているか否か識別する第三音声識別手段と、前記第
三音声識別手段の識別結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第二コムフィルタを生成
する第二コムフィルタ生成手段と、音声スペクトルから
入力音声信号のピッチ周期を推測する音声ピッチ推測手
段と、前記音声ピッチ推測手段において推測されたピッ
チ周期に基づいて第二コムフィルタのピッチ調波構造を
修復してピッチ修復コムフィルタを生成する音声ピッチ
修復手段と、ピッチ修復コムフィルタに基づいて第一コ
ムフィルタの修正を行うコムフィルタ修正手段とを具備
する構成を採る。
位で音声スペクトルとノイズベースに基づいて音声識別
手段と異なる条件で前記音声スペクトルに音声成分が含
まれているか否か識別する第三音声識別手段と、前記第
三音声識別手段の識別結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第二コムフィルタを生成
する第二コムフィルタ生成手段と、音声スペクトルから
入力音声信号のピッチ周期を推測する音声ピッチ推測手
段と、前記音声ピッチ推測手段において推測されたピッ
チ周期に基づいて第二コムフィルタのピッチ調波構造を
修復してピッチ修復コムフィルタを生成する音声ピッチ
修復手段と、ピッチ修復コムフィルタに基づいて第一コ
ムフィルタの修正を行うコムフィルタ修正手段とを具備
する構成を採る。
【0040】この構成によれば、コムフィルタ作成に用
いるノイズベースと、ピッチ調波構造修復に用いるノイ
ズベースをそれぞれ異なる条件で生成することにより、
音声情報を多く抽出し、かつ雑音情報の影響を受け難い
コムフィルタを生成して正確なピッチ調波構造の修復を
行うことができる。
いるノイズベースと、ピッチ調波構造修復に用いるノイ
ズベースをそれぞれ異なる条件で生成することにより、
音声情報を多く抽出し、かつ雑音情報の影響を受け難い
コムフィルタを生成して正確なピッチ調波構造の修復を
行うことができる。
【0041】本発明の音声処理装置は、第三音声識別手
段は、音声スペクトルに音声が含まれると判断する条件
を音声識別手段が音声スペクトルに音声が含まれると判
断する条件より厳しくする構成を採る。
段は、音声スペクトルに音声が含まれると判断する条件
を音声識別手段が音声スペクトルに音声が含まれると判
断する条件より厳しくする構成を採る。
【0042】この構成によれば、コムフィルタのピッチ
幅をピッチ周期の推定結果から調整することにより正確
にピッチ調波構造を修復することができる。音声と厳し
く判断して作成したコムフィルタのピッチ調波構造を修
復したコムフィルタの通過領域と音声と緩く判断して作
成したコムフィルタの通過領域の重複部分を通過領域と
し、この重複する通過領域以外を阻止領域とするコムフ
ィルタを作成することにより、ピッチ周期の推定の誤差
による影響を低減することができ、正確なピッチ調波構
造の修復ができる。
幅をピッチ周期の推定結果から調整することにより正確
にピッチ調波構造を修復することができる。音声と厳し
く判断して作成したコムフィルタのピッチ調波構造を修
復したコムフィルタの通過領域と音声と緩く判断して作
成したコムフィルタの通過領域の重複部分を通過領域と
し、この重複する通過領域以外を阻止領域とするコムフ
ィルタを作成することにより、ピッチ周期の推定の誤差
による影響を低減することができ、正確なピッチ調波構
造の修復ができる。
【0043】本発明の音声処理装置は、第三音声識別手
段は、音声スペクトルのパワとノイズベースのパワとの
差分値が所定の閾値より大きい場合に音声スペクトルに
音声成分が含まれていると判断し、前記差分値が前記閾
値以下の場合に音声スペクトルに音声成分が含まれてい
ないと判断する構成を採る。
段は、音声スペクトルのパワとノイズベースのパワとの
差分値が所定の閾値より大きい場合に音声スペクトルに
音声成分が含まれていると判断し、前記差分値が前記閾
値以下の場合に音声スペクトルに音声成分が含まれてい
ないと判断する構成を採る。
【0044】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
【0045】本発明の音声処理装置は、第三音声識別手
段は、音声スペクトルのパワとノイズベースのパワとの
差分値が所定の第三閾値より大きい場合には音声スペク
トルに音声成分が含まれていると判断し、前記第三閾値
より小さい第四閾値より前記差分値が小さい場合には音
声スペクトルに音声成分が含まれていないと判断し、上
記いずれの条件をも満たさない場合には過去に行った判
断を判断結果とする構成を採る。
段は、音声スペクトルのパワとノイズベースのパワとの
差分値が所定の第三閾値より大きい場合には音声スペク
トルに音声成分が含まれていると判断し、前記第三閾値
より小さい第四閾値より前記差分値が小さい場合には音
声スペクトルに音声成分が含まれていないと判断し、上
記いずれの条件をも満たさない場合には過去に行った判
断を判断結果とする構成を採る。
【0046】この構成によれば、2つの閾値を設けるこ
とにより、精度の高い音声非音声の判別ができる。
とにより、精度の高い音声非音声の判別ができる。
【0047】本発明の音声処理装置は、第二コムフィル
タ生成手段は、音声成分の含まれる周波数領域のスペク
トルを強調し、雑音成分の含まれる周波数領域のスペク
トルを減衰する構成を採る。
タ生成手段は、音声成分の含まれる周波数領域のスペク
トルを強調し、雑音成分の含まれる周波数領域のスペク
トルを減衰する構成を採る。
【0048】本発明の音声処理装置は、雑音抑圧された
音声スペクトルのパワの平均値を所定の周波数単位で算
出する第二平均値計算手段を具備する構成を採る。
音声スペクトルのパワの平均値を所定の周波数単位で算
出する第二平均値計算手段を具備する構成を採る。
【0049】本発明の音声処理装置は、第二音声識別手
段は、音声スペクトルのパワの平均値に基づいて音声信
号に音声成分が含まれているか否か識別する構成を採
る。
段は、音声スペクトルのパワの平均値に基づいて音声信
号に音声成分が含まれているか否か識別する構成を採
る。
【0050】これらの構成によれば、周波数成分単位で
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調を
行うことができる。
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調を
行うことができる。
【0051】本発明の音声処理装置は、生成された第二
コムフィルタのピッチ周期情報に基づいて失われた第二
コムフィルタのピッチ調波情報を修正する第二ピッチ修
正手段を具備する構成を採る。
コムフィルタのピッチ周期情報に基づいて失われた第二
コムフィルタのピッチ調波情報を修正する第二ピッチ修
正手段を具備する構成を採る。
【0052】この構成によれば、ピッチ周期情報を推定
して、ノイズと判別されて失われたピッチ調波情報を補
うことにより、原音声に近い音声の状態で、かつ音声歪
の少ない音声強調を行うことができる。
して、ノイズと判別されて失われたピッチ調波情報を補
うことにより、原音声に近い音声の状態で、かつ音声歪
の少ない音声強調を行うことができる。
【0053】本発明の音声処理装置は、入力音声信号の
音声スペクトルと生成されたコムフィルタとから入力音
声信号の信号対雑音比を算出するSNR算出手段と、信
号対雑音比から入力音声信号の音声スペクトルから音声
成分を検出する音声検出手段と、前記音声検出手段にお
いて検出された音声スペクトルからピッチ周期を推定す
る音声ピッチ推定手段と、を具備し、第二ピッチ修正手
段は、音声ピッチ推定手段において推定されたピッチ周
期でコムフィルタのピッチ調波情報を修正する構成を採
る。
音声スペクトルと生成されたコムフィルタとから入力音
声信号の信号対雑音比を算出するSNR算出手段と、信
号対雑音比から入力音声信号の音声スペクトルから音声
成分を検出する音声検出手段と、前記音声検出手段にお
いて検出された音声スペクトルからピッチ周期を推定す
る音声ピッチ推定手段と、を具備し、第二ピッチ修正手
段は、音声ピッチ推定手段において推定されたピッチ周
期でコムフィルタのピッチ調波情報を修正する構成を採
る。
【0054】この構成によれば、コムフィルタの通過領
域に対応する音声スペクトルのパワの和と、コムフィル
タの阻止領域に対応する音声スペクトルのパワの和との
比を求めてSNR(信号対雑音比)とし、このSNRが
所定の閾値以上であるフレームのみを用いてピッチ周期
を推定することにより、雑音によるピッチ周期推定の誤
りを低減することができ、音声歪の少ない音声強調を行
うことができる。
域に対応する音声スペクトルのパワの和と、コムフィル
タの阻止領域に対応する音声スペクトルのパワの和との
比を求めてSNR(信号対雑音比)とし、このSNRが
所定の閾値以上であるフレームのみを用いてピッチ周期
を推定することにより、雑音によるピッチ周期推定の誤
りを低減することができ、音声歪の少ない音声強調を行
うことができる。
【0055】本発明の音声処理装置は、音声検出部にお
いて音声成分が検出された場合、第二コムフィルタを音
声スペクトルの全周波数領域に対して減衰を行う第二コ
ムフィルタリセット手段を具備する構成を採る。
いて音声成分が検出された場合、第二コムフィルタを音
声スペクトルの全周波数領域に対して減衰を行う第二コ
ムフィルタリセット手段を具備する構成を採る。
【0056】この構成によれば、音声成分を含まないフ
レームに全周波数成分で減衰を行い、音声を含まない信
号区間でノイズを全帯域でカットすることにより、音声
抑圧処理に起因するノイズの発生を防ぐことができるの
で、音声歪の少ない音声強調を行うことができる。
レームに全周波数成分で減衰を行い、音声を含まない信
号区間でノイズを全帯域でカットすることにより、音声
抑圧処理に起因するノイズの発生を防ぐことができるの
で、音声歪の少ない音声強調を行うことができる。
【0057】本発明の音声処理装置は、コムフィルタ修
正手段は、ピッチ修復コムフィルタの通過領域と第二コ
ムフィルタの通過領域の重複する部分を修正後の第二コ
ムフィルタの通過領域とし、この通過領域以外の周波数
領域を阻止領域とする構成を採る。
正手段は、ピッチ修復コムフィルタの通過領域と第二コ
ムフィルタの通過領域の重複する部分を修正後の第二コ
ムフィルタの通過領域とし、この通過領域以外の周波数
領域を阻止領域とする構成を採る。
【0058】この構成によれば、コムフィルタのピッチ
幅をピッチ周期の推定結果から調整することにより正確
にピッチ調波構造を修復することができる。音声と厳し
く判断して作成したコムフィルタのピッチ調波構造を修
復したコムフィルタの通過領域と音声と緩く判断して作
成したコムフィルタの通過領域の重複部分を通過領域と
し、この重複する通過領域以外を阻止領域とするコムフ
ィルタを作成することにより、ピッチ周期の推定の誤差
による影響を低減することができ、正確なピッチ調波構
造の修復ができる。
幅をピッチ周期の推定結果から調整することにより正確
にピッチ調波構造を修復することができる。音声と厳し
く判断して作成したコムフィルタのピッチ調波構造を修
復したコムフィルタの通過領域と音声と緩く判断して作
成したコムフィルタの通過領域の重複部分を通過領域と
し、この重複する通過領域以外を阻止領域とするコムフ
ィルタを作成することにより、ピッチ周期の推定の誤差
による影響を低減することができ、正確なピッチ調波構
造の修復ができる。
【0059】本発明の音声処理装置は、第二コムフィル
タにおいて音声を通過する帯域が所定の数以下である場
合、突発性のノイズが発生していると判断し、生成され
たコムフィルタを全ての領域の入力音声信号を減衰する
コムフィルタに設定する第二ミュジカルノイズ抑圧手段
を具備する構成を採る。
タにおいて音声を通過する帯域が所定の数以下である場
合、突発性のノイズが発生していると判断し、生成され
たコムフィルタを全ての領域の入力音声信号を減衰する
コムフィルタに設定する第二ミュジカルノイズ抑圧手段
を具備する構成を採る。
【0060】この構成によれば、第一コムフィルタと第
二コムフィルタの生成結果からミュジカルノイズ発生を
判断することにより、ノイズが音声信号と誤判断される
ことを防ぎ、音声歪の少ない音声強調を行うことができ
る。
二コムフィルタの生成結果からミュジカルノイズ発生を
判断することにより、ノイズが音声信号と誤判断される
ことを防ぎ、音声歪の少ない音声強調を行うことができ
る。
【0061】本発明の音声処理装置は、入力音声信号の
音声スペクトルを所定の周波数単位で分割する周波数分
割手段と、前記周波数分割手段において周波数分割され
た音声スペクトル及び雑音成分のスペクトルであるノイ
ズベースに基づいて前記音声スペクトルに音声成分が含
まれているか否か識別する音声識別手段と、前記音声識
別手段の識別結果に基づいて所定の周波数単位でスペク
トルパワの減衰を行う第一コムフィルタを生成する第一
コムフィルタ生成手段と、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抽出する雑音抽出手
段と、前記雑音成分が抽出された音声スペクトルを周波
数領域で連続した音声スペクトルに合成する周波数合成
手段と、前記音声識別手段により音声成分が含まれない
とされた音声スペクトルを用いて前記ノイズベースを更
新するノイズベース推定手段と、を具備する構成を採
る。
音声スペクトルを所定の周波数単位で分割する周波数分
割手段と、前記周波数分割手段において周波数分割され
た音声スペクトル及び雑音成分のスペクトルであるノイ
ズベースに基づいて前記音声スペクトルに音声成分が含
まれているか否か識別する音声識別手段と、前記音声識
別手段の識別結果に基づいて所定の周波数単位でスペク
トルパワの減衰を行う第一コムフィルタを生成する第一
コムフィルタ生成手段と、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抽出する雑音抽出手
段と、前記雑音成分が抽出された音声スペクトルを周波
数領域で連続した音声スペクトルに合成する周波数合成
手段と、前記音声識別手段により音声成分が含まれない
とされた音声スペクトルを用いて前記ノイズベースを更
新するノイズベース推定手段と、を具備する構成を採
る。
【0062】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。
【0063】本発明の音声処理装置は、第三コムフィル
タ生成手段は、第三コムフィルタの通過域においてノイ
ズベースの推定値と乱数を乗算して再構成する構成を採
る。
タ生成手段は、第三コムフィルタの通過域においてノイ
ズベースの推定値と乱数を乗算して再構成する構成を採
る。
【0064】この構成によれば、コムフィルタの阻止域
において雑音成分を減衰せず、コムフィルタの通過域に
おいて雑音成分をノイズベースの推定値と乱数を乗算し
て再構成することにより良好な雑音分離特性を得ること
ができる。
において雑音成分を減衰せず、コムフィルタの通過域に
おいて雑音成分をノイズベースの推定値と乱数を乗算し
て再構成することにより良好な雑音分離特性を得ること
ができる。
【0065】本発明の音声処理装置は、コムフィルタを
用いた音声処理後の音声スペクトルの周波数平均及び時
間平均を算出するスペクトル平均手段を具備する構成を
採る。
用いた音声処理後の音声スペクトルの周波数平均及び時
間平均を算出するスペクトル平均手段を具備する構成を
採る。
【0066】この構成によれば、各周波数成分における
音声スペクトルのパワ平均値又は過去に処理を行ったフ
レームと処理を行うフレームのパワ平均値を求めること
により、突発性雑音成分の影響は小さくなり、音声情報
のみをとりだす第二コムフィルタをより正確に生成する
ことができる。
音声スペクトルのパワ平均値又は過去に処理を行ったフ
レームと処理を行うフレームのパワ平均値を求めること
により、突発性雑音成分の影響は小さくなり、音声情報
のみをとりだす第二コムフィルタをより正確に生成する
ことができる。
【0067】本発明の無線通信装置は、上記いずれかの
音声処理装置を有する構成を採る。
音声処理装置を有する構成を採る。
【0068】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調また
は雑音抽出を行った音声を送信又は受信することができ
る。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調また
は雑音抽出を行った音声を送信又は受信することができ
る。
【0069】本発明の音声処理プログラムは、入力音声
信号の音声スペクトルを所定の周波数単位で分割する周
波数分割手順と、前記周波数分割手順において周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別する音声識別手順と、前記
音声識別手順の識別結果に基づいて所定の周波数単位で
スペクトルパワの減衰を行う第一コムフィルタを生成す
る第一コムフィルタ生成手順と、前記第一コムフィルタ
を用いて前記音声スペクトルの雑音成分を抑圧する雑音
抑圧手順と、前記雑音成分が抑圧された音声スペクトル
を周波数領域で連続した音声スペクトルに合成する周波
数合成手順と、前記音声識別手順により音声成分が含ま
れないとされた音声スペクトルを用いて前記ノイズベー
スを更新するノイズベース推定手順と、を含む構成を採
る。
信号の音声スペクトルを所定の周波数単位で分割する周
波数分割手順と、前記周波数分割手順において周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別する音声識別手順と、前記
音声識別手順の識別結果に基づいて所定の周波数単位で
スペクトルパワの減衰を行う第一コムフィルタを生成す
る第一コムフィルタ生成手順と、前記第一コムフィルタ
を用いて前記音声スペクトルの雑音成分を抑圧する雑音
抑圧手順と、前記雑音成分が抑圧された音声スペクトル
を周波数領域で連続した音声スペクトルに合成する周波
数合成手順と、前記音声識別手順により音声成分が含ま
れないとされた音声スペクトルを用いて前記ノイズベー
スを更新するノイズベース推定手順と、を含む構成を採
る。
【0070】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
【0071】本発明の音声処理プログラムは、入力音声
信号の音声スペクトルを所定の周波数単位で分割する周
波数分割手順と、前記周波数分割手順において周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別する音声識別手順と、前記
音声識別手順の識別結果に基づいて所定の周波数単位で
スペクトルパワの減衰を行う第一コムフィルタを生成す
る第一コムフィルタ生成手順と、前記第一コムフィルタ
を用いて前記音声スペクトルの雑音成分を抽出する雑音
抽出手順と、前記雑音成分が抽出された音声スペクトル
を周波数領域で連続した音声スペクトルに合成する周波
数合成手順と、前記音声識別手順により音声成分が含ま
れないとされた音声スペクトルを用いて前記ノイズベー
スを更新するノイズベース推定手順と、を含む構成をと
る。
信号の音声スペクトルを所定の周波数単位で分割する周
波数分割手順と、前記周波数分割手順において周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別する音声識別手順と、前記
音声識別手順の識別結果に基づいて所定の周波数単位で
スペクトルパワの減衰を行う第一コムフィルタを生成す
る第一コムフィルタ生成手順と、前記第一コムフィルタ
を用いて前記音声スペクトルの雑音成分を抽出する雑音
抽出手順と、前記雑音成分が抽出された音声スペクトル
を周波数領域で連続した音声スペクトルに合成する周波
数合成手順と、前記音声識別手順により音声成分が含ま
れないとされた音声スペクトルを用いて前記ノイズベー
スを更新するノイズベース推定手順と、を含む構成をと
る。
【0072】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。
【0073】本発明のサーバは、入力音声信号の音声ス
ペクトルを所定の周波数単位で分割する周波数分割手順
と、前記周波数分割手順において周波数分割された音声
スペクトル及び雑音成分のスペクトルであるノイズベー
スに基づいて前記音声スペクトルに音声成分が含まれて
いるか否か識別する音声識別手順と、前記音声識別手順
の識別結果に基づいて所定の周波数単位でスペクトルパ
ワの減衰を行う第一コムフィルタを生成する第一コムフ
ィルタ生成手順と、前記第一コムフィルタを用いて前記
音声スペクトルの雑音成分を抑圧する雑音抑圧手順と、
前記雑音成分が抑圧された音声スペクトルを周波数領域
で連続した音声スペクトルに合成する周波数合成手順
と、前記音声識別手順により音声成分が含まれないとさ
れた音声スペクトルを用いて前記ノイズベースを更新す
るノイズベース推定手順と、を含む音声処理プログラム
を記録し、要求に応じて前記音声処理プログラムを要求
元に転送する構成を採る。
ペクトルを所定の周波数単位で分割する周波数分割手順
と、前記周波数分割手順において周波数分割された音声
スペクトル及び雑音成分のスペクトルであるノイズベー
スに基づいて前記音声スペクトルに音声成分が含まれて
いるか否か識別する音声識別手順と、前記音声識別手順
の識別結果に基づいて所定の周波数単位でスペクトルパ
ワの減衰を行う第一コムフィルタを生成する第一コムフ
ィルタ生成手順と、前記第一コムフィルタを用いて前記
音声スペクトルの雑音成分を抑圧する雑音抑圧手順と、
前記雑音成分が抑圧された音声スペクトルを周波数領域
で連続した音声スペクトルに合成する周波数合成手順
と、前記音声識別手順により音声成分が含まれないとさ
れた音声スペクトルを用いて前記ノイズベースを更新す
るノイズベース推定手順と、を含む音声処理プログラム
を記録し、要求に応じて前記音声処理プログラムを要求
元に転送する構成を採る。
【0074】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
【0075】本発明のサーバは、入力音声信号の音声ス
ペクトルを所定の周波数単位で分割する周波数分割手順
と、前記周波数分割手順において周波数分割された音声
スペクトル及び雑音成分のスペクトルであるノイズベー
スに基づいて前記音声スペクトルに音声成分が含まれて
いるか否か識別する音声識別手順と、前記音声識別手順
により音声成分が含まれないとされた音声スペクトルを
用いてノイズベースを推定して更新するノイズベース推
定手順と、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行うコムフィルタを生成する
コムフィルタ生成手順と、前記コムフィルタを用いて所
定の周波数単位で前記音声スペクトルの雑音成分を抽出
する雑音抽出手順と、前記雑音成分が抽出された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
する周波数合成手順と、を含む音声処理プログラムを記
録し、要求に応じて前記音声処理プログラムを要求元に
転送する構成を採る。
ペクトルを所定の周波数単位で分割する周波数分割手順
と、前記周波数分割手順において周波数分割された音声
スペクトル及び雑音成分のスペクトルであるノイズベー
スに基づいて前記音声スペクトルに音声成分が含まれて
いるか否か識別する音声識別手順と、前記音声識別手順
により音声成分が含まれないとされた音声スペクトルを
用いてノイズベースを推定して更新するノイズベース推
定手順と、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行うコムフィルタを生成する
コムフィルタ生成手順と、前記コムフィルタを用いて所
定の周波数単位で前記音声スペクトルの雑音成分を抽出
する雑音抽出手順と、前記雑音成分が抽出された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
する周波数合成手順と、を含む音声処理プログラムを記
録し、要求に応じて前記音声処理プログラムを要求元に
転送する構成を採る。
【0076】この構成によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。
【0077】本発明のクライアント装置は、上記のサー
バより転送された音声処理プログラムを実行する構成を
採る。
バより転送された音声処理プログラムを実行する構成を
採る。
【0078】これらの構成によれば、周波数成分単位で
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調ま
たは雑音抽出を行うことができる。
スペクトル信号の音声非音声を判別して、周波数成分単
位で判別結果に基づいた周波数特性の減衰を行うことに
より、正確なピッチ情報を得ることができるので、大き
な減衰で雑音抑圧を行っても音声歪の少ない音声強調ま
たは雑音抽出を行うことができる。
【0079】本発明の音声処理方法は、入力音声信号の
音声スペクトルを所定の周波数単位で分割し、周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別し、前記識別の結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成し、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抑圧し、前記雑音成
分が抑圧された音声スペクトルを周波数領域で連続した
音声スペクトルに合成し、前記音声識別の結果が音声成
分を含まないと識別された音声スペクトルを用いて前記
ノイズベースを更新するようにした。
音声スペクトルを所定の周波数単位で分割し、周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別し、前記識別の結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成し、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抑圧し、前記雑音成
分が抑圧された音声スペクトルを周波数領域で連続した
音声スペクトルに合成し、前記音声識別の結果が音声成
分を含まないと識別された音声スペクトルを用いて前記
ノイズベースを更新するようにした。
【0080】この方法によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得ることができるので、大きな
減衰で雑音抑圧を行っても音声歪の少ない音声強調を行
うことができる。
【0081】本発明の音声処理方法は、入力音声信号の
音声スペクトルを所定の周波数単位で分割し、周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別し、前記識別の結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成し、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抽出し、前記雑音成
分が抽出された音声スペクトルを周波数領域で連続した
音声スペクトルに合成し、前記音声識別の結果が音声成
分を含まないと識別された音声スペクトルを用いて前記
ノイズベースを更新するようにした。
音声スペクトルを所定の周波数単位で分割し、周波数分
割された音声スペクトル及び雑音成分のスペクトルであ
るノイズベースに基づいて前記音声スペクトルに音声成
分が含まれているか否か識別し、前記識別の結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成し、前記第一コムフィルタを用い
て前記音声スペクトルの雑音成分を抽出し、前記雑音成
分が抽出された音声スペクトルを周波数領域で連続した
音声スペクトルに合成し、前記音声識別の結果が音声成
分を含まないと識別された音声スペクトルを用いて前記
ノイズベースを更新するようにした。
【0082】この方法によれば、周波数成分単位でスペ
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。
クトル信号の音声非音声を判別して、周波数成分単位で
判別結果に基づいた周波数特性の減衰を行うことによ
り、正確なピッチ情報を得て雑音成分のみを取り出すコ
ムフィルタを作成でき、雑音の特性を抽出することがで
きる。また、コムフィルタの阻止域において雑音成分を
減衰せず、コムフィルタの通過域において雑音成分をノ
イズベースの推定値と乱数を乗算して再構成することに
より良好な雑音分離特性を得ることができる。
【0083】
【発明の実施の形態】本発明の骨子は、音声スペクトル
を周波数領域単位で音声成分のある領域と音声成分のな
い領域に識別して、この識別情報から得られる精度の高
いピッチ周期に基づいて音声情報のみを強調するコムフ
ィルタを周波数領域で生成して雑音を抑圧することであ
る。
を周波数領域単位で音声成分のある領域と音声成分のな
い領域に識別して、この識別情報から得られる精度の高
いピッチ周期に基づいて音声情報のみを強調するコムフ
ィルタを周波数領域で生成して雑音を抑圧することであ
る。
【0084】(実施の形態1)図1は、本発明の実施の
形態1に係る音声処理装置の構成を示すブロック図であ
る。図1において、音声処理装置は、時間分割部101
と、窓掛け部102と、FFT部103と、周波数分割
部104と、ノイズベース推定部105と、音声非音声
識別部106と、コムフィルタ生成部107と、減衰係
数計算部108と、乗算部109と、周波数合成部11
0と、IFFT部111と、から主に構成される。
形態1に係る音声処理装置の構成を示すブロック図であ
る。図1において、音声処理装置は、時間分割部101
と、窓掛け部102と、FFT部103と、周波数分割
部104と、ノイズベース推定部105と、音声非音声
識別部106と、コムフィルタ生成部107と、減衰係
数計算部108と、乗算部109と、周波数合成部11
0と、IFFT部111と、から主に構成される。
【0085】時間分割部101は、入力された音声信号
から所定時間単位で区切られたフレームを構成し、窓掛
け部102に出力する。窓掛け部102は、時間分割部
101から出力されたフレームにハニングウインドウを
利用したウインドウ処理を行ってFFT部103に出力
する。FFT部103は、窓掛け部102から出力され
た音声信号にFFT(Fast Fourier Transform)を行
い、音声スペクトル信号を周波数分割部104に出力す
る。
から所定時間単位で区切られたフレームを構成し、窓掛
け部102に出力する。窓掛け部102は、時間分割部
101から出力されたフレームにハニングウインドウを
利用したウインドウ処理を行ってFFT部103に出力
する。FFT部103は、窓掛け部102から出力され
た音声信号にFFT(Fast Fourier Transform)を行
い、音声スペクトル信号を周波数分割部104に出力す
る。
【0086】周波数分割部104は、FFT部103か
ら出力された音声スペクトルを所定の周波数領域単位の
周波数成分に分割して、各周波数成分毎に音声スペクト
ルをノイズベース推定部105と音声非音声識別部10
6と、乗算部109とに出力する。なお、周波数成分
は、所定の周波数単位で分割された音声スペクトルを示
すものである。
ら出力された音声スペクトルを所定の周波数領域単位の
周波数成分に分割して、各周波数成分毎に音声スペクト
ルをノイズベース推定部105と音声非音声識別部10
6と、乗算部109とに出力する。なお、周波数成分
は、所定の周波数単位で分割された音声スペクトルを示
すものである。
【0087】ノイズベース推定部105は、音声非音声
識別部106からフレームに音声成分が含まれている判
定結果が出力された場合、過去に推定したノイズベース
を音声非音声識別部106に出力する。また、ノイズベ
ース推定部105は、音声非音声識別部106からフレ
ームに音声成分が含まれていない判定結果が出力された
場合、周波数分割部104から出力された音声スペクト
ルの周波数成分毎の短時間パワースペクトルとスペクト
ルの変化の平均量を表す移動平均値を算出して、過去に
算出した移動平均値とパワースペクトルの加重平均値を
とり、新しい移動平均値を算出する。
識別部106からフレームに音声成分が含まれている判
定結果が出力された場合、過去に推定したノイズベース
を音声非音声識別部106に出力する。また、ノイズベ
ース推定部105は、音声非音声識別部106からフレ
ームに音声成分が含まれていない判定結果が出力された
場合、周波数分割部104から出力された音声スペクト
ルの周波数成分毎の短時間パワースペクトルとスペクト
ルの変化の平均量を表す移動平均値を算出して、過去に
算出した移動平均値とパワースペクトルの加重平均値を
とり、新しい移動平均値を算出する。
【0088】具体的には、式(1)を用いて各周波数成
分におけるノイズベースを推定して音声非音声識別部1
06に出力する。 Pbase(n,k)=(1-α(k))・Pbase(n-1,k)+α(k)・S2 f(n-τ,k) …(1) ここで、nは処理を行うフレームを特定する番号、kは
周波数成分周波数成分を特定する番号、τは遅延時間を
示す。また、S2 f(n,k)は、入力された音声信号のパワ
ースペクトル、Pbase(n,k)はノイズベースの移動平均
値、α(k)は移動平均係数を示す。
分におけるノイズベースを推定して音声非音声識別部1
06に出力する。 Pbase(n,k)=(1-α(k))・Pbase(n-1,k)+α(k)・S2 f(n-τ,k) …(1) ここで、nは処理を行うフレームを特定する番号、kは
周波数成分周波数成分を特定する番号、τは遅延時間を
示す。また、S2 f(n,k)は、入力された音声信号のパワ
ースペクトル、Pbase(n,k)はノイズベースの移動平均
値、α(k)は移動平均係数を示す。
【0089】音声非音声識別部106は、周波数分割部
104から出力された音声スペクトル信号とノイズベー
ス推定部105から出力されるノイズベースの値の差が
所定の閾値以上である場合、音声成分を含む有音部分と
判定し、それ以外の場合、音声成分を含まない雑音のみ
の無音部分であると判定する。そして、音声非音声識別
部106は、判定結果をノイズベース推定部105とコ
ムフィルタ生成部107に出力する。
104から出力された音声スペクトル信号とノイズベー
ス推定部105から出力されるノイズベースの値の差が
所定の閾値以上である場合、音声成分を含む有音部分と
判定し、それ以外の場合、音声成分を含まない雑音のみ
の無音部分であると判定する。そして、音声非音声識別
部106は、判定結果をノイズベース推定部105とコ
ムフィルタ生成部107に出力する。
【0090】コムフィルタ生成部107は、各周波数成
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して、このコムフィルタを減衰
係数計算部108に出力する。具体的には、コムフィル
タ生成部107は、コムフィルタの有音部分の周波数成
分をオン、無音部分の周波数成分をオフにする。
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して、このコムフィルタを減衰
係数計算部108に出力する。具体的には、コムフィル
タ生成部107は、コムフィルタの有音部分の周波数成
分をオン、無音部分の周波数成分をオフにする。
【0091】減衰係数計算部108は、コムフィルタ生
成部107において生成されたコムフィルタに、周波数
特性に基づいた減衰係数を乗算して、各周波数成分毎に
入力信号の減衰係数の設定を行い、各周波数成分の減衰
係数を乗算部109に出力する。
成部107において生成されたコムフィルタに、周波数
特性に基づいた減衰係数を乗算して、各周波数成分毎に
入力信号の減衰係数の設定を行い、各周波数成分の減衰
係数を乗算部109に出力する。
【0092】例えば、以下の式(2)から減衰係数gain
(k)を算出して入力信号に乗算することもできる。 gain(k)=gc・k/HB …(2) ここでgcは定数、kはビンを特定する変数、HBは、FF
T変換長つまり高速フーリエ変換を行うデータ数であ
る。
(k)を算出して入力信号に乗算することもできる。 gain(k)=gc・k/HB …(2) ここでgcは定数、kはビンを特定する変数、HBは、FF
T変換長つまり高速フーリエ変換を行うデータ数であ
る。
【0093】乗算部109は、周波数分割部104から
出力された音声スペクトルに減衰係数計算部108から
出力された減衰係数を周波数成分単位で乗算する。そし
て、乗算の結果得られたスペクトルを周波数合成部11
0に出力する。
出力された音声スペクトルに減衰係数計算部108から
出力された減衰係数を周波数成分単位で乗算する。そし
て、乗算の結果得られたスペクトルを周波数合成部11
0に出力する。
【0094】周波数合成部110は、乗算部109から
出力された周波数成分単位のスペクトルを所定の処理時
間単位で周波数領域で連続する音声スペクトルに合成し
てIFFT部111に出力する。IFFT部111は、
周波数合成部110から出力された音声スペクトルにI
FFT(Inverse Fast Fourier Transform)を行っ
て音声信号に変換した信号を出力する。
出力された周波数成分単位のスペクトルを所定の処理時
間単位で周波数領域で連続する音声スペクトルに合成し
てIFFT部111に出力する。IFFT部111は、
周波数合成部110から出力された音声スペクトルにI
FFT(Inverse Fast Fourier Transform)を行っ
て音声信号に変換した信号を出力する。
【0095】次に、上記構成を有する音声処理装置の動
作について図2に示すフロー図を用いて説明する。図2
において、ステップ(以下「ST」という)201で
は、入力信号に前処理を行う。この場合、前処理とは、
入力信号から所定の時間単位のフレームを構成して窓か
け処理を行い、音声スペクトルに高速フーリエ変換を行
うことである。
作について図2に示すフロー図を用いて説明する。図2
において、ステップ(以下「ST」という)201で
は、入力信号に前処理を行う。この場合、前処理とは、
入力信号から所定の時間単位のフレームを構成して窓か
け処理を行い、音声スペクトルに高速フーリエ変換を行
うことである。
【0096】ST202では、周波数分割部104が音
声スペクトルを周波数成分に分割する。ST203で
は、ノイズベース推定部105が、α(k)=0であるか否
か、つまりノイズベース更新を停止するか否かを判断し
て、α(k)=0の場合、ST205に進み、α(k)=0でない
場合、ST204に進む。
声スペクトルを周波数成分に分割する。ST203で
は、ノイズベース推定部105が、α(k)=0であるか否
か、つまりノイズベース更新を停止するか否かを判断し
て、α(k)=0の場合、ST205に進み、α(k)=0でない
場合、ST204に進む。
【0097】ST204では、ノイズベース推定部10
5が音声成分の含まれていない音声スペクトルからノイ
ズベースを更新し、その後ST205に進む。ST20
5では、音声非音声識別部106が、Sf 2(n,k)>Qup・
Pbase(n,k)であるか否か、つまり音声スペクトルのパ
ワーがノイズベースに所定の閾値を乗算した値より大き
いか否かを判断し、Sf 2(n,k)>Qup・Pbase(n,k)であ
る場合、ST206に進み、Sf 2(n,k)>Qup・P
base(n,k)でない場合、ST208に進む。
5が音声成分の含まれていない音声スペクトルからノイ
ズベースを更新し、その後ST205に進む。ST20
5では、音声非音声識別部106が、Sf 2(n,k)>Qup・
Pbase(n,k)であるか否か、つまり音声スペクトルのパ
ワーがノイズベースに所定の閾値を乗算した値より大き
いか否かを判断し、Sf 2(n,k)>Qup・Pbase(n,k)であ
る場合、ST206に進み、Sf 2(n,k)>Qup・P
base(n,k)でない場合、ST208に進む。
【0098】ST206では、音声非音声識別部106
が、ノイズベース更新停止を示すα(k)=0を設定する。
ST207では、コムフィルタ生成部107が、音声ス
ペクトルを減衰せずに出力することを示すSP_SWITCH(k)
=ONを設定して、ST211に進む。ST208では、
音声非音声識別部106が、Sf 2(n,k)<Qdown・Pba se
(n,k)であるか否か、つまり音声スペクトルのパワーが
ノイズベースに所定の閾値を乗算した値より小さいか否
かを判断し、Sf 2(n,k)<Qdown・Pbase(n,k)である場
合、ST209に進み、Sf 2(n,k)<Qdown・Pbase(n,
k)でない場合、ST211に進む。
が、ノイズベース更新停止を示すα(k)=0を設定する。
ST207では、コムフィルタ生成部107が、音声ス
ペクトルを減衰せずに出力することを示すSP_SWITCH(k)
=ONを設定して、ST211に進む。ST208では、
音声非音声識別部106が、Sf 2(n,k)<Qdown・Pba se
(n,k)であるか否か、つまり音声スペクトルのパワーが
ノイズベースに所定の閾値を乗算した値より小さいか否
かを判断し、Sf 2(n,k)<Qdown・Pbase(n,k)である場
合、ST209に進み、Sf 2(n,k)<Qdown・Pbase(n,
k)でない場合、ST211に進む。
【0099】ST209では、音声非音声識別部106
が、ノイズベース更新を示すα(k)=SLOWを設定する。こ
こで、SLOWは所定の定数である。ST210では、コム
フィルタ生成部107が音声スペクトルを減衰して出力
することを示すSP_SWITCH(k)=OFFを設定して、ST
211に進む。
が、ノイズベース更新を示すα(k)=SLOWを設定する。こ
こで、SLOWは所定の定数である。ST210では、コム
フィルタ生成部107が音声スペクトルを減衰して出力
することを示すSP_SWITCH(k)=OFFを設定して、ST
211に進む。
【0100】ST211では、減衰係数計算部108
が、音声スペクトルを減衰しないか減衰か、つまりSP_S
WITCH(k)=ONであるか否かを判断する。ST211にお
いてSP_SWITCH(k)=ONである場合、ST212では、減
衰係数計算部108が減衰係数を1に設定し、ST21
4に進む。ST211においてSP_SWITCH(k)=ONでない
場合、ST213では、減衰係数計算部108が周波数
に応じた減衰係数を計算して設定し、ST214に進
む。
が、音声スペクトルを減衰しないか減衰か、つまりSP_S
WITCH(k)=ONであるか否かを判断する。ST211にお
いてSP_SWITCH(k)=ONである場合、ST212では、減
衰係数計算部108が減衰係数を1に設定し、ST21
4に進む。ST211においてSP_SWITCH(k)=ONでない
場合、ST213では、減衰係数計算部108が周波数
に応じた減衰係数を計算して設定し、ST214に進
む。
【0101】ST214では、乗算部109が周波数分
割部104から出力された音声スペクトルに減衰係数計
算部108から出力された減衰係数を周波数成分単位で
乗算する。ST215では、周波数合成部110が乗算
部109から出力された周波数成分単位のスペクトルを
所定の処理時間単位で周波数領域で連続する音声スペク
トルに合成する。ST216では、IFFT部111
が、周波数合成部110から出力された音声スペクトル
にIFFTを行って雑音を抑圧した信号を出力する。
割部104から出力された音声スペクトルに減衰係数計
算部108から出力された減衰係数を周波数成分単位で
乗算する。ST215では、周波数合成部110が乗算
部109から出力された周波数成分単位のスペクトルを
所定の処理時間単位で周波数領域で連続する音声スペク
トルに合成する。ST216では、IFFT部111
が、周波数合成部110から出力された音声スペクトル
にIFFTを行って雑音を抑圧した信号を出力する。
【0102】次に、本実施の形態の音声処理装置で用い
るコムフィルタについて説明する。図3は、本実施の形
態にかかる音声処理装置で作成されるコムフィルタの例
を示す図である。図3において、縦軸はスペクトルのパ
ワ及び、フィルタの減衰度を示し、横軸は周波数を示
す。
るコムフィルタについて説明する。図3は、本実施の形
態にかかる音声処理装置で作成されるコムフィルタの例
を示す図である。図3において、縦軸はスペクトルのパ
ワ及び、フィルタの減衰度を示し、横軸は周波数を示
す。
【0103】コムフィルタは、S1に示す減衰特性を持
ち、減衰特性は、周波数成分毎に設定される。コムフィ
ルタ生成部107は、音声成分を含まない周波数領域の
信号を減衰し、音声信号を含む周波数領域の信号を減衰
しない減衰特性のコムフィルタを作成する。
ち、減衰特性は、周波数成分毎に設定される。コムフィ
ルタ生成部107は、音声成分を含まない周波数領域の
信号を減衰し、音声信号を含む周波数領域の信号を減衰
しない減衰特性のコムフィルタを作成する。
【0104】雑音成分を含む音声スペクトルS2は、S
1の減衰特性を持つコムフィルタをかけることにより、
雑音成分を含む周波数領域の信号が減衰されてパワが小
さくなり、音声信号を含む部分は減衰されずパワが変化
しない。得られた音声スペクトルは、雑音成分の周波数
領域がより低くなりピークが失われずに強調されたスペ
クトル形状となり、ピッチ調波情報が失われない雑音を
抑圧した音声スペクトルS3が出力される。
1の減衰特性を持つコムフィルタをかけることにより、
雑音成分を含む周波数領域の信号が減衰されてパワが小
さくなり、音声信号を含む部分は減衰されずパワが変化
しない。得られた音声スペクトルは、雑音成分の周波数
領域がより低くなりピークが失われずに強調されたスペ
クトル形状となり、ピッチ調波情報が失われない雑音を
抑圧した音声スペクトルS3が出力される。
【0105】このように、本発明の実施の形態1に係る
音声処理装置によれば、周波数成分単位でスペクトル信
号の音声非音声を判別して、周波数成分単位で判別結果
に基づいた周波数特性の減衰を行うことにより、正確な
ピッチ情報を得ることができるので、大きな減衰で雑音
抑圧を行っても音声歪の少ない音声強調を行うことがで
きる。
音声処理装置によれば、周波数成分単位でスペクトル信
号の音声非音声を判別して、周波数成分単位で判別結果
に基づいた周波数特性の減衰を行うことにより、正確な
ピッチ情報を得ることができるので、大きな減衰で雑音
抑圧を行っても音声歪の少ない音声強調を行うことがで
きる。
【0106】また、音声識別において2つの閾値を設け
ることにより、精度の高い音声非音声を判別することが
できる。
ることにより、精度の高い音声非音声を判別することが
できる。
【0107】なお、減衰係数計算部108において、雑
音の周波数特性に応じた減衰係数の計算を行うことによ
り、高い周波数にある子音を損なわずに音声強調を行う
こともできる。
音の周波数特性に応じた減衰係数の計算を行うことによ
り、高い周波数にある子音を損なわずに音声強調を行う
こともできる。
【0108】また、各周波数成分において入力信号の減
衰を二値で行い、音声と判別する場合、減衰を行わず、
雑音と判別する場合、減衰を行うこともできる。この場
合、強い雑音抑圧を行っても音声のある周波数成分は減
衰されないので音声の歪の少ない音声強調を行うことが
できる。
衰を二値で行い、音声と判別する場合、減衰を行わず、
雑音と判別する場合、減衰を行うこともできる。この場
合、強い雑音抑圧を行っても音声のある周波数成分は減
衰されないので音声の歪の少ない音声強調を行うことが
できる。
【0109】(実施の形態2)図4は、実施の形態2に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
【0110】図4の音声処理装置は、ノイズ区間判別部
401とノイズベース追跡部402と、を具備してフレ
ーム単位で信号の音声非音声判別を行い、ノイズレベル
の急激な変化を検出して、速やかにノイズベースを推定
して更新する点が図1と異なる。
401とノイズベース追跡部402と、を具備してフレ
ーム単位で信号の音声非音声判別を行い、ノイズレベル
の急激な変化を検出して、速やかにノイズベースを推定
して更新する点が図1と異なる。
【0111】図4において、FFT部103は、窓掛け
部102から出力された音声信号にFFT(Fast Four
ier Transform)を行い、音声スペクトルを周波数分割
部104とノイズ区間判別部401に出力する。
部102から出力された音声信号にFFT(Fast Four
ier Transform)を行い、音声スペクトルを周波数分割
部104とノイズ区間判別部401に出力する。
【0112】ノイズ区間判別部401は、FFT部10
3から出力された音声スペクトルからフレーム単位で信
号のパワーと移動平均値を算出して、入力信号のパワー
の変化率からフレームが音声を含むか否か判別する。
3から出力された音声スペクトルからフレーム単位で信
号のパワーと移動平均値を算出して、入力信号のパワー
の変化率からフレームが音声を含むか否か判別する。
【0113】具体的には、ノイズ区間判別部401は、
以下の式(3)及び式(4)を用いて入力信号のパワー
の変化率を算出する。 Ratio=P(n-τ)/P(n) …(4) ここで、P(n)は、1フレームの信号パワー、S2 f(n,k)
は、入力信号パワースペクトル、Ratioは、過去に処理
を行ったフレームと処理を行うフレームの信号パワー
比、τは遅延時間である。
以下の式(3)及び式(4)を用いて入力信号のパワー
の変化率を算出する。 Ratio=P(n-τ)/P(n) …(4) ここで、P(n)は、1フレームの信号パワー、S2 f(n,k)
は、入力信号パワースペクトル、Ratioは、過去に処理
を行ったフレームと処理を行うフレームの信号パワー
比、τは遅延時間である。
【0114】ノイズ区間判別部401は、Ratioがあら
かじめ設定した閾値を一定時間連続して超えた場合、入
力信号を音声信号と判断し、連続して超えない場合をノ
イズ区間と判断する。
かじめ設定した閾値を一定時間連続して超えた場合、入
力信号を音声信号と判断し、連続して超えない場合をノ
イズ区間と判断する。
【0115】ノイズベース追跡部402は、音声区間か
らノイズ区間に移ったと判断した場合、所定のフレーム
数の処理を行う間、ノイズベースの更新における処理フ
レームからノイズベースの推定する影響の度合いを大き
くする。
らノイズ区間に移ったと判断した場合、所定のフレーム
数の処理を行う間、ノイズベースの更新における処理フ
レームからノイズベースの推定する影響の度合いを大き
くする。
【0116】具体的には式(1)においてα(k)=FAST、
(0<SLOW<FAST<1)に設定する。α(k)の値が大き
いほど、移動平均値が入力された音声信号の影響を受け
やすくなり、ノイズベースの急激な変化に対応すること
ができる。
(0<SLOW<FAST<1)に設定する。α(k)の値が大き
いほど、移動平均値が入力された音声信号の影響を受け
やすくなり、ノイズベースの急激な変化に対応すること
ができる。
【0117】ノイズベース推定部105は、音声非音声
識別部106又はノイズベース追跡部402からフレー
ムに音声成分が含まれていない判定結果が出力された場
合、周波数分割部104から出力された音声スペクトル
の周波数成分毎の短時間パワースペクトルとスペクトル
の変化の平均量を表す移動平均値を算出して、これらの
値から各周波数成分におけるノイズベースを推定して音
声非音声識別部106に出力する。
識別部106又はノイズベース追跡部402からフレー
ムに音声成分が含まれていない判定結果が出力された場
合、周波数分割部104から出力された音声スペクトル
の周波数成分毎の短時間パワースペクトルとスペクトル
の変化の平均量を表す移動平均値を算出して、これらの
値から各周波数成分におけるノイズベースを推定して音
声非音声識別部106に出力する。
【0118】このように、本発明の実施の形態2に係る
音声処理装置によれば、入力された信号から推定した雑
音スペクトルの値を大きく反映させてノイズベースの更
新を行うことにより、ノイズレベルの急激な変化に対応
したノイズベースの更新を行うことができ、音声歪の少
ない音声強調を行うことができる。
音声処理装置によれば、入力された信号から推定した雑
音スペクトルの値を大きく反映させてノイズベースの更
新を行うことにより、ノイズレベルの急激な変化に対応
したノイズベースの更新を行うことができ、音声歪の少
ない音声強調を行うことができる。
【0119】(実施の形態3)図5は、実施の形態3に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
【0120】図5の音声処理装置は、ミュジカルノイズ
抑制部501とコムフィルタ修正部502を具備してフ
レームに突発性ノイズが含まれる場合に、生成されたコ
ムフィルタを修正して突発性ノイズに起因するミュジカ
ルノイズの発生を抑圧する点が、図1と異なる。
抑制部501とコムフィルタ修正部502を具備してフ
レームに突発性ノイズが含まれる場合に、生成されたコ
ムフィルタを修正して突発性ノイズに起因するミュジカ
ルノイズの発生を抑圧する点が、図1と異なる。
【0121】図5において、コムフィルタ生成部107
は、各周波数成分における音声成分の有無に基づいてピ
ッチ調波を強調するコムフィルタを生成してミュジカル
ノイズ抑制部501、及びコムフィルタ修正部502に
出力する。
は、各周波数成分における音声成分の有無に基づいてピ
ッチ調波を強調するコムフィルタを生成してミュジカル
ノイズ抑制部501、及びコムフィルタ修正部502に
出力する。
【0122】ミュジカルノイズ抑制部501は、コムフ
ィルタ生成部107から出力されたコムフィルタの各周
波数成分の状態の中でオン、つまり信号を減衰せずに出
力する状態の数が一定の閾値以下である場合、フレーム
に突発性ノイズが含まれていると判断し、判断結果をコ
ムフィルタ修正部502に出力する。
ィルタ生成部107から出力されたコムフィルタの各周
波数成分の状態の中でオン、つまり信号を減衰せずに出
力する状態の数が一定の閾値以下である場合、フレーム
に突発性ノイズが含まれていると判断し、判断結果をコ
ムフィルタ修正部502に出力する。
【0123】例えば、以下の式(5)を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値(例えば10)より小さい場合、ミュ
ジカルノイズが発生していると判断する。 コムフィルタ修正部502は、ミュジカルノイズ抑制部
501からフレームに突発性ノイズが含まれるコムフィ
ルタ生成部107から出力されたコムフィルタの生成結
果に基づいてコムフィルタにミュジカルノイズの発生を
防ぐ修正を行い、減衰係数計算部108にコムフィルタ
を出力する。
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値(例えば10)より小さい場合、ミュ
ジカルノイズが発生していると判断する。 コムフィルタ修正部502は、ミュジカルノイズ抑制部
501からフレームに突発性ノイズが含まれるコムフィ
ルタ生成部107から出力されたコムフィルタの生成結
果に基づいてコムフィルタにミュジカルノイズの発生を
防ぐ修正を行い、減衰係数計算部108にコムフィルタ
を出力する。
【0124】具体的には、コムフィルタのすべての周波
数成分の状態をオフつまり信号を減衰して出力する状態
に設定してコムフィルタを減衰係数計算部108に出力
する。
数成分の状態をオフつまり信号を減衰して出力する状態
に設定してコムフィルタを減衰係数計算部108に出力
する。
【0125】減衰係数計算部108は、コムフィルタ修
正部502から出力されたコムフィルタに周波数特性に
基づいた減衰係数を乗算して、各周波数成分毎に入力信
号の減衰係数の設定を行い、各周波数成分の減衰係数を
乗算部109に出力する。
正部502から出力されたコムフィルタに周波数特性に
基づいた減衰係数を乗算して、各周波数成分毎に入力信
号の減衰係数の設定を行い、各周波数成分の減衰係数を
乗算部109に出力する。
【0126】このように、本発明の実施の形態3に係る
音声処理装置によれば、コムフィルタの生成結果からミ
ュジカルノイズ発生を判断することにより、ノイズが音
声信号と誤判断されることを防ぎ、音声歪の少ない音声
強調を行うことができる。
音声処理装置によれば、コムフィルタの生成結果からミ
ュジカルノイズ発生を判断することにより、ノイズが音
声信号と誤判断されることを防ぎ、音声歪の少ない音声
強調を行うことができる。
【0127】なお、実施の形態3は、実施の形態2と組
み合わせることができる。すなわち、図5の音声処理装
置にノイズ区間判別部401及びノイズベース追跡部4
02を追加することにより実施の形態2の効果も得るこ
とができる。
み合わせることができる。すなわち、図5の音声処理装
置にノイズ区間判別部401及びノイズベース追跡部4
02を追加することにより実施の形態2の効果も得るこ
とができる。
【0128】(実施の形態4)図6は、実施の形態4に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。図6の音声処理装置
は、平均値計算部601を具備し、周波数成分単位で音
声スペクトルのパワの平均値を求める点が、図1と異な
る。
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。図6の音声処理装置
は、平均値計算部601を具備し、周波数成分単位で音
声スペクトルのパワの平均値を求める点が、図1と異な
る。
【0129】図6において、周波数分割部104は、F
FT部103から出力された音声スペクトルを所定の周
波数単位で分割された音声スペクトルを示す周波数成分
に分割して、各周波数成分毎に音声スペクトルを音声非
音声識別部106と、乗算部109と、平均値計算部6
01に出力する。
FT部103から出力された音声スペクトルを所定の周
波数単位で分割された音声スペクトルを示す周波数成分
に分割して、各周波数成分毎に音声スペクトルを音声非
音声識別部106と、乗算部109と、平均値計算部6
01に出力する。
【0130】平均値計算部601は、周波数分割部10
4から出力された音声スペクトルのパワについて、近辺
の周波数成分との平均値及び過去に処理したフレームと
の平均値をとり、得られた平均値をノイズベース推定部
105と音声非音声識別部106に出力する。
4から出力された音声スペクトルのパワについて、近辺
の周波数成分との平均値及び過去に処理したフレームと
の平均値をとり、得られた平均値をノイズベース推定部
105と音声非音声識別部106に出力する。
【0131】具体的には、以下に示す式(6)を用いて
音声スペクトルの平均値を算出する。 ここで、k1、k2は周波数成分を示し、k1<k<k2であ
る。n1は過去に処理を行ったフレームを示す番号、nは
処理を行うフレームを示す番号を示す。
音声スペクトルの平均値を算出する。 ここで、k1、k2は周波数成分を示し、k1<k<k2であ
る。n1は過去に処理を行ったフレームを示す番号、nは
処理を行うフレームを示す番号を示す。
【0132】ノイズベース推定部105は、音声非音声
識別部106からフレームに音声成分が含まれていない
判定結果が出力された場合、平均値計算部601から出
力された音声スペクトルの平均値の周波数成分毎に短時
間パワースペクトルとスペクトルの変化の平均量を表す
移動平均値を算出して、各周波数成分におけるノイズベ
ースを推定して音声非音声識別部106に出力する。
識別部106からフレームに音声成分が含まれていない
判定結果が出力された場合、平均値計算部601から出
力された音声スペクトルの平均値の周波数成分毎に短時
間パワースペクトルとスペクトルの変化の平均量を表す
移動平均値を算出して、各周波数成分におけるノイズベ
ースを推定して音声非音声識別部106に出力する。
【0133】音声非音声識別部106は、平均値計算部
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
【0134】このように、本発明の実施の形態4に係る
音声処理装置によれば、各周波数成分における音声スペ
クトルのパワ平均値又は過去に処理を行ったフレームと
処理を行うフレームのパワ平均値を求めることにより、
突発性雑音成分の影響は小さくなり、より正確なコムフ
ィルタを構成することができる。
音声処理装置によれば、各周波数成分における音声スペ
クトルのパワ平均値又は過去に処理を行ったフレームと
処理を行うフレームのパワ平均値を求めることにより、
突発性雑音成分の影響は小さくなり、より正確なコムフ
ィルタを構成することができる。
【0135】なお、実施の形態4は、実施の形態2ある
いは実施の形態3と組み合わせることができる。すなわ
ち、図5の音声処理装置にノイズ区間判別部401及び
ノイズベース追跡部402を追加することにより実施の
形態2の効果も得ることができ、図6の音声処理装置に
ミュジカルノイズ抑制部501及びコムフィルタ修正部
502を追加することにより実施の形態3の効果も得る
ことができる。
いは実施の形態3と組み合わせることができる。すなわ
ち、図5の音声処理装置にノイズ区間判別部401及び
ノイズベース追跡部402を追加することにより実施の
形態2の効果も得ることができ、図6の音声処理装置に
ミュジカルノイズ抑制部501及びコムフィルタ修正部
502を追加することにより実施の形態3の効果も得る
ことができる。
【0136】(実施の形態5)図7は、実施の形態5に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
【0137】図7の音声処理装置は、区間判別部701
とコムフィルタリセット部702を具備し、音声成分を
含まないフレームに対して全周波数成分で減衰を行うコ
ムフィルタを生成する点が、図1と異なる。
とコムフィルタリセット部702を具備し、音声成分を
含まないフレームに対して全周波数成分で減衰を行うコ
ムフィルタを生成する点が、図1と異なる。
【0138】図7において、FFT部103は、窓掛け
部102から出力された音声信号にFFTを行い、音声
スペクトル信号を周波数分割部104と区間判別部70
1に出力する。
部102から出力された音声信号にFFTを行い、音声
スペクトル信号を周波数分割部104と区間判別部70
1に出力する。
【0139】区間判別部701は、FFT部103から
出力された音声スペクトルが音声を含むか否か判断して
判断結果をコムフィルタリセット部702に出力する。
出力された音声スペクトルが音声を含むか否か判断して
判断結果をコムフィルタリセット部702に出力する。
【0140】コムフィルタリセット部702は、区間判
別部701から出力された判断結果に基づいて、音声ス
ペクトルが音声成分を含まないノイズ成分のみと判断さ
れた場合、コムフィルタ生成部107にすべての周波数
成分のコムフィルタをオフにする指示を出力する。
別部701から出力された判断結果に基づいて、音声ス
ペクトルが音声成分を含まないノイズ成分のみと判断さ
れた場合、コムフィルタ生成部107にすべての周波数
成分のコムフィルタをオフにする指示を出力する。
【0141】コムフィルタ生成部107は、各周波数成
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して減衰係数計算部108に出
力する。また、コムフィルタ生成部107は、コムフィ
ルタリセット部702の指示に従い音声スペクトルが音
声成分を含まないノイズ成分のみと判断された場合に、
すべての周波数成分でオフにしたコムフィルタを生成し
て減衰係数計算部108に出力する。
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して減衰係数計算部108に出
力する。また、コムフィルタ生成部107は、コムフィ
ルタリセット部702の指示に従い音声スペクトルが音
声成分を含まないノイズ成分のみと判断された場合に、
すべての周波数成分でオフにしたコムフィルタを生成し
て減衰係数計算部108に出力する。
【0142】このように、本発明の実施の形態5に係る
音声処理装置によれば、音声成分を含まないフレームに
全周波数成分で減衰を行い、音声を含まない信号区間で
ノイズを全帯域でカットすることにより、音声抑圧処理
に起因するノイズの発生を防ぐことができるので、音声
歪の少ない音声強調を行うことができる。
音声処理装置によれば、音声成分を含まないフレームに
全周波数成分で減衰を行い、音声を含まない信号区間で
ノイズを全帯域でカットすることにより、音声抑圧処理
に起因するノイズの発生を防ぐことができるので、音声
歪の少ない音声強調を行うことができる。
【0143】なお、実施の形態5は、実施の形態2ある
いは実施の形態3と組み合わせることができる。
いは実施の形態3と組み合わせることができる。
【0144】すなわち、図7の音声処理装置にノイズ区
間判別部401及びノイズベース追跡部402を追加す
ることにより実施の形態2の効果も得ることができ、図
7の音声処理装置にミュジカルノイズ抑制部501及び
コムフィルタ修正部502を追加することにより実施の
形態3の効果も得ることができる。
間判別部401及びノイズベース追跡部402を追加す
ることにより実施の形態2の効果も得ることができ、図
7の音声処理装置にミュジカルノイズ抑制部501及び
コムフィルタ修正部502を追加することにより実施の
形態3の効果も得ることができる。
【0145】また、実施の形態5は、実施の形態4と組
み合わせることができる。すなわち、図7の音声処理装
置に平均値計算部601を追加することにより実施の形
態4の効果も得ることができる。
み合わせることができる。すなわち、図7の音声処理装
置に平均値計算部601を追加することにより実施の形
態4の効果も得ることができる。
【0146】この場合、周波数分割部104は、FFT
部103から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部106と、乗算部109と、平均値計算部601
に出力する。
部103から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部106と、乗算部109と、平均値計算部601
に出力する。
【0147】音声非音声識別部106は、平均値計算部
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
【0148】(実施の形態6)図8は、実施の形態6に
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
かかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
【0149】図8の音声処理装置は、音声ピッチ周期推
定部801と音声ピッチ修復部802を具備し、音声と
ノイズの判定が難しい周波数領域でノイズと判断されて
失われるピッチ調波情報を補う点が、図1と異なる。
定部801と音声ピッチ修復部802を具備し、音声と
ノイズの判定が難しい周波数領域でノイズと判断されて
失われるピッチ調波情報を補う点が、図1と異なる。
【0150】図8において、周波数分割部104は、F
FT部103から出力された音声スペクトルを所定の周
波数単位で分割された音声スペクトルを示す周波数成分
に分割して、各周波数成分毎に音声スペクトルをノイズ
ベース推定部105と音声非音声識別部106と、乗算
部109と、音声ピッチ周期推定部801と、音声ピッ
チ修復部802に出力する。
FT部103から出力された音声スペクトルを所定の周
波数単位で分割された音声スペクトルを示す周波数成分
に分割して、各周波数成分毎に音声スペクトルをノイズ
ベース推定部105と音声非音声識別部106と、乗算
部109と、音声ピッチ周期推定部801と、音声ピッ
チ修復部802に出力する。
【0151】コムフィルタ生成部107は、各周波数成
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して音声ピッチ周期推定部80
1、及び音声ピッチ修復部802に出力する。
分における音声成分の有無に基づいてピッチ調波を強調
するコムフィルタを生成して音声ピッチ周期推定部80
1、及び音声ピッチ修復部802に出力する。
【0152】音声ピッチ周期推定部801は、コムフィ
ルタ生成部107から出力されたコムフィルタと周波数
分割部104から出力された音声スペクトルからピッチ
周期を推定し、推定結果を音声ピッチ修復部802に出
力する。
ルタ生成部107から出力されたコムフィルタと周波数
分割部104から出力された音声スペクトルからピッチ
周期を推定し、推定結果を音声ピッチ修復部802に出
力する。
【0153】例えば、生成されたコムフィルタの中でオ
ンの状態が連続せずに一つの周波数成分をオフにする。
次に、コムフィルタの中でパワーの大きい周波数成分を
二本抽出したピッチ周期推定用コムフィルタを生成し
て、以下に示す自己相関関数の式(7)からピッチ周期
を求める。 ここで、PITCH(k)は、ピッチ周期推定用コムフィルタの
状態を表し、k1は周波数の上限、τはピッチの周期を表
し、τは、0からピッチの最大周期であるτ1までの値
をとる。
ンの状態が連続せずに一つの周波数成分をオフにする。
次に、コムフィルタの中でパワーの大きい周波数成分を
二本抽出したピッチ周期推定用コムフィルタを生成し
て、以下に示す自己相関関数の式(7)からピッチ周期
を求める。 ここで、PITCH(k)は、ピッチ周期推定用コムフィルタの
状態を表し、k1は周波数の上限、τはピッチの周期を表
し、τは、0からピッチの最大周期であるτ1までの値
をとる。
【0154】式(7)のγ(τ)が最大値をとるτをピ
ッチ周期として求める。実際には、高周波数領域におい
て周波数ピッチの形状は、不明確になりやすいのでk1に
中間の周波数の値を用いる。例えば、k1=2kHzと設定す
る。また、PITCH(k)の取りうる値を0と1にすることに
より式(7)の計算を簡単に行うこともできる。
ッチ周期として求める。実際には、高周波数領域におい
て周波数ピッチの形状は、不明確になりやすいのでk1に
中間の周波数の値を用いる。例えば、k1=2kHzと設定す
る。また、PITCH(k)の取りうる値を0と1にすることに
より式(7)の計算を簡単に行うこともできる。
【0155】音声ピッチ修復部802は、音声ピッチ周
期推定部801から出力された推定結果に基づいてコム
フィルタの修正を行い、減衰係数計算部108に出力す
る。具体的には、推定されたピッチ周期情報に基づいて
一定の周波数成分毎にピッチを補う、又はピッチ周期毎
に存在するコムフィルタがオンになった周波数成分の連
続である櫛状の帯域の幅を広げるなどの処理を行い、ピ
ッチ調波構造の修復を行う。
期推定部801から出力された推定結果に基づいてコム
フィルタの修正を行い、減衰係数計算部108に出力す
る。具体的には、推定されたピッチ周期情報に基づいて
一定の周波数成分毎にピッチを補う、又はピッチ周期毎
に存在するコムフィルタがオンになった周波数成分の連
続である櫛状の帯域の幅を広げるなどの処理を行い、ピ
ッチ調波構造の修復を行う。
【0156】減衰係数計算部108は、音声ピッチ修復
部802から出力されたコムフィルタに周波数特性に基
づいた減衰係数を乗算して、各周波数成分毎に入力信号
の減衰係数の設定を行い、各周波数成分の減衰係数を乗
算部109に出力する。
部802から出力されたコムフィルタに周波数特性に基
づいた減衰係数を乗算して、各周波数成分毎に入力信号
の減衰係数の設定を行い、各周波数成分の減衰係数を乗
算部109に出力する。
【0157】図9に、本実施の形態にかかる音声処理装
置におけるコムフィルタの修復の例を示す。図9におい
て、縦軸は減衰度を示し、横軸は、周波数成分を示す。
具体的には、横軸には、256の周波数成分があり、0k
Hzから4kHzの領域を示す。
置におけるコムフィルタの修復の例を示す。図9におい
て、縦軸は減衰度を示し、横軸は、周波数成分を示す。
具体的には、横軸には、256の周波数成分があり、0k
Hzから4kHzの領域を示す。
【0158】C1は生成されたコムフィルタを、C2は
コムフィルタC1にピッチの修復を行ったコムフィルタ
を、C3は、コムフィルタC2にピッチの幅を修正した
コムフィルタを示す。
コムフィルタC1にピッチの修復を行ったコムフィルタ
を、C3は、コムフィルタC2にピッチの幅を修正した
コムフィルタを示す。
【0159】コムフィルタC1は、100から140ま
での周波数成分でピッチ情報が失われている。音声ピッ
チ修復部802は、音声ピッチ周期推定部801におい
て推定されたピッチ周期情報に基づいてコムフィルタC
1の100から140までの周波数成分にあるピッチ情
報を補う。これによりコムフィルタC2が得られる。
での周波数成分でピッチ情報が失われている。音声ピッ
チ修復部802は、音声ピッチ周期推定部801におい
て推定されたピッチ周期情報に基づいてコムフィルタC
1の100から140までの周波数成分にあるピッチ情
報を補う。これによりコムフィルタC2が得られる。
【0160】次に、音声ピッチ修復部802は、周波数
分割部104から出力された音声スペクトルに基づいて
コムフィルタC2のピッチ調波の幅を修正する。これに
よりコムフィルタC3が得られる。
分割部104から出力された音声スペクトルに基づいて
コムフィルタC2のピッチ調波の幅を修正する。これに
よりコムフィルタC3が得られる。
【0161】このように、本発明の実施の形態6に係る
音声処理装置によれば、ピッチ周期情報を推定して、ノ
イズと判別されて失われたピッチ調波情報を補うことに
より、原音声に近い音声の状態で、かつ音声歪の少ない
音声強調を行うことができる。
音声処理装置によれば、ピッチ周期情報を推定して、ノ
イズと判別されて失われたピッチ調波情報を補うことに
より、原音声に近い音声の状態で、かつ音声歪の少ない
音声強調を行うことができる。
【0162】なお、実施の形態6は、実施の形態2ある
いは実施の形態5と組み合わせることができる。
いは実施の形態5と組み合わせることができる。
【0163】すなわち、図8の音声処理装置にノイズ区
間判別部401及びノイズベース追跡部402を追加す
ることにより実施の形態2の効果も得ることができ、図
8の音声処理装置に区間判別部701及び、コムフィル
タリセット部702を追加することにより実施の形態5
の効果も得ることができる。
間判別部401及びノイズベース追跡部402を追加す
ることにより実施の形態2の効果も得ることができ、図
8の音声処理装置に区間判別部701及び、コムフィル
タリセット部702を追加することにより実施の形態5
の効果も得ることができる。
【0164】また、実施の形態6は、実施の形態3と組
み合わせることができる。すなわち、図8の音声処理装
置にミュジカルノイズ抑制部501及びコムフィルタ修
正部502を追加することにより実施の形態3の効果も
得ることができる。
み合わせることができる。すなわち、図8の音声処理装
置にミュジカルノイズ抑制部501及びコムフィルタ修
正部502を追加することにより実施の形態3の効果も
得ることができる。
【0165】この場合、ミュジカルノイズ抑制部501
は、コムフィルタ生成部107から出力されたコムフィ
ルタの各周波数成分の中でオン、つまり信号を減衰せず
に出力する状態の数が一定の閾値以下である場合、フレ
ームに突発性ノイズが含まれていると判断し、判断結果
を音声ピッチ周期推定部801に出力する。
は、コムフィルタ生成部107から出力されたコムフィ
ルタの各周波数成分の中でオン、つまり信号を減衰せず
に出力する状態の数が一定の閾値以下である場合、フレ
ームに突発性ノイズが含まれていると判断し、判断結果
を音声ピッチ周期推定部801に出力する。
【0166】コムフィルタ修正部502は、音声ピッチ
修復部802からフレームに突発性ノイズが含まれるコ
ムフィルタ生成部107から出力されたコムフィルタの
生成結果に基づいてコムフィルタにミュジカルノイズの
発生を防ぐ修正を行い、減衰係数計算部108にコムフ
ィルタを出力する。
修復部802からフレームに突発性ノイズが含まれるコ
ムフィルタ生成部107から出力されたコムフィルタの
生成結果に基づいてコムフィルタにミュジカルノイズの
発生を防ぐ修正を行い、減衰係数計算部108にコムフ
ィルタを出力する。
【0167】また、実施の形態6は、実施の形態4と組
み合わせることができる。すなわち、図8の音声処理装
置に平均値計算部601を追加することにより実施の形
態4の効果も得ることができる。
み合わせることができる。すなわち、図8の音声処理装
置に平均値計算部601を追加することにより実施の形
態4の効果も得ることができる。
【0168】この場合、周波数分割部104は、FFT
部103から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部106と、乗算部109と、平均値計算部601
に出力する。
部103から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部106と、乗算部109と、平均値計算部601
に出力する。
【0169】音声非音声識別部106は、平均値計算部
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
【0170】(実施の形態7)図10は、実施の形態7
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1及び図4と共通する構成については図1
及び図4と同一番号を付し、詳しい説明を省略する。図
10の音声処理装置は、閾値自動調整部1001を具備
し、ノイズの種類に応じて音声識別の閾値を調整する点
が、図1又は図4と異なる。
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1及び図4と共通する構成については図1
及び図4と同一番号を付し、詳しい説明を省略する。図
10の音声処理装置は、閾値自動調整部1001を具備
し、ノイズの種類に応じて音声識別の閾値を調整する点
が、図1又は図4と異なる。
【0171】図10において、コムフィルタ生成部10
7は、各周波数成分における音声成分の有無に基づいて
ピッチ調波を強調するコムフィルタを生成して閾値自動
調整部1001に出力する。
7は、各周波数成分における音声成分の有無に基づいて
ピッチ調波を強調するコムフィルタを生成して閾値自動
調整部1001に出力する。
【0172】ノイズ区間判別部401は、FFT部10
3から出力された音声スペクトルからフレーム単位で信
号のパワーと移動平均値を算出して、入力信号のパワー
の変化率からフレームが音声を含むか否か判別し、判別
結果を閾値自動調整部1001に出力する。
3から出力された音声スペクトルからフレーム単位で信
号のパワーと移動平均値を算出して、入力信号のパワー
の変化率からフレームが音声を含むか否か判別し、判別
結果を閾値自動調整部1001に出力する。
【0173】閾値自動調整部1001は、ノイズ区間判
別部401から出力された判別結果からフレームに音声
信号が含まれていない場合、コムフィルタ生成部107
から出力されたコムフィルタに基づいて音声非音声識別
部106の閾値を変更する。
別部401から出力された判別結果からフレームに音声
信号が含まれていない場合、コムフィルタ生成部107
から出力されたコムフィルタに基づいて音声非音声識別
部106の閾値を変更する。
【0174】具体的には、以下の式(8)を用いて生成
されたコムフィルタのオンの状態である周波数成分の数
の総和を算出する。 この総和が所定の上限値より大きくなった場合、音声非
音声識別部106の閾値を大きくする指示を、この総和
が所定の下限値より小さくなった場合、音声非音声識別
部106の閾値を小さくする指示を音声非音声識別部1
06に出力する。
されたコムフィルタのオンの状態である周波数成分の数
の総和を算出する。 この総和が所定の上限値より大きくなった場合、音声非
音声識別部106の閾値を大きくする指示を、この総和
が所定の下限値より小さくなった場合、音声非音声識別
部106の閾値を小さくする指示を音声非音声識別部1
06に出力する。
【0175】ここで、n1は、過去に処理を行ったフレ
ームを特定する番号であり、n2は処理を行うフレーム
を特定する番号である。
ームを特定する番号であり、n2は処理を行うフレーム
を特定する番号である。
【0176】例えば、フレームに振幅のばらつきの小さ
いノイズが含まれる場合、音声非音声識別の閾値を低く
設定し、フレームに振幅のばらつきの大きいノイズが含
まれる場合、音声非音声識別の閾値を高く設定する。
いノイズが含まれる場合、音声非音声識別の閾値を低く
設定し、フレームに振幅のばらつきの大きいノイズが含
まれる場合、音声非音声識別の閾値を高く設定する。
【0177】このように、本発明の実施の形態に係る音
声処理装置によれば、音声を含まないフレームの中で音
声が含まれると誤って判断される周波数成分の数に基づ
いて、音声スペクトルの音声非音声識別に用いる閾値の
変更を行うことにより、ノイズの種類に対応した音声の
判別を行い、音声歪の少ない音声強調を行うことができ
る。
声処理装置によれば、音声を含まないフレームの中で音
声が含まれると誤って判断される周波数成分の数に基づ
いて、音声スペクトルの音声非音声識別に用いる閾値の
変更を行うことにより、ノイズの種類に対応した音声の
判別を行い、音声歪の少ない音声強調を行うことができ
る。
【0178】なお、実施の形態7は、実施の形態2ある
いは実施の形態3と組み合わせることができる。
いは実施の形態3と組み合わせることができる。
【0179】すなわち、図10の音声処理装置にノイズ
区間判別部401及びノイズベース追跡部402を追加
することにより実施の形態2の効果も得ることができ、
図10の音声処理装置にミュジカルノイズ抑制部501
及びコムフィルタ修正部502を追加することにより実
施の形態3の効果も得ることができる。
区間判別部401及びノイズベース追跡部402を追加
することにより実施の形態2の効果も得ることができ、
図10の音声処理装置にミュジカルノイズ抑制部501
及びコムフィルタ修正部502を追加することにより実
施の形態3の効果も得ることができる。
【0180】また、実施の形態7は、実施の形態4と組
み合わせることができる。すなわち、図10の音声処理
装置に平均値計算部601を追加することにより実施の
形態4の効果も得ることができる。
み合わせることができる。すなわち、図10の音声処理
装置に平均値計算部601を追加することにより実施の
形態4の効果も得ることができる。
【0181】この場合、周波数分割部104は、FFT
部103から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部106と、乗算部109と、平均値計算部601
に出力する。
部103から出力された音声スペクトルを所定の周波数
単位で分割された音声スペクトルを示す周波数成分に分
割して、各周波数成分毎に音声スペクトルを音声非音声
識別部106と、乗算部109と、平均値計算部601
に出力する。
【0182】音声非音声識別部106は、平均値計算部
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
601から出力された音声スペクトル信号の平均値とノ
イズベース推定部105から出力されるノイズベースの
値の差が所定の閾値以上である場合、音声成分を含む有
音部分と判定し、この差が所定の閾値より小さい場合、
音声成分を含まない雑音のみの無音部分であると判定し
て、判定結果をノイズベース推定部105とコムフィル
タ生成部107に出力する。
【0183】また、実施の形態7は、実施の形態5ある
いは実施の形態6と組み合わせることができる。すなわ
ち、図10の音声処理装置に区間判別部701及び、コ
ムフィルタリセット部702を追加することにより実施
の形態5の効果も得ることができ、図10の音声処理装
置に音声ピッチ周期推定部801及び音声ピッチ修復部
802を追加することにより実施の形態6の効果も得る
ことができる。
いは実施の形態6と組み合わせることができる。すなわ
ち、図10の音声処理装置に区間判別部701及び、コ
ムフィルタリセット部702を追加することにより実施
の形態5の効果も得ることができ、図10の音声処理装
置に音声ピッチ周期推定部801及び音声ピッチ修復部
802を追加することにより実施の形態6の効果も得る
ことができる。
【0184】(実施の形態8)図11は、実施の形態8
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1と共通する構成については図1と同一番
号を付し、詳しい説明を省略する。
【0185】図11の音声処理装置は、ノイズベース推
定部1101と、第一音声非音声識別部1102と、第
二音声非音声識別部1103と、音声ピッチ推定部11
04と、第一コムフィルタ生成部1105と、第二コム
フィルタ生成部1106と、音声ピッチ修復部1107
と、コムフィルタ修正部1108と、音声分離係数計算
部1109とを具備し、コムフィルタ作成に用いるノイ
ズベースと、ピッチ調波構造の修復に用いるノイズベー
スをそれぞれ異なる条件で生成する点が、図1の音声処
理装置と異なる。
定部1101と、第一音声非音声識別部1102と、第
二音声非音声識別部1103と、音声ピッチ推定部11
04と、第一コムフィルタ生成部1105と、第二コム
フィルタ生成部1106と、音声ピッチ修復部1107
と、コムフィルタ修正部1108と、音声分離係数計算
部1109とを具備し、コムフィルタ作成に用いるノイ
ズベースと、ピッチ調波構造の修復に用いるノイズベー
スをそれぞれ異なる条件で生成する点が、図1の音声処
理装置と異なる。
【0186】図11において、周波数分割部104は、
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部1101、第一音声非音声識別部11
02、第二音声非音声識別部1103、及び音声ピッチ
推定部1104に出力する。
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部1101、第一音声非音声識別部11
02、第二音声非音声識別部1103、及び音声ピッチ
推定部1104に出力する。
【0187】ノイズベース推定部1101は、第一音声
非音声識別部1102からフレームに音声成分が含まれ
ている判定結果が出力された場合、過去に推定したノイ
ズベースを第一音声非音声識別部1102に出力する。
また、ノイズベース推定部1101は、第二音声非音声
識別部1103からフレームに音声成分が含まれている
判定結果が出力された場合、過去に推定したノイズベー
スを第二音声非音声識別部1103に出力する。
非音声識別部1102からフレームに音声成分が含まれ
ている判定結果が出力された場合、過去に推定したノイ
ズベースを第一音声非音声識別部1102に出力する。
また、ノイズベース推定部1101は、第二音声非音声
識別部1103からフレームに音声成分が含まれている
判定結果が出力された場合、過去に推定したノイズベー
スを第二音声非音声識別部1103に出力する。
【0188】また、ノイズベース推定部1101は、第
一音声非音声識別部1102または第二音声非音声識別
部1103からフレームに音声成分が含まれていない判
定結果が出力された場合、周波数分割部104から出力
された音声スペクトルの周波数成分毎の短時間パワース
ペクトルとスペクトルの変化の平均量を表す移動平均値
を算出して、過去に算出した移動平均値とパワースペク
トルの加重平均値をとり、新しい移動平均値を算出す
る。
一音声非音声識別部1102または第二音声非音声識別
部1103からフレームに音声成分が含まれていない判
定結果が出力された場合、周波数分割部104から出力
された音声スペクトルの周波数成分毎の短時間パワース
ペクトルとスペクトルの変化の平均量を表す移動平均値
を算出して、過去に算出した移動平均値とパワースペク
トルの加重平均値をとり、新しい移動平均値を算出す
る。
【0189】具体的には、ノイズベース推定部1101
は、式(9)または式(10)を用いて各周波数成分に
おけるノイズベースを推定して第一音声非音声識別部1
102または第二音声非音声識別部1103に出力す
る。 Pbase(n,k)=(1-α)・Pbase(n-1,k)+α・S2 f(n-τ,k) …(9) Pbase(n,k)=Pbase(n-1,k) …(10) ここで、nは処理を行うフレームを特定する番号、kは
周波数成分を特定する番号、τは遅延時間を示す。ま
た、S2 f(n,k)は、入力された音声信号のパワースペク
トル、Pbase(n,k)はノイズベースの移動平均値、α(k)
は移動平均係数を示す。
は、式(9)または式(10)を用いて各周波数成分に
おけるノイズベースを推定して第一音声非音声識別部1
102または第二音声非音声識別部1103に出力す
る。 Pbase(n,k)=(1-α)・Pbase(n-1,k)+α・S2 f(n-τ,k) …(9) Pbase(n,k)=Pbase(n-1,k) …(10) ここで、nは処理を行うフレームを特定する番号、kは
周波数成分を特定する番号、τは遅延時間を示す。ま
た、S2 f(n,k)は、入力された音声信号のパワースペク
トル、Pbase(n,k)はノイズベースの移動平均値、α(k)
は移動平均係数を示す。
【0190】入力された音声信号のパワースペクトル
が、音声とノイズを判別する閾値と先に入力された音声
信号のパワースペクトルとの乗算結果以下である場合、
ノイズベース推定部1101は、式(9)より得られた
ノイズベースを出力する。また、入力された音声信号の
パワースペクトルが、音声とノイズを判別する閾値と先
に入力された音声信号のパワースペクトルとの乗算結果
より大きい場合、ノイズベース推定部1101は、式
(10)より得られたノイズベースを出力する。
が、音声とノイズを判別する閾値と先に入力された音声
信号のパワースペクトルとの乗算結果以下である場合、
ノイズベース推定部1101は、式(9)より得られた
ノイズベースを出力する。また、入力された音声信号の
パワースペクトルが、音声とノイズを判別する閾値と先
に入力された音声信号のパワースペクトルとの乗算結果
より大きい場合、ノイズベース推定部1101は、式
(10)より得られたノイズベースを出力する。
【0191】第一音声非音声識別部1102は、周波数
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第一閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第一閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。
【0192】第一音声非音声識別部1102では、第一
コムフィルタ生成部1105がピッチ調波情報を出来る
限り多く抽出するフィルタを生成するために、第一閾値
を後述する第二音声非音声識別部1103が用いる第二
閾値より低い値に設定する。そして、第一音声非音声識
別部1102は、判定結果を第一コムフィルタ生成部1
105に出力する。
コムフィルタ生成部1105がピッチ調波情報を出来る
限り多く抽出するフィルタを生成するために、第一閾値
を後述する第二音声非音声識別部1103が用いる第二
閾値より低い値に設定する。そして、第一音声非音声識
別部1102は、判定結果を第一コムフィルタ生成部1
105に出力する。
【0193】第二音声非音声識別部1103は、周波数
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部1103は、判定結果を第二コムフ
ィルタ生成部1106に出力する。
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部1103は、判定結果を第二コムフ
ィルタ生成部1106に出力する。
【0194】第一コムフィルタ生成部1105は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部1108に出力する。
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部1108に出力する。
【0195】具体的には、第一音声非音声識別部110
2において、入力された音声信号のパワースペクトル
が、音声とノイズを判別する第一閾値と、入力された音
声信号のパワースペクトルとの乗算結果以上である場
合、すなわち、式(11) S2 f(n,k)≧θlow・Pbase(n,k) …(11) を満たす場合、第一コムフィルタ生成部1105は、当
該周波数成分のフィルタの値を「1」とする。
2において、入力された音声信号のパワースペクトル
が、音声とノイズを判別する第一閾値と、入力された音
声信号のパワースペクトルとの乗算結果以上である場
合、すなわち、式(11) S2 f(n,k)≧θlow・Pbase(n,k) …(11) を満たす場合、第一コムフィルタ生成部1105は、当
該周波数成分のフィルタの値を「1」とする。
【0196】また、第一音声非音声識別部1102にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果より小さい場合、すなわ
ち、式(12) S2 f(n,k)<θlow・Pbase(n,k) …(12) を満たす場合、第一コムフィルタ生成部1105は、当
該周波数成分のコムフィルタの値を「0」とする。
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果より小さい場合、すなわ
ち、式(12) S2 f(n,k)<θlow・Pbase(n,k) …(12) を満たす場合、第一コムフィルタ生成部1105は、当
該周波数成分のコムフィルタの値を「0」とする。
【0197】ここで、kは、周波数成分を特定する番号
であり、以下に示す式(13)の値を満たす。HBは、
音声信号に高速フーリエ変換を行う場合のデータ点数を
示す。 0≦k<HB/2 …(13) 第二コムフィルタ生成部1106は、各周波数成分にお
ける音声成分の有無に基づいてピッチ調波を強調する第
二コムフィルタを生成して音声ピッチ修復部1107に
出力する。
であり、以下に示す式(13)の値を満たす。HBは、
音声信号に高速フーリエ変換を行う場合のデータ点数を
示す。 0≦k<HB/2 …(13) 第二コムフィルタ生成部1106は、各周波数成分にお
ける音声成分の有無に基づいてピッチ調波を強調する第
二コムフィルタを生成して音声ピッチ修復部1107に
出力する。
【0198】具体的には、第二音声非音声識別部110
3において、入力された音声信号のパワースペクトル
が、音声とノイズを判別する第二閾値と、入力された音
声信号のパワースペクトルとの乗算結果以上である場
合、すなわち、式(11) S2 f(n,k)≧θlow・Pbase(n,k) …(11) を満たす場合、第二コムフィルタ生成部1106は、当
該周波数成分のフィルタの値を「1」とする。
3において、入力された音声信号のパワースペクトル
が、音声とノイズを判別する第二閾値と、入力された音
声信号のパワースペクトルとの乗算結果以上である場
合、すなわち、式(11) S2 f(n,k)≧θlow・Pbase(n,k) …(11) を満たす場合、第二コムフィルタ生成部1106は、当
該周波数成分のフィルタの値を「1」とする。
【0199】また、第二音声非音声識別部1103にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第二閾値と、入力された音声信号の
パワースペクトルとの乗算結果より小さい場合、すなわ
ち、式(12) S2 f(n,k)<θlow・Pbase(n,k) …(12) を満たす場合、第二コムフィルタ生成部1106は、当
該周波数成分のフィルタの値を「0」とする。
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第二閾値と、入力された音声信号の
パワースペクトルとの乗算結果より小さい場合、すなわ
ち、式(12) S2 f(n,k)<θlow・Pbase(n,k) …(12) を満たす場合、第二コムフィルタ生成部1106は、当
該周波数成分のフィルタの値を「0」とする。
【0200】音声ピッチ推定部1104は、周波数分割
部104から出力された音声スペクトルからピッチ周期
を推定し、推定結果を音声ピッチ修復部1107に出力
する。
部104から出力された音声スペクトルからピッチ周期
を推定し、推定結果を音声ピッチ修復部1107に出力
する。
【0201】例えば、音声ピッチ推定部1104は、生
成されたコムフィルタの通過域における音声スペクトル
パワに以下に示す自己相関関数の式(14)を用いてピ
ッチ周期を求める。 ここで、COMB_low(k)は、第一コムフィルタ生成部
1105において生成された第一コムフィルタを示す。
k1は、周波数の上限値を示す。また、τは、ピッチの
周期を示し、「0」からピッチの最大周期までの値をと
る。
成されたコムフィルタの通過域における音声スペクトル
パワに以下に示す自己相関関数の式(14)を用いてピ
ッチ周期を求める。 ここで、COMB_low(k)は、第一コムフィルタ生成部
1105において生成された第一コムフィルタを示す。
k1は、周波数の上限値を示す。また、τは、ピッチの
周期を示し、「0」からピッチの最大周期までの値をと
る。
【0202】そして、音声ピッチ推定部1104は、γ
(τ)が、最大値をとるτを音声ピッチ周期として求め
る。実際の処理では、高周波数領域においてピッチ調波
の形状は不明確になることが多いので、k1に中間の周
波数の値を用い、音声信号の周波数領域のうち、低周波
数側半分についてピッチ周期の推定を行う。例えば、音
声ピッチ推定部1104は、k1=2kHzに設定して
音声ピッチ周期の推定を行う。
(τ)が、最大値をとるτを音声ピッチ周期として求め
る。実際の処理では、高周波数領域においてピッチ調波
の形状は不明確になることが多いので、k1に中間の周
波数の値を用い、音声信号の周波数領域のうち、低周波
数側半分についてピッチ周期の推定を行う。例えば、音
声ピッチ推定部1104は、k1=2kHzに設定して
音声ピッチ周期の推定を行う。
【0203】音声ピッチ修復部1107は、音声ピッチ
推定部1104から出力された推定結果に基づいて第二
コムフィルタの修正を行い、コムフィルタ修正部110
8に出力する。
推定部1104から出力された推定結果に基づいて第二
コムフィルタの修正を行い、コムフィルタ修正部110
8に出力する。
【0204】以下、図を用いて音声ピッチ修復部110
7の具体的な動作について説明する。図12、図13、
図14、及び図15は、コムフィルタの一例を示す図で
ある。
7の具体的な動作について説明する。図12、図13、
図14、及び図15は、コムフィルタの一例を示す図で
ある。
【0205】音声ピッチ修復部1107は、第二コムフ
ィルタの通過領域のピークを抽出し、ピッチ基準コムフ
ィルタを生成する。図12のコムフィルタは、第二コム
フィルタ生成部1106において生成された第二コムフ
ィルタの一例である。また、図13のコムフィルタは、
ピッチ基準コムフィルタの一例である。図13のコムフ
ィルタでは、図12のコムフィルタからピークの情報の
みを抽出し、通過領域の幅の情報がなくなっている。
ィルタの通過領域のピークを抽出し、ピッチ基準コムフ
ィルタを生成する。図12のコムフィルタは、第二コム
フィルタ生成部1106において生成された第二コムフ
ィルタの一例である。また、図13のコムフィルタは、
ピッチ基準コムフィルタの一例である。図13のコムフ
ィルタでは、図12のコムフィルタからピークの情報の
みを抽出し、通過領域の幅の情報がなくなっている。
【0206】そして、音声ピッチ修復部1107は、ピ
ッチ基準コムフィルタのピークとピークの間隔を算出
し、ピークとピークの間隔が、所定の閾値、例えばピッ
チ周期の15倍の値、を超えた場合、音声ピッチ推定部
1104のピッチの推定結果から欠落したピッチの挿入
を行い、ピッチ挿入コムフィルタを生成する。図14の
コムフィルタは、ピッチ挿入コムフィルタの一例であ
る。図14のコムフィルタでは、50kHzから100k
Hz付近及び200kHzから250kHzにピークが挿入さ
れている。
ッチ基準コムフィルタのピークとピークの間隔を算出
し、ピークとピークの間隔が、所定の閾値、例えばピッ
チ周期の15倍の値、を超えた場合、音声ピッチ推定部
1104のピッチの推定結果から欠落したピッチの挿入
を行い、ピッチ挿入コムフィルタを生成する。図14の
コムフィルタは、ピッチ挿入コムフィルタの一例であ
る。図14のコムフィルタでは、50kHzから100k
Hz付近及び200kHzから250kHzにピークが挿入さ
れている。
【0207】そして、音声ピッチ修復部1107は、ピ
ッチの値に応じてピッチ挿入コムフィルタの通過領域の
ピークの幅を広げてピッチ修復コムフィルタを生成し、
コムフィルタ修正部1108に出力する。図15のコム
フィルタは、ピッチ修復コムフィルタの一例である。図
15のコムフィルタでは、図14のピッチ挿入コムフィ
ルタに通過領域の幅の情報が付加されている。
ッチの値に応じてピッチ挿入コムフィルタの通過領域の
ピークの幅を広げてピッチ修復コムフィルタを生成し、
コムフィルタ修正部1108に出力する。図15のコム
フィルタは、ピッチ修復コムフィルタの一例である。図
15のコムフィルタでは、図14のピッチ挿入コムフィ
ルタに通過領域の幅の情報が付加されている。
【0208】コムフィルタ修正部1108は、音声ピッ
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部1105におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部1105におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
【0209】具体的には、コムフィルタ修正部1108
は、ピッチ修復コムフィルタと第一コムフィルタの通過
領域を比較して両方のコムフィルタにおいて通過領域と
なっている部分を通過領域とし、この通過領域以外を、
信号を減衰する阻止領域としてコムフィルタを生成す
る。
は、ピッチ修復コムフィルタと第一コムフィルタの通過
領域を比較して両方のコムフィルタにおいて通過領域と
なっている部分を通過領域とし、この通過領域以外を、
信号を減衰する阻止領域としてコムフィルタを生成す
る。
【0210】以下、コムフィルタ修正の一例を示す。図
16、図17、及び図18は、コムフィルタの一例を示
す図である。図16のコムフィルタは、第一コムフィル
タ生成部1105において生成された第一コムフィルタ
である。また、図17のコムフィルタは、音声ピッチ修
復部1107において生成されたピッチ修復コムフィル
タである。図18は、コムフィルタ修正部1108にお
いて修正されたコムフィルタの一例である。
16、図17、及び図18は、コムフィルタの一例を示
す図である。図16のコムフィルタは、第一コムフィル
タ生成部1105において生成された第一コムフィルタ
である。また、図17のコムフィルタは、音声ピッチ修
復部1107において生成されたピッチ修復コムフィル
タである。図18は、コムフィルタ修正部1108にお
いて修正されたコムフィルタの一例である。
【0211】音声分離係数計算部1109は、コムフィ
ルタ修正部1108において修正されたコムフィルタに
周波数特性に基づいた分離係数を乗算し、各周波数成分
毎に入力信号の分離係数を算出して乗算部109に出力
する。
ルタ修正部1108において修正されたコムフィルタに
周波数特性に基づいた分離係数を乗算し、各周波数成分
毎に入力信号の分離係数を算出して乗算部109に出力
する。
【0212】例えば、音声分離係数計算部1109は、
ある周波数成分を特定する番号kにおいて、コムフィル
タ修正部1108において修正されたコムフィルタCOMB
_res(k)の値が1、すなわち通過領域である場合、分散
係数seps(k)を1とする。また、音声分離係数計算部
1109は、コムフィルタCOMB_res(k)の値が0、すな
わち阻止領域である場合、以下の式(15)から分散係
数seps(k)を算出する。 seps(k)=gc・k/HB …(15) ここで、gcは定数、kは周波数成分を特定する番号、HB
は、FFT変換長つまり高速フーリエ変換を行うデータ
数を示す。
ある周波数成分を特定する番号kにおいて、コムフィル
タ修正部1108において修正されたコムフィルタCOMB
_res(k)の値が1、すなわち通過領域である場合、分散
係数seps(k)を1とする。また、音声分離係数計算部
1109は、コムフィルタCOMB_res(k)の値が0、すな
わち阻止領域である場合、以下の式(15)から分散係
数seps(k)を算出する。 seps(k)=gc・k/HB …(15) ここで、gcは定数、kは周波数成分を特定する番号、HB
は、FFT変換長つまり高速フーリエ変換を行うデータ
数を示す。
【0213】乗算部109は、周波数分割部104から
出力された音声スペクトルに音声分離係数計算部110
9から出力された減衰係数を周波数成分単位で乗算す
る。そして、乗算の結果得られたスペクトルを周波数合
成部110に出力する。
出力された音声スペクトルに音声分離係数計算部110
9から出力された減衰係数を周波数成分単位で乗算す
る。そして、乗算の結果得られたスペクトルを周波数合
成部110に出力する。
【0214】このように、本実施の形態の音声処理装置
によれば、コムフィルタ作成に用いるノイズベースと、
ピッチ調波構造修復に用いるノイズベースをそれぞれ異
なる条件で生成することにより、音声情報を多く抽出
し、かつ雑音情報の影響を受け難いコムフィルタを生成
して正確なピッチ調波構造の修復を行うことができる。
によれば、コムフィルタ作成に用いるノイズベースと、
ピッチ調波構造修復に用いるノイズベースをそれぞれ異
なる条件で生成することにより、音声情報を多く抽出
し、かつ雑音情報の影響を受け難いコムフィルタを生成
して正確なピッチ調波構造の修復を行うことができる。
【0215】具体的には、本実施の音声処理装置によれ
ば、音声と判断する条件を厳しくした第二コムフィルタ
を基準にしたピッチ周期の推定結果を反映させて欠落し
たと推測されるピッチを挿入してコムフィルタのピッチ
調波構造を修復することにより、ピッチ調波の欠落によ
る音声歪を減少することができる。
ば、音声と判断する条件を厳しくした第二コムフィルタ
を基準にしたピッチ周期の推定結果を反映させて欠落し
たと推測されるピッチを挿入してコムフィルタのピッチ
調波構造を修復することにより、ピッチ調波の欠落によ
る音声歪を減少することができる。
【0216】また、本実施の形態の音声処理装置によれ
ば、コムフィルタのピッチ幅をピッチ周期の推定結果か
ら調整することにより正確にピッチ調波構造を修復する
ことができる。音声と厳しく判断して作成したコムフィ
ルタのピッチ調波構造を修復したコムフィルタの通過領
域と音声と緩く判断して作成したコムフィルタの通過領
域の重複部分を通過領域とし、この重複する通過領域以
外を阻止領域とするコムフィルタを作成することによ
り、ピッチ周期の推定の誤差による影響を低減すること
ができ、正確なピッチ調波構造の修復ができる。
ば、コムフィルタのピッチ幅をピッチ周期の推定結果か
ら調整することにより正確にピッチ調波構造を修復する
ことができる。音声と厳しく判断して作成したコムフィ
ルタのピッチ調波構造を修復したコムフィルタの通過領
域と音声と緩く判断して作成したコムフィルタの通過領
域の重複部分を通過領域とし、この重複する通過領域以
外を阻止領域とするコムフィルタを作成することによ
り、ピッチ周期の推定の誤差による影響を低減すること
ができ、正確なピッチ調波構造の修復ができる。
【0217】なお、本実施の形態の音声処理装置は、コ
ムフィルタの阻止領域の音声分離係数を、音声スペクト
ルに分離係数を乗算して算出し、コムフィルタの通過領
域の音声分離係数を、音声スペクトルからノイズベース
を減算して算出することもできる。
ムフィルタの阻止領域の音声分離係数を、音声スペクト
ルに分離係数を乗算して算出し、コムフィルタの通過領
域の音声分離係数を、音声スペクトルからノイズベース
を減算して算出することもできる。
【0218】例えば、音声分離係数計算部1109は、
コムフィルタCOMB_res(k)の値が0、すなわち阻止領域
である場合、以下の式(16)から分散係数seps(k)を
算出する。 ここで、Pmax(n)は、所定の範囲の周波数成分kでのP
base(n、k)の最大値を示す。式(16)では、フレー
ム毎にノイズベース推定値の正規化を行い、その逆数を
用いて分離係数とする。
コムフィルタCOMB_res(k)の値が0、すなわち阻止領域
である場合、以下の式(16)から分散係数seps(k)を
算出する。 ここで、Pmax(n)は、所定の範囲の周波数成分kでのP
base(n、k)の最大値を示す。式(16)では、フレー
ム毎にノイズベース推定値の正規化を行い、その逆数を
用いて分離係数とする。
【0219】そして、コムフィルタCOMB_res(k)の値が
1、すなわち通過領域である場合、以下の式(17)か
ら分散係数seps(k)を算出する。 ここで、γは、ノイズベースを差し引く量を示す係数で
あり、Pmax(n)は、所定の範囲の周波数成分kでのP
base(n,k)の最大値を示す。
1、すなわち通過領域である場合、以下の式(17)か
ら分散係数seps(k)を算出する。 ここで、γは、ノイズベースを差し引く量を示す係数で
あり、Pmax(n)は、所定の範囲の周波数成分kでのP
base(n,k)の最大値を示す。
【0220】このように、本実施の形態の音声処理装置
は、ピッチ修正を行ったコムフィルタの阻止領域にノイ
ズベースの情報から算出した分離係数を乗算することに
より、異なるノイズ特性に対しても最適な分離係数を算
出することができ、ノイズ特性に対応した音声強調を行
うことができる。また、本実施の形態の音声処理装置
は、ピッチ修正を行ったコムフィルタの通過領域に音声
スペクトルからノイズベースを減算して算出した分離係
数を乗算することにより、音声歪みの少ない音声強調を
行うことができる。
は、ピッチ修正を行ったコムフィルタの阻止領域にノイ
ズベースの情報から算出した分離係数を乗算することに
より、異なるノイズ特性に対しても最適な分離係数を算
出することができ、ノイズ特性に対応した音声強調を行
うことができる。また、本実施の形態の音声処理装置
は、ピッチ修正を行ったコムフィルタの通過領域に音声
スペクトルからノイズベースを減算して算出した分離係
数を乗算することにより、音声歪みの少ない音声強調を
行うことができる。
【0221】また、本実施の形態は、実施の形態2と組
み合わせることもできる。すなわち、図11の音声処理
装置にノイズ区間判別部401及びノイズベース追跡部
402を追加することにより実施の形態2の効果も得る
ことができる。
み合わせることもできる。すなわち、図11の音声処理
装置にノイズ区間判別部401及びノイズベース追跡部
402を追加することにより実施の形態2の効果も得る
ことができる。
【0222】(実施の形態9)図19は、実施の形態9
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1及び図11と共通する構成については図
1及び図11と同一番号を付し、詳しい説明を省略す
る。
にかかる音声処理装置の構成の例を示すブロック図であ
る。但し、図1及び図11と共通する構成については図
1及び図11と同一番号を付し、詳しい説明を省略す
る。
【0223】図19の音声処理装置は、SNR計算部1
901と、音声雑音フレーム検出部1902とを具備
し、音声信号のSNR(Signal Noise Ratio)を計算
し、SNRからフレーム単位で音声信号から音声フレー
ムまたは雑音フレームを区別して検出し、音声フレーム
のみピッチ周期の推定を行う点が、図1又は図11と異
なる。
901と、音声雑音フレーム検出部1902とを具備
し、音声信号のSNR(Signal Noise Ratio)を計算
し、SNRからフレーム単位で音声信号から音声フレー
ムまたは雑音フレームを区別して検出し、音声フレーム
のみピッチ周期の推定を行う点が、図1又は図11と異
なる。
【0224】図19において、周波数分割部104は、
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部105と、第一音声非音声識別部11
02と、第二音声非音声識別部1103と、乗算部10
9と、SNR計算部1901に出力する。
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部105と、第一音声非音声識別部11
02と、第二音声非音声識別部1103と、乗算部10
9と、SNR計算部1901に出力する。
【0225】第一コムフィルタ生成部1105は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部1108とSNR計算部1901に出力する。
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部1108とSNR計算部1901に出力する。
【0226】SNR計算部1901は、周波数分割部1
04から出力された音声スペクトルと第一コムフィルタ
生成部1105から出力された第一コムフィルタから音
声信号のSNRを計算して音声雑音フレーム検出部19
02に出力する。例えば、SNR計算部1901は、以
下の式(18)を用いてSNRを計算する。 ここで、COMB_low(k)は、第一コムフィルタ
を示す。また、kは周波数成分を示し、0以上かつ音声
信号に高速フーリエ変換を行う場合のデータ点数の半数
より小さい値をとる。
04から出力された音声スペクトルと第一コムフィルタ
生成部1105から出力された第一コムフィルタから音
声信号のSNRを計算して音声雑音フレーム検出部19
02に出力する。例えば、SNR計算部1901は、以
下の式(18)を用いてSNRを計算する。 ここで、COMB_low(k)は、第一コムフィルタ
を示す。また、kは周波数成分を示し、0以上かつ音声
信号に高速フーリエ変換を行う場合のデータ点数の半数
より小さい値をとる。
【0227】音声雑音フレーム検出部1902は、SN
R計算部1901から出力されたSNRからフレーム単
位で入力信号が音声信号か雑音信号かを判断し、判断結
果を音声ピッチ推定部1903に出力する。具体的に
は、音声雑音フレーム検出部1902は、SNRが所定
の閾値より大きい場合、入力した信号を音声信号(音声
フレーム)と判断し、SNRが所定の閾値以下であるフ
レームが所定の数以上連続して発生した場合、入力した
信号を雑音信号(雑音フレーム)と判断する。
R計算部1901から出力されたSNRからフレーム単
位で入力信号が音声信号か雑音信号かを判断し、判断結
果を音声ピッチ推定部1903に出力する。具体的に
は、音声雑音フレーム検出部1902は、SNRが所定
の閾値より大きい場合、入力した信号を音声信号(音声
フレーム)と判断し、SNRが所定の閾値以下であるフ
レームが所定の数以上連続して発生した場合、入力した
信号を雑音信号(雑音フレーム)と判断する。
【0228】図20に、上記音声雑音フレーム検出部1
902の音声/雑音判断の動作をプログラムで表現した
例を示す。図20は、本実施の形態の音声処理装置の音
声雑音判断プログラムの一例を示す図である。図20の
プログラムでは、SNRが所定の閾値以下であるフレー
ムが10以上連続して発生した場合、入力した信号を雑
音信号(雑音フレーム)と判断する。
902の音声/雑音判断の動作をプログラムで表現した
例を示す。図20は、本実施の形態の音声処理装置の音
声雑音判断プログラムの一例を示す図である。図20の
プログラムでは、SNRが所定の閾値以下であるフレー
ムが10以上連続して発生した場合、入力した信号を雑
音信号(雑音フレーム)と判断する。
【0229】音声ピッチ推定部1903は、音声雑音フ
レーム検出部1902が音声フレームと判断する場合、
周波数分割部104から出力された音声スペクトルから
ピッチ周期を推定し、推定結果を音声ピッチ修復部11
07に出力する。ピッチ周期推定の動作は、実施の形態
8の音声ピッチ推定部1104と同様の動作を行う。
レーム検出部1902が音声フレームと判断する場合、
周波数分割部104から出力された音声スペクトルから
ピッチ周期を推定し、推定結果を音声ピッチ修復部11
07に出力する。ピッチ周期推定の動作は、実施の形態
8の音声ピッチ推定部1104と同様の動作を行う。
【0230】音声ピッチ修復部1107は、音声ピッチ
推定部1903から出力された推定結果に基づいて第二
コムフィルタの修正を行い、コムフィルタ修正部110
8に出力する。
推定部1903から出力された推定結果に基づいて第二
コムフィルタの修正を行い、コムフィルタ修正部110
8に出力する。
【0231】このように、本実施の形態の音声処理装置
によれば、コムフィルタの通過領域に対応する音声スペ
クトルのパワの和と、コムフィルタの阻止領域に対応す
る音声スペクトルのパワの和との比を求めてSNRと
し、このSNRが所定の閾値以上であるフレームのみを
用いてピッチ周期を推定することにより、雑音によるピ
ッチ周期推定の誤りを低減することができ、音声歪の少
ない音声強調を行うことができる。
によれば、コムフィルタの通過領域に対応する音声スペ
クトルのパワの和と、コムフィルタの阻止領域に対応す
る音声スペクトルのパワの和との比を求めてSNRと
し、このSNRが所定の閾値以上であるフレームのみを
用いてピッチ周期を推定することにより、雑音によるピ
ッチ周期推定の誤りを低減することができ、音声歪の少
ない音声強調を行うことができる。
【0232】なお、本実施の形態の音声処理装置は、第
一コムフィルタからSNRを計算しているが、第二コム
フィルタを用いてSNRを計算してもよい。この場合、
第二コムフィルタ生成部1106は、作成した第二コム
フィルタをSNR計算部1901に出力する。そして、
SNR計算部1901は、周波数分割部104から出力
された音声スペクトルと第二コムフィルタから音声信号
のSNRを計算して音声雑音フレーム検出部1902に
出力する。
一コムフィルタからSNRを計算しているが、第二コム
フィルタを用いてSNRを計算してもよい。この場合、
第二コムフィルタ生成部1106は、作成した第二コム
フィルタをSNR計算部1901に出力する。そして、
SNR計算部1901は、周波数分割部104から出力
された音声スペクトルと第二コムフィルタから音声信号
のSNRを計算して音声雑音フレーム検出部1902に
出力する。
【0233】(実施の形態10)図21は、実施の形態
10にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図11と共通する構成について
は図1及び図11と同一番号を付し、詳しい説明を省略
する。図21の音声処理装置は、第一コムフィルタ生成
部2101と、第一ミュジカルノイズ抑圧部2102
と、第二コムフィルタ生成部2103と、第二ミュジカ
ルノイズ抑圧部2104とを具備し、第一コムフィルタ
と第二コムフィルタの生成結果からミュジカルノイズ発
生を判断する点が、図1又は図11と異なる。
10にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図11と共通する構成について
は図1及び図11と同一番号を付し、詳しい説明を省略
する。図21の音声処理装置は、第一コムフィルタ生成
部2101と、第一ミュジカルノイズ抑圧部2102
と、第二コムフィルタ生成部2103と、第二ミュジカ
ルノイズ抑圧部2104とを具備し、第一コムフィルタ
と第二コムフィルタの生成結果からミュジカルノイズ発
生を判断する点が、図1又は図11と異なる。
【0234】図21において、第一音声非音声識別部1
102は、周波数分割部104から出力された音声スペ
クトル信号とノイズベース推定部1101から出力され
るノイズベースの値の差が所定の第一閾値以上である場
合、音声成分を含む有音部分と判定し、それ以外の場
合、音声成分を含まない雑音のみの無音部分であると判
定する。
102は、周波数分割部104から出力された音声スペ
クトル信号とノイズベース推定部1101から出力され
るノイズベースの値の差が所定の第一閾値以上である場
合、音声成分を含む有音部分と判定し、それ以外の場
合、音声成分を含まない雑音のみの無音部分であると判
定する。
【0235】第一音声非音声識別部1102では、第一
コムフィルタ生成部2101がピッチ調波情報を出来る
限り多く抽出するフィルタを生成するために、第一閾値
を後述する第二音声非音声識別部1103が用いる第二
閾値より低い値に設定する。そして、第一音声非音声識
別部1102は、判定結果を第一コムフィルタ生成部2
101に出力する。
コムフィルタ生成部2101がピッチ調波情報を出来る
限り多く抽出するフィルタを生成するために、第一閾値
を後述する第二音声非音声識別部1103が用いる第二
閾値より低い値に設定する。そして、第一音声非音声識
別部1102は、判定結果を第一コムフィルタ生成部2
101に出力する。
【0236】第二音声非音声識別部1103は、周波数
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部1103は、判定結果を第二コムフ
ィルタ生成部2103に出力する。
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部1103は、判定結果を第二コムフ
ィルタ生成部2103に出力する。
【0237】第一コムフィルタ生成部2101は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成して第一ミュジカル
ノイズ抑圧部2102に出力する。第一コムフィルタ生
成の具体的な動作は、実施の形態8の第一コムフィルタ
生成部1105と同様の動作を行う。そして、第一コム
フィルタ生成部2101は、第一ミュジカルノイズ抑圧
部2102において修正された第一コムフィルタをコム
フィルタ修正部1108に出力する。
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成して第一ミュジカル
ノイズ抑圧部2102に出力する。第一コムフィルタ生
成の具体的な動作は、実施の形態8の第一コムフィルタ
生成部1105と同様の動作を行う。そして、第一コム
フィルタ生成部2101は、第一ミュジカルノイズ抑圧
部2102において修正された第一コムフィルタをコム
フィルタ修正部1108に出力する。
【0238】第一ミュジカルノイズ抑圧部2102は、
第一コムフィルタの各周波数成分の状態の中でオン、つ
まり信号を減衰せずに出力する状態の数が一定の閾値以
下である場合、フレームに突発性ノイズが含まれている
と判断する。例えば、以下の式(5)を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値(例えば10)より小さい場合、ミュ
ジカルノイズが発生していると判断する。 そして、第一ミュジカルノイズ抑圧部2102は、コム
フィルタのすべての周波数成分の状態をオフつまり信号
を減衰して出力する状態に設定してコムフィルタを第一
コムフィルタ生成部2101に出力する。
第一コムフィルタの各周波数成分の状態の中でオン、つ
まり信号を減衰せずに出力する状態の数が一定の閾値以
下である場合、フレームに突発性ノイズが含まれている
と判断する。例えば、以下の式(5)を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値(例えば10)より小さい場合、ミュ
ジカルノイズが発生していると判断する。 そして、第一ミュジカルノイズ抑圧部2102は、コム
フィルタのすべての周波数成分の状態をオフつまり信号
を減衰して出力する状態に設定してコムフィルタを第一
コムフィルタ生成部2101に出力する。
【0239】第二コムフィルタ生成部2103は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第二コムフィルタを生成して第二ミュジカル
ノイズ抑圧部2104に出力する。第二コムフィルタ生
成の具体的な動作は、実施の形態8の第二コムフィルタ
生成部1106と同様の動作を行う。そして、第二コム
フィルタ生成部2103は、第二ミュジカルノイズ抑圧
部2104において修正された第二コムフィルタを音声
ピッチ修復部1107に出力する。
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第二コムフィルタを生成して第二ミュジカル
ノイズ抑圧部2104に出力する。第二コムフィルタ生
成の具体的な動作は、実施の形態8の第二コムフィルタ
生成部1106と同様の動作を行う。そして、第二コム
フィルタ生成部2103は、第二ミュジカルノイズ抑圧
部2104において修正された第二コムフィルタを音声
ピッチ修復部1107に出力する。
【0240】第二ミュジカルノイズ抑圧部2104は、
第一コムフィルタの各周波数成分の状態の中でオン、つ
まり信号を減衰せずに出力する状態の数が一定の閾値以
下である場合、フレームに突発性ノイズが含まれている
と判断する。
第一コムフィルタの各周波数成分の状態の中でオン、つ
まり信号を減衰せずに出力する状態の数が一定の閾値以
下である場合、フレームに突発性ノイズが含まれている
と判断する。
【0241】例えば、以下の式(5)を用いてコムフィ
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値(例えば10)より小さい場合、ミュ
ジカルノイズが発生していると判断する。 そして、第二ミュジカルノイズ抑圧部2104は、コム
フィルタのすべての周波数成分の状態をオフつまり信号
を減衰して出力する状態に設定してコムフィルタを第二
コムフィルタ生成部2103に出力する。
ルタでオンになっている周波数成分の数を計算し、COMB
_SUM(n)がある閾値(例えば10)より小さい場合、ミュ
ジカルノイズが発生していると判断する。 そして、第二ミュジカルノイズ抑圧部2104は、コム
フィルタのすべての周波数成分の状態をオフつまり信号
を減衰して出力する状態に設定してコムフィルタを第二
コムフィルタ生成部2103に出力する。
【0242】音声ピッチ修復部1107は、音声ピッチ
推定部1104から出力された推定結果に基づいて第二
コムフィルタ生成部2103から出力された第二コムフ
ィルタの修正を行い、コムフィルタ修正部1108に出
力する。
推定部1104から出力された推定結果に基づいて第二
コムフィルタ生成部2103から出力された第二コムフ
ィルタの修正を行い、コムフィルタ修正部1108に出
力する。
【0243】コムフィルタ修正部1108は、音声ピッ
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部2101におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部2101におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
【0244】このように、本実施の形態の音声処理装置
によれば、第一コムフィルタと第二コムフィルタの生成
結果からミュジカルノイズ発生を判断することにより、
ノイズが音声信号と誤判断されることを防ぎ、音声歪の
少ない音声強調を行うことができる。
によれば、第一コムフィルタと第二コムフィルタの生成
結果からミュジカルノイズ発生を判断することにより、
ノイズが音声信号と誤判断されることを防ぎ、音声歪の
少ない音声強調を行うことができる。
【0245】(実施の形態11)図22は、実施の形態
11にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図11と共通する構成について
は図1及び図11と同一番号を付し、詳しい説明を省略
する。図22の音声処理装置は、平均値計算部2201
を具備し、周波数成分単位で音声スペクトルのパワの平
均値を求める点が、図1又は図11と異なる。
11にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図11と共通する構成について
は図1及び図11と同一番号を付し、詳しい説明を省略
する。図22の音声処理装置は、平均値計算部2201
を具備し、周波数成分単位で音声スペクトルのパワの平
均値を求める点が、図1又は図11と異なる。
【0246】図22において、周波数分割部104は、
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部1101と、第一音声非音声識別部1
102と、乗算部109と、平均値計算部2201に出
力する。
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部1101と、第一音声非音声識別部1
102と、乗算部109と、平均値計算部2201に出
力する。
【0247】平均値計算部2201は、周波数分割部1
04から出力された音声スペクトルのパワーについて、
近辺の周波数成分との平均値及び過去に処理したフレー
ムとの平均値をとり、得られた平均値を第二音声非音声
識別部1103に出力する。
04から出力された音声スペクトルのパワーについて、
近辺の周波数成分との平均値及び過去に処理したフレー
ムとの平均値をとり、得られた平均値を第二音声非音声
識別部1103に出力する。
【0248】具体的には、以下に示す式(19)を用い
て音声スペクトルの平均値を算出する。 ここで、k1、k2は周波数成分を示し、k1<k<k2であ
る。n1は過去に処理を行ったフレームを示す番号、nは
処理を行うフレームを示す番号を示す。
て音声スペクトルの平均値を算出する。 ここで、k1、k2は周波数成分を示し、k1<k<k2であ
る。n1は過去に処理を行ったフレームを示す番号、nは
処理を行うフレームを示す番号を示す。
【0249】第二音声非音声識別部1103は、平均値
計算部2201から出力された音声スペクトル信号の平
均値とノイズベース推定部1101から出力されるノイ
ズベースの値の差が所定の第二閾値以上である場合、音
声成分を含む有音部分と判定し、それ以外の場合、音声
成分を含まない雑音のみの無音部分であると判定する。
そして、第二音声非音声識別部1103は、判定結果を
第二コムフィルタ生成部1106に出力する。
計算部2201から出力された音声スペクトル信号の平
均値とノイズベース推定部1101から出力されるノイ
ズベースの値の差が所定の第二閾値以上である場合、音
声成分を含む有音部分と判定し、それ以外の場合、音声
成分を含まない雑音のみの無音部分であると判定する。
そして、第二音声非音声識別部1103は、判定結果を
第二コムフィルタ生成部1106に出力する。
【0250】このように、本発明の実施の形態11に係
る音声処理装置によれば、各周波数成分における音声ス
ペクトルのパワ平均値又は過去に処理を行ったフレーム
と処理を行うフレームのパワ平均値を求めることによ
り、突発性雑音成分の影響は小さくなり、音声情報のみ
をとりだす第二コムフィルタをより正確に生成すること
ができる。
る音声処理装置によれば、各周波数成分における音声ス
ペクトルのパワ平均値又は過去に処理を行ったフレーム
と処理を行うフレームのパワ平均値を求めることによ
り、突発性雑音成分の影響は小さくなり、音声情報のみ
をとりだす第二コムフィルタをより正確に生成すること
ができる。
【0251】(実施の形態12)図23は、実施の形態
12にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1、図11及び図19と共通する構成
については図1、図11及び図19と同一番号を付し、
詳しい説明を省略する。図23の音声処理装置は、コム
フィルタリセット部2301を具備し、音声成分を含ま
ないフレームに対して全周波数成分で減衰を行うコムフ
ィルタを生成する点が、図1、図11又は図19と異な
る。
12にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1、図11及び図19と共通する構成
については図1、図11及び図19と同一番号を付し、
詳しい説明を省略する。図23の音声処理装置は、コム
フィルタリセット部2301を具備し、音声成分を含ま
ないフレームに対して全周波数成分で減衰を行うコムフ
ィルタを生成する点が、図1、図11又は図19と異な
る。
【0252】図23において、音声雑音フレーム検出部
1902は、SNR計算部1901から出力されたSN
Rからフレーム単位で入力信号が音声信号か雑音信号か
を判断し、判断結果を音声ピッチ推定部1104に出力
する。
1902は、SNR計算部1901から出力されたSN
Rからフレーム単位で入力信号が音声信号か雑音信号か
を判断し、判断結果を音声ピッチ推定部1104に出力
する。
【0253】具体的には、音声雑音フレーム検出部19
02は、SNRが所定の閾値より大きい場合、入力した
信号を音声信号(音声フレーム)と判断し、SNRが所
定の閾値以下であるフレームが所定の数以上連続して発
生した場合、入力した信号を雑音信号(雑音フレーム)
と判断する。そして、音声雑音フレーム検出部1902
は、判断結果を、音声ピッチ推定部1104とコムフィ
ルタリセット部2301に出力する。
02は、SNRが所定の閾値より大きい場合、入力した
信号を音声信号(音声フレーム)と判断し、SNRが所
定の閾値以下であるフレームが所定の数以上連続して発
生した場合、入力した信号を雑音信号(雑音フレーム)
と判断する。そして、音声雑音フレーム検出部1902
は、判断結果を、音声ピッチ推定部1104とコムフィ
ルタリセット部2301に出力する。
【0254】コムフィルタリセット部2301は、音声
雑音フレーム検出部1902から出力された判断結果に
基づいて、音声スペクトルが音声成分を含まないノイズ
成分のみと判断された場合、コムフィルタ修正部110
8にすべての周波数成分のコムフィルタをオフにする指
示を出力する。
雑音フレーム検出部1902から出力された判断結果に
基づいて、音声スペクトルが音声成分を含まないノイズ
成分のみと判断された場合、コムフィルタ修正部110
8にすべての周波数成分のコムフィルタをオフにする指
示を出力する。
【0255】コムフィルタ修正部1108は、音声ピッ
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部1105におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部1105におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
【0256】また、コムフィルタ修正部1108は、コ
ムフィルタリセット部2301の指示に従い音声スペク
トルが音声成分を含まないノイズ成分のみと判断された
場合に、すべての周波数成分でオフにした第一コムフィ
ルタを生成して音声分離係数計算部1109に出力す
る。
ムフィルタリセット部2301の指示に従い音声スペク
トルが音声成分を含まないノイズ成分のみと判断された
場合に、すべての周波数成分でオフにした第一コムフィ
ルタを生成して音声分離係数計算部1109に出力す
る。
【0257】このように、本実施の形態の音声処理装置
によれば、音声成分を含まないフレームに全周波数成分
で減衰を行い、音声を含まない信号区間でノイズを全帯
域でカットすることにより、音声抑圧処理に起因するノ
イズの発生を防ぐことができるので、音声歪の少ない音
声強調を行うことができる。
によれば、音声成分を含まないフレームに全周波数成分
で減衰を行い、音声を含まない信号区間でノイズを全帯
域でカットすることにより、音声抑圧処理に起因するノ
イズの発生を防ぐことができるので、音声歪の少ない音
声強調を行うことができる。
【0258】(実施の形態13)図24は、実施の形態
13にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1と共通する構成については図1と同
一番号を付し、詳しい説明を省略する。
13にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1と共通する構成については図1と同
一番号を付し、詳しい説明を省略する。
【0259】図24の音声処理装置は、雑音分離コムフ
ィルタ生成部2401と、雑音分離係数計算部2402
と、乗算部2403と、雑音周波数合成部2404とを
具備し、周波数成分単位でスペクトル信号の音声非音声
を判別して、周波数成分単位で判別結果に基づいた周波
数特性の減衰を行い、正確なピッチ情報を得て雑音成分
のみを取り出すコムフィルタを作成して雑音の特性を抽
出する点が、図1の音声処理装置と異なる。
ィルタ生成部2401と、雑音分離係数計算部2402
と、乗算部2403と、雑音周波数合成部2404とを
具備し、周波数成分単位でスペクトル信号の音声非音声
を判別して、周波数成分単位で判別結果に基づいた周波
数特性の減衰を行い、正確なピッチ情報を得て雑音成分
のみを取り出すコムフィルタを作成して雑音の特性を抽
出する点が、図1の音声処理装置と異なる。
【0260】音声非音声識別部106は、周波数分割部
104から出力された音声スペクトル信号とノイズベー
ス推定部105から出力されるノイズベースの値の差が
所定の閾値以上である場合、雑音成分を含む有音部分と
判定し、それ以外の場合、音声成分を含まない雑音のみ
の無音部分であると判定する。そして、音声非音声識別
部106は、判定結果をノイズベース推定部105と雑
音分離コムフィルタ生成部2401に出力する。
104から出力された音声スペクトル信号とノイズベー
ス推定部105から出力されるノイズベースの値の差が
所定の閾値以上である場合、雑音成分を含む有音部分と
判定し、それ以外の場合、音声成分を含まない雑音のみ
の無音部分であると判定する。そして、音声非音声識別
部106は、判定結果をノイズベース推定部105と雑
音分離コムフィルタ生成部2401に出力する。
【0261】雑音分離コムフィルタ生成部2401は、
各周波数成分における音声成分の有無に基づいてピッチ
調波を強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部2402に出力する。
各周波数成分における音声成分の有無に基づいてピッチ
調波を強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部2402に出力する。
【0262】具体的には、音声非音声識別部106にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果以上である場合、すなわ
ち、式(20) S2 f(k)≧θnos・Pbase(n,k) …(20) を満たす場合、雑音分離コムフィルタ生成部2401
は、当該周波数成分のフィルタの値を「1」とする。
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果以上である場合、すなわ
ち、式(20) S2 f(k)≧θnos・Pbase(n,k) …(20) を満たす場合、雑音分離コムフィルタ生成部2401
は、当該周波数成分のフィルタの値を「1」とする。
【0263】また、音声非音声識別部106において、
入力された音声信号のパワースペクトルが、音声とノイ
ズを判別する第一閾値と、入力された音声信号のパワー
スペクトルとの乗算結果より小さい場合、すなわち、式
(21) S2 f(k)<θnos・Pbase(n,k) …(21) を満たす場合、雑音分離コムフィルタ生成部2401
は、当該周波数成分のコムフィルタの値を「0」とす
る。ここで、θnosは、雑音分離に用いる閾値である。
入力された音声信号のパワースペクトルが、音声とノイ
ズを判別する第一閾値と、入力された音声信号のパワー
スペクトルとの乗算結果より小さい場合、すなわち、式
(21) S2 f(k)<θnos・Pbase(n,k) …(21) を満たす場合、雑音分離コムフィルタ生成部2401
は、当該周波数成分のコムフィルタの値を「0」とす
る。ここで、θnosは、雑音分離に用いる閾値である。
【0264】雑音分離係数計算部2402は、雑音分離
コムフィルタ生成部2401において生成されたコムフ
ィルタに、周波数特性に基づいた減衰係数を乗算して、
各周波数成分毎に入力信号の減衰係数の設定を行い、各
周波数成分の減衰係数を乗算部2403に出力する。具
体的には、雑音分離係数計算部2402は、コムフィル
タCOMB_nos(k)の値が0、すなわち阻止領域である場
合、雑音分離係数sepn(k)=1とする。
コムフィルタ生成部2401において生成されたコムフ
ィルタに、周波数特性に基づいた減衰係数を乗算して、
各周波数成分毎に入力信号の減衰係数の設定を行い、各
周波数成分の減衰係数を乗算部2403に出力する。具
体的には、雑音分離係数計算部2402は、コムフィル
タCOMB_nos(k)の値が0、すなわち阻止領域である場
合、雑音分離係数sepn(k)=1とする。
【0265】そして、コムフィルタCOMB_nos(k)の値が
1、すなわち通過領域である場合、以下の式(22)か
ら雑音分離係数sepn(k)を算出する。 ここで、rd(i)は、ランダム関数で均一分布の乱数
で構成される。また、kはビンを特定する変数であり、k
のとりうる範囲は0以上、FFT変換長つまり高速フー
リエ変換を行うデータ数の半数未満である。
1、すなわち通過領域である場合、以下の式(22)か
ら雑音分離係数sepn(k)を算出する。 ここで、rd(i)は、ランダム関数で均一分布の乱数
で構成される。また、kはビンを特定する変数であり、k
のとりうる範囲は0以上、FFT変換長つまり高速フー
リエ変換を行うデータ数の半数未満である。
【0266】乗算部2403は、周波数分割部104か
ら出力された音声スペクトルに雑音分離係数計算部24
02から出力された雑音分離係数を周波数成分単位で乗
算する。そして、乗算の結果得られたスペクトルを雑音
周波数合成部2404に出力する。
ら出力された音声スペクトルに雑音分離係数計算部24
02から出力された雑音分離係数を周波数成分単位で乗
算する。そして、乗算の結果得られたスペクトルを雑音
周波数合成部2404に出力する。
【0267】雑音周波数合成部2404は、乗算部24
03から出力された周波数成分単位のスペクトルを所定
の処理時間単位で、周波数領域で連続する音声スペクト
ルに合成してIFFT部111に出力する。IFFT部
111は、雑音周波数合成部2404から出力された音
声スペクトルにIFFTを行って音声信号に変換した信
号を出力する。
03から出力された周波数成分単位のスペクトルを所定
の処理時間単位で、周波数領域で連続する音声スペクト
ルに合成してIFFT部111に出力する。IFFT部
111は、雑音周波数合成部2404から出力された音
声スペクトルにIFFTを行って音声信号に変換した信
号を出力する。
【0268】このように、本実施の形態の音声処理装置
は、周波数成分単位でスペクトル信号の音声非音声を判
別して、周波数成分単位で判別結果に基づいた周波数特
性の減衰を行うことにより、正確なピッチ情報を得て雑
音成分のみを取り出すコムフィルタを作成でき、雑音の
特性を抽出することができる。また、コムフィルタの阻
止域において雑音成分を減衰せず、コムフィルタの通過
域において雑音成分をノイズベースの推定値と乱数を乗
算して再構成することにより良好な雑音分離特性を得る
ことができる。
は、周波数成分単位でスペクトル信号の音声非音声を判
別して、周波数成分単位で判別結果に基づいた周波数特
性の減衰を行うことにより、正確なピッチ情報を得て雑
音成分のみを取り出すコムフィルタを作成でき、雑音の
特性を抽出することができる。また、コムフィルタの阻
止域において雑音成分を減衰せず、コムフィルタの通過
域において雑音成分をノイズベースの推定値と乱数を乗
算して再構成することにより良好な雑音分離特性を得る
ことができる。
【0269】(実施の形態14)図25は、実施の形態
14にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図24と共通する構成について
は図1及び図24と同一番号を付し、詳しい説明を省略
する。
14にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図24と共通する構成について
は図1及び図24と同一番号を付し、詳しい説明を省略
する。
【0270】図25の音声処理装置は、SNR計算部2
501と、音声雑音フレーム検出部2502と、雑音コ
ムフィルタリセット部2503と、雑音分離コムフィル
タ生成部2504とを具備し、入力音声信号において音
声成分を含まないフレームに対する雑音分離コムフィル
タの周波数通過域を全て阻止域とする点が、図1及び図
24の音声処理装置と異なる。
501と、音声雑音フレーム検出部2502と、雑音コ
ムフィルタリセット部2503と、雑音分離コムフィル
タ生成部2504とを具備し、入力音声信号において音
声成分を含まないフレームに対する雑音分離コムフィル
タの周波数通過域を全て阻止域とする点が、図1及び図
24の音声処理装置と異なる。
【0271】SNR計算部2501は、周波数分割部1
04から出力された音声スペクトルから出力された第一
コムフィルタから音声信号のSNRを計算し、計算結果
を音声雑音フレーム検出部2502に出力する。
04から出力された音声スペクトルから出力された第一
コムフィルタから音声信号のSNRを計算し、計算結果
を音声雑音フレーム検出部2502に出力する。
【0272】音声雑音フレーム検出部2502は、SN
R計算部2501から出力されたSNRからフレーム単
位で入力信号が音声信号か雑音信号かを判断し、判断結
果を雑音コムフィルタリセット部2503に出力する。
具体的には、音声雑音フレーム検出部2502は、SN
Rが所定の閾値より大きい場合、入力した信号を音声信
号(音声フレーム)と判断し、SNRが所定の閾値以下
であるフレームが所定の数以上連続して発生した場合、
入力した信号を雑音信号(雑音フレーム)と判断する。
R計算部2501から出力されたSNRからフレーム単
位で入力信号が音声信号か雑音信号かを判断し、判断結
果を雑音コムフィルタリセット部2503に出力する。
具体的には、音声雑音フレーム検出部2502は、SN
Rが所定の閾値より大きい場合、入力した信号を音声信
号(音声フレーム)と判断し、SNRが所定の閾値以下
であるフレームが所定の数以上連続して発生した場合、
入力した信号を雑音信号(雑音フレーム)と判断する。
【0273】雑音コムフィルタリセット部2503は、
音声雑音フレーム検出部2502における判定結果が、
入力音声信号のフレームに音声成分が含まれず雑音成分
のみである判定結果である場合、雑音分離コムフィルタ
生成部2504にコムフィルタの全ての周波数通過域を
阻止域に変換する指示を出力する。
音声雑音フレーム検出部2502における判定結果が、
入力音声信号のフレームに音声成分が含まれず雑音成分
のみである判定結果である場合、雑音分離コムフィルタ
生成部2504にコムフィルタの全ての周波数通過域を
阻止域に変換する指示を出力する。
【0274】雑音分離コムフィルタ生成部2504は、
各周波数成分における音声成分の有無に基づいてピッチ
調波を強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部2402に出力する。
各周波数成分における音声成分の有無に基づいてピッチ
調波を強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部2402に出力する。
【0275】具体的には、音声非音声識別部106にお
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果以上である場合、すなわ
ち、式(20) S2 f(k)≧θnos・Pbase(n,k) …(20) を満たす場合、雑音分離コムフィルタ生成部2504
は、当該周波数成分のフィルタの値を「1」とする。
いて、入力された音声信号のパワースペクトルが、音声
とノイズを判別する第一閾値と、入力された音声信号の
パワースペクトルとの乗算結果以上である場合、すなわ
ち、式(20) S2 f(k)≧θnos・Pbase(n,k) …(20) を満たす場合、雑音分離コムフィルタ生成部2504
は、当該周波数成分のフィルタの値を「1」とする。
【0276】また、音声非音声識別部106において、
入力された音声信号のパワースペクトルが、音声とノイ
ズを判別する第一閾値と、入力された音声信号のパワー
スペクトルとの乗算結果より小さい場合、すなわち、式
(21) S2 f(k)<θnos・Pbase(n,k) …(21) を満たす場合、雑音分離コムフィルタ生成部2504
は、当該周波数成分のコムフィルタの値を「0」とす
る。ここで、θnosは、雑音分離に用いる閾値である。
入力された音声信号のパワースペクトルが、音声とノイ
ズを判別する第一閾値と、入力された音声信号のパワー
スペクトルとの乗算結果より小さい場合、すなわち、式
(21) S2 f(k)<θnos・Pbase(n,k) …(21) を満たす場合、雑音分離コムフィルタ生成部2504
は、当該周波数成分のコムフィルタの値を「0」とす
る。ここで、θnosは、雑音分離に用いる閾値である。
【0277】また、雑音分離コムフィルタ生成部250
4は、雑音コムフィルタリセット部2503からコムフ
ィルタの全ての周波数通過域を阻止域に変換する指示を
受け取った場合、指示に従いコムフィルタの全ての周波
数通過域を阻止域に変換する。
4は、雑音コムフィルタリセット部2503からコムフ
ィルタの全ての周波数通過域を阻止域に変換する指示を
受け取った場合、指示に従いコムフィルタの全ての周波
数通過域を阻止域に変換する。
【0278】このように、本実施の形態の音声処理装置
によれば、入力音声信号のフレームが音声を含まず、雑
音成分のみと判断した場合、コムフィルタの全ての周波
数通過域を阻止域に変換することにより、音声を含まな
い信号区間でノイズを全帯域でカットすることができ、
良好な雑音分離特性が得られる。
によれば、入力音声信号のフレームが音声を含まず、雑
音成分のみと判断した場合、コムフィルタの全ての周波
数通過域を阻止域に変換することにより、音声を含まな
い信号区間でノイズを全帯域でカットすることができ、
良好な雑音分離特性が得られる。
【0279】(実施の形態15)図26は、実施の形態
15にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図24と共通する構成について
は図1及び図24と同一番号を付し、詳しい説明を省略
する。図26の音声処理装置は、平均値計算部2601
を具備し、各周波数成分における音声スペクトルのパワ
平均値又は過去に処理を行ったフレームと処理を行うフ
レームのパワ平均値を求める点が、図1及び図24の音
声処理装置と異なる。
15にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1及び図24と共通する構成について
は図1及び図24と同一番号を付し、詳しい説明を省略
する。図26の音声処理装置は、平均値計算部2601
を具備し、各周波数成分における音声スペクトルのパワ
平均値又は過去に処理を行ったフレームと処理を行うフ
レームのパワ平均値を求める点が、図1及び図24の音
声処理装置と異なる。
【0280】平均値計算部2601は、乗算部2403
から出力された音声スペクトルのパワについて、近辺の
周波数成分との平均値及び過去に処理したフレームとの
平均値をとり、得られた平均値を雑音周波数合成部24
04に出力する。具体的には、以下に示す式(6)を用
いて音声スペクトルの平均値を算出する。 ここで、k1、k2は周波数成分を示し、k1<k<k2であ
る。n1は過去に処理を行ったフレームを示す番号、nは
処理を行うフレームを示す番号を示す。
から出力された音声スペクトルのパワについて、近辺の
周波数成分との平均値及び過去に処理したフレームとの
平均値をとり、得られた平均値を雑音周波数合成部24
04に出力する。具体的には、以下に示す式(6)を用
いて音声スペクトルの平均値を算出する。 ここで、k1、k2は周波数成分を示し、k1<k<k2であ
る。n1は過去に処理を行ったフレームを示す番号、nは
処理を行うフレームを示す番号を示す。
【0281】このように、本発明の実施の形態15に係
る音声処理装置によれば、各周波数成分における音声ス
ペクトルのパワ平均値又は過去に処理を行ったフレーム
と処理を行うフレームのパワ平均値を求めることによ
り、突発性雑音成分の影響は小さくなる。
る音声処理装置によれば、各周波数成分における音声ス
ペクトルのパワ平均値又は過去に処理を行ったフレーム
と処理を行うフレームのパワ平均値を求めることによ
り、突発性雑音成分の影響は小さくなる。
【0282】(実施の形態16)図27は、実施の形態
16にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1と共通する構成については図1と同
一番号を付し、詳しい説明を省略する。図27の音声処
理装置は、図11の音声処理装置と図24の音声処理装
置を組み合わせて、音声強調と雑音抽出とを行う例であ
る。
16にかかる音声処理装置の構成の例を示すブロック図
である。但し、図1と共通する構成については図1と同
一番号を付し、詳しい説明を省略する。図27の音声処
理装置は、図11の音声処理装置と図24の音声処理装
置を組み合わせて、音声強調と雑音抽出とを行う例であ
る。
【0283】図27において、周波数分割部104は、
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部1101、第一音声非音声識別部11
02、第二音声非音声識別部1103、音声ピッチ推定
部1104、乗算部2403、及び第三音声非音声識別
部2701に出力する。
FFT部103から出力された音声スペクトルを周波数
成分に分割して、各周波数成分毎に音声スペクトルをノ
イズベース推定部1101、第一音声非音声識別部11
02、第二音声非音声識別部1103、音声ピッチ推定
部1104、乗算部2403、及び第三音声非音声識別
部2701に出力する。
【0284】ノイズベース推定部1101は、第一音声
非音声識別部1102からフレームに音声成分が含まれ
ている判定結果が出力された場合、過去に推定したノイ
ズベースを第一音声非音声識別部1102に出力する。
また、ノイズベース推定部1101は、第二音声非音声
識別部1103からフレームに音声成分が含まれている
判定結果が出力された場合、過去に推定したノイズベー
スを第二音声非音声識別部1103に出力する。同様
に、ノイズベース推定部1101は、第三音声非音声識
別部2701からフレームに音声成分が含まれている判
定結果が出力された場合、過去に推定したノイズベース
を第三音声非音声識別部2701に出力する。
非音声識別部1102からフレームに音声成分が含まれ
ている判定結果が出力された場合、過去に推定したノイ
ズベースを第一音声非音声識別部1102に出力する。
また、ノイズベース推定部1101は、第二音声非音声
識別部1103からフレームに音声成分が含まれている
判定結果が出力された場合、過去に推定したノイズベー
スを第二音声非音声識別部1103に出力する。同様
に、ノイズベース推定部1101は、第三音声非音声識
別部2701からフレームに音声成分が含まれている判
定結果が出力された場合、過去に推定したノイズベース
を第三音声非音声識別部2701に出力する。
【0285】また、ノイズベース推定部1101は、第
一音声非音声識別部1102、第二音声非音声識別部1
103、または第三音声非音声識別部2701からフレ
ームに音声成分が含まれていない判定結果が出力された
場合、周波数分割部104から出力された音声スペクト
ルの周波数成分毎の短時間パワースペクトルとスペクト
ルの変化の平均量を表す移動平均値を算出して、過去に
算出した移動平均値とパワースペクトルの加重平均値を
とり、新しい移動平均値を算出する。
一音声非音声識別部1102、第二音声非音声識別部1
103、または第三音声非音声識別部2701からフレ
ームに音声成分が含まれていない判定結果が出力された
場合、周波数分割部104から出力された音声スペクト
ルの周波数成分毎の短時間パワースペクトルとスペクト
ルの変化の平均量を表す移動平均値を算出して、過去に
算出した移動平均値とパワースペクトルの加重平均値を
とり、新しい移動平均値を算出する。
【0286】第一音声非音声識別部1102は、周波数
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第一閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。第一音声非
音声識別部1102では、第一コムフィルタ生成部11
05が音声ピッチ情報を出来る限り多く抽出するフィル
タを生成するために、第一閾値を後述する第二音声非音
声識別部1103が用いる第二閾値より低い値に設定す
る。
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第一閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。第一音声非
音声識別部1102では、第一コムフィルタ生成部11
05が音声ピッチ情報を出来る限り多く抽出するフィル
タを生成するために、第一閾値を後述する第二音声非音
声識別部1103が用いる第二閾値より低い値に設定す
る。
【0287】そして、第一音声非音声識別部1102
は、判定結果を第一コムフィルタ生成部1105に出力
する。
は、判定結果を第一コムフィルタ生成部1105に出力
する。
【0288】第二音声非音声識別部1103は、周波数
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部1103は、判定結果を第二コムフ
ィルタ生成部1106に出力する。
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の第二閾値以上である場合、音声成分を含
む有音部分と判定し、それ以外の場合、音声成分を含ま
ない雑音のみの無音部分であると判定する。そして、第
二音声非音声識別部1103は、判定結果を第二コムフ
ィルタ生成部1106に出力する。
【0289】第一コムフィルタ生成部1105は、各周
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部1108に出力する。
波数成分における音声成分の有無に基づいてピッチ調波
を強調する第一コムフィルタを生成してコムフィルタ修
正部1108に出力する。
【0290】音声ピッチ推定部1104は、周波数分割
部104から出力された音声スペクトルから音声ピッチ
周期を推定し、推定結果を音声ピッチ修復部1107に
出力する。音声ピッチ修復部1107は、音声ピッチ推
定部1104から出力された推定結果に基づいて第二コ
ムフィルタの修正を行い、コムフィルタ修正部1108
に出力する。
部104から出力された音声スペクトルから音声ピッチ
周期を推定し、推定結果を音声ピッチ修復部1107に
出力する。音声ピッチ修復部1107は、音声ピッチ推
定部1104から出力された推定結果に基づいて第二コ
ムフィルタの修正を行い、コムフィルタ修正部1108
に出力する。
【0291】コムフィルタ修正部1108は、音声ピッ
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部1105におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
チ修復部1107において生成されたピッチ修復コムフ
ィルタを用いて第一コムフィルタ生成部1105におい
て生成された第一コムフィルタを修正し、修正したコム
フィルタを音声分離係数計算部1109に出力する。
【0292】音声分離係数計算部1109は、コムフィ
ルタ修正部1108において修正されたコムフィルタに
周波数特性に基づいた分離係数を乗算し、各周波数成分
毎に入力信号の分離係数を算出して乗算部109に出力
する。乗算部109は、周波数分割部104から出力さ
れた音声スペクトルに音声分離係数計算部1109から
出力された減衰係数を周波数成分単位で乗算する。そし
て、乗算の結果得られたスペクトルを周波数合成部11
0に出力する。
ルタ修正部1108において修正されたコムフィルタに
周波数特性に基づいた分離係数を乗算し、各周波数成分
毎に入力信号の分離係数を算出して乗算部109に出力
する。乗算部109は、周波数分割部104から出力さ
れた音声スペクトルに音声分離係数計算部1109から
出力された減衰係数を周波数成分単位で乗算する。そし
て、乗算の結果得られたスペクトルを周波数合成部11
0に出力する。
【0293】第三音声非音声識別部2701は、周波数
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の閾値以上である場合、雑音成分を含む有
音部分と判定し、それ以外の場合、音声成分を含まない
雑音のみの無音部分であると判定する。そして、第三音
声非音声識別部2701は、判定結果をノイズベース推
定部1101と雑音分離コムフィルタ生成部2401に
出力する。
分割部104から出力された音声スペクトル信号とノイ
ズベース推定部1101から出力されるノイズベースの
値の差が所定の閾値以上である場合、雑音成分を含む有
音部分と判定し、それ以外の場合、音声成分を含まない
雑音のみの無音部分であると判定する。そして、第三音
声非音声識別部2701は、判定結果をノイズベース推
定部1101と雑音分離コムフィルタ生成部2401に
出力する。
【0294】雑音分離コムフィルタ生成部2401は、
各周波数成分における音声成分の有無に基づいて音声ピ
ッチを強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部2402に出力する。雑音分
離係数計算部2402は、雑音分離コムフィルタ生成部
2401において生成されたコムフィルタに、周波数特
性に基づいた減衰係数を乗算して、各周波数成分毎に入
力信号の減衰係数の設定を行い、各周波数成分の減衰係
数を乗算部2403に出力する。
各周波数成分における音声成分の有無に基づいて音声ピ
ッチを強調するコムフィルタを生成して、このコムフィ
ルタを雑音分離係数計算部2402に出力する。雑音分
離係数計算部2402は、雑音分離コムフィルタ生成部
2401において生成されたコムフィルタに、周波数特
性に基づいた減衰係数を乗算して、各周波数成分毎に入
力信号の減衰係数の設定を行い、各周波数成分の減衰係
数を乗算部2403に出力する。
【0295】乗算部2403は、周波数分割部104か
ら出力された音声スペクトルに雑音分離係数計算部24
02から出力された雑音分離係数を周波数成分単位で乗
算する。そして、乗算の結果得られたスペクトルを雑音
周波数合成部2404に出力する。雑音周波数合成部2
404は、乗算部2403から出力された周波数成分単
位のスペクトルを所定の処理時間単位で、周波数領域で
連続する音声スペクトルに合成してIFFT部2702
に出力する。
ら出力された音声スペクトルに雑音分離係数計算部24
02から出力された雑音分離係数を周波数成分単位で乗
算する。そして、乗算の結果得られたスペクトルを雑音
周波数合成部2404に出力する。雑音周波数合成部2
404は、乗算部2403から出力された周波数成分単
位のスペクトルを所定の処理時間単位で、周波数領域で
連続する音声スペクトルに合成してIFFT部2702
に出力する。
【0296】IFFT部2702は、雑音周波数合成部
2404から出力された音声スペクトルにIFFTを行
って音声信号に変換した信号を出力する。
2404から出力された音声スペクトルにIFFTを行
って音声信号に変換した信号を出力する。
【0297】このように、本実施の形態の音声処理装置
によれば、周波数成分単位でスペクトル信号の音声非音
声を判別して、周波数成分単位で判別結果に基づいた周
波数特性の減衰を行うことにより、正確なピッチ情報を
得ることができるので、大きな減衰で雑音抑圧を行って
も音声歪の少ない音声強調を行うことができる。また、
同時に雑音抽出を行うこともできる。
によれば、周波数成分単位でスペクトル信号の音声非音
声を判別して、周波数成分単位で判別結果に基づいた周
波数特性の減衰を行うことにより、正確なピッチ情報を
得ることができるので、大きな減衰で雑音抑圧を行って
も音声歪の少ない音声強調を行うことができる。また、
同時に雑音抽出を行うこともできる。
【0298】なお、本発明の音声処理装置は、実施の形
態16の音声処理装置の例に限らず、上記各実施の形態
は、それぞれ組み合わせて適用することができる。
態16の音声処理装置の例に限らず、上記各実施の形態
は、それぞれ組み合わせて適用することができる。
【0299】また、上記いずれかの実施の形態に係る音
声強調及び雑音抽出は、音声処理装置として説明してい
るが、この音声強調及び雑音抽出をソフトウェアにより
実現することもできる。例えば、上記音声強調及び雑音
抽出を行うプログラムを予めROM(Read Only Memo
ry)に格納しておき、そのプログラムをCPU(Centra
l Processor Unit)によって動作するようにしてもよ
い。
声強調及び雑音抽出は、音声処理装置として説明してい
るが、この音声強調及び雑音抽出をソフトウェアにより
実現することもできる。例えば、上記音声強調及び雑音
抽出を行うプログラムを予めROM(Read Only Memo
ry)に格納しておき、そのプログラムをCPU(Centra
l Processor Unit)によって動作するようにしてもよ
い。
【0300】また、上記音声強調及び雑音抽出を行うプ
ログラムをコンピュータ読み取り可能な記憶媒体に格納
し、記憶媒体に格納されたプログラムをコンピュータの
RAM(Random Access Memory)に記録して、コンピ
ュータをそのプログラムに従って実行させてもよい。こ
のような場合においても、上記実施の形態と同様の作用
及び効果を呈する。
ログラムをコンピュータ読み取り可能な記憶媒体に格納
し、記憶媒体に格納されたプログラムをコンピュータの
RAM(Random Access Memory)に記録して、コンピ
ュータをそのプログラムに従って実行させてもよい。こ
のような場合においても、上記実施の形態と同様の作用
及び効果を呈する。
【0301】また、上記音声強調を行うプログラムをサ
ーバに格納し、サーバに格納されたプログラムをクライ
アントに転送して、クライアント上でそのプログラムを
実行させてもよい。このような場合においても、上記実
施の形態と同様の作用及び効果を呈する。
ーバに格納し、サーバに格納されたプログラムをクライ
アントに転送して、クライアント上でそのプログラムを
実行させてもよい。このような場合においても、上記実
施の形態と同様の作用及び効果を呈する。
【0302】また、上記いずれかの実施の形態に係る音
声処理装置は、無線通信装置、通信端末、基地局装置等
に搭載することもできる。この結果、通信時の音声を音
声強調または雑音抽出できる。
声処理装置は、無線通信装置、通信端末、基地局装置等
に搭載することもできる。この結果、通信時の音声を音
声強調または雑音抽出できる。
【0303】
【発明の効果】以上説明したように、音声スペクトルを
周波数領域単位で音声成分のある領域と音声成分のない
領域に識別して、この識別情報から得られる精度の高い
ピッチ周期に基づいて雑音を抑圧して、音声の歪みが少
なくかつノイズを十分に除去することができる。
周波数領域単位で音声成分のある領域と音声成分のない
領域に識別して、この識別情報から得られる精度の高い
ピッチ周期に基づいて雑音を抑圧して、音声の歪みが少
なくかつノイズを十分に除去することができる。
【図1】本発明の実施の形態1に係る音声処理装置の構
成を示すブロック図
成を示すブロック図
【図2】上記実施の形態における音声処理装置の動作を
示すフロー図
示すフロー図
【図3】上記実施の形態における音声処理装置で作成さ
れるコムフィルタの例を示す図
れるコムフィルタの例を示す図
【図4】実施の形態2にかかる音声処理装置の構成の例
を示すブロック図
を示すブロック図
【図5】実施の形態3にかかる音声処理装置の構成の例
を示すブロック図
を示すブロック図
【図6】実施の形態4にかかる音声処理装置の構成の例
を示すブロック図
を示すブロック図
【図7】実施の形態5にかかる音声処理装置の構成の例
を示すブロック図
を示すブロック図
【図8】実施の形態6にかかる音声処理装置の構成の例
を示すブロック図
を示すブロック図
【図9】上記実施の形態における音声処理装置における
コムフィルタの修復の例を示す図
コムフィルタの修復の例を示す図
【図10】実施の形態7にかかる音声処理装置の構成の
例を示すブロック図
例を示すブロック図
【図11】実施の形態8にかかる音声処理装置の構成の
例を示すブロック図
例を示すブロック図
【図12】コムフィルタの一例を示す図
【図13】コムフィルタの一例を示す図
【図14】コムフィルタの一例を示す図
【図15】コムフィルタの一例を示す図
【図16】コムフィルタの一例を示す図
【図17】コムフィルタの一例を示す図
【図18】コムフィルタの一例を示す図
【図19】実施の形態9にかかる音声処理装置の構成の
例を示すブロック
例を示すブロック
【図20】本実施の形態の音声処理装置の音声雑音判断
プログラムの一例を示す図
プログラムの一例を示す図
【図21】実施の形態10にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図22】実施の形態11にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図23】実施の形態12にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図24】実施の形態13にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図25】実施の形態14にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図26】実施の形態15にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図27】実施の形態16にかかる音声処理装置の構成
の例を示すブロック図
の例を示すブロック図
【図28】従来のコムフィルタ法を用いた音声処理装置
の例を示す図
の例を示す図
【図29】コムフィルタの減衰特性を示す図
104 周波数分割部 105、1101 ノイズベース推定部 106 音声非音声識別部 107 コムフィルタ生成部 108 減衰係数計算部 109、2403 乗算部 110 周波数合成部 401 ノイズ区間判別部 402 ノイズベース追跡部 501 ミュジカルノイズ抑制部 502、1108 コムフィルタ修正部 601、2201、2601 平均値計算部 701 区間判別部 702、2301 コムフィルタリセット部 801 音声ピッチ周期推定部 802、1107 音声ピッチ修復部 1001 閾値自動調整部 1102 第一音声非音声識別部 1103 第二音声非音声識別部 1104、1903 音声ピッチ推定部 1105、2101 第一コムフィルタ生成部 1106、2103 第二コムフィルタ生成部 1109 音声分離係数計算部 1901、2501 SNR計算部 1902、2502 音声雑音フレーム検出部 2102 第一ミュジカルノイズ抑圧部 2104 第二ミュジカルノイズ抑圧部 2401 雑音分離コムフィルタ生成部 2402 雑音分離係数計算部 2404 雑音周波数合成部 2503 雑音コムフィルタリセット部 2504 雑音分離コムフィルタ生成部 2701 第三音声非音声識別部
Claims (37)
- 【請求項1】 入力音声信号の音声スペクトルを所定の
周波数単位で分割する周波数分割手段と、前記周波数分
割手段において周波数分割された音声スペクトル及び雑
音成分のスペクトルであるノイズベースに基づいて前記
音声スペクトルに音声成分が含まれているか否か識別す
る音声識別手段と、前記音声識別手段の識別結果に基づ
いて所定の周波数単位でスペクトルパワの減衰を行う第
一コムフィルタを生成する第一コムフィルタ生成手段
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧する雑音抑圧手段と、前記雑音成分が
抑圧された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手段と、前記音声識別
手段により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手段と、を具備することを特徴とする音声処理装置。 - 【請求項2】 ノイズベース推定手段は、過去に推定し
たノイズベースの平均値と処理する音声スペクトルのパ
ワを加重平均した平均値に基づいてノイズベースを推定
して更新することを特徴とする請求項1に記載の音声処
理装置。 - 【請求項3】 音声識別手段は、音声スペクトルのパワ
とノイズベースのパワとの差分値が所定の閾値より大き
い場合に音声スペクトルに音声成分が含まれていると判
断し、前記差分値が前記閾値以下の場合に音声スペクト
ルに音声成分が含まれていないと判断することを特徴と
する請求項1又は請求項2に記載の音声処理装置。 - 【請求項4】 音声識別手段は、音声スペクトルのパワ
とノイズベースのパワとの差分値が所定の第一閾値より
大きい場合には音声スペクトルに音声成分が含まれてい
ると判断し、前記第一閾値より小さい第二閾値より前記
差分値が小さい場合には音声スペクトルに音声成分が含
まれていないと判断し、上記いずれの条件をも満たさな
い場合には過去に行った判断を判断結果とすることを特
徴とする請求項1又は請求項2に記載の音声処理装置。 - 【請求項5】 第一コムフィルタ生成手段は、音声成分
の含まれる周波数領域のスペクトルを強調し、雑音成分
の含まれる周波数領域のスペクトルを減衰することを特
徴とする請求項1から請求項4のいずれかに記載の音声
処理装置。 - 【請求項6】 所定の周波数単位でスペクトルパワの減
衰の度合いである減衰係数を設定する減衰係数計算手段
を具備し、雑音抑圧手段は、音声スペクトルに前記減衰
係数を乗算して雑音を抑圧することを特徴とする請求項
1から請求項5のいずれかに記載の音声処理装置。 - 【請求項7】 所定の時間単位で音声信号に音声成分が
含まれているか否かを判断する第二音声識別手段を具備
し、ノイズベース推定手段は、音声信号が音声を含む音
声区間から音声を含まない無音区間に移った場合に、無
音区間の音声スペクトルに基づいてノイズベースを推定
して更新することを特徴とする請求項1から請求項6の
いずれかに記載の音声処理装置。 - 【請求項8】 所定の周波数単位で音声スペクトルのパ
ワの平均値をとる第一平均値計算手段を具備し、ノイズ
ベース手段は、前記平均値に基づいてノイズベースを推
定して更新することを特徴とする請求項1から請求項7
のいずれかに記載の音声処理装置。 - 【請求項9】 音声識別手段は、音声スペクトルのパワ
の平均値に基づいて音声信号に音声成分が含まれている
か否か識別することを特徴とする請求項1から請求項8
のいずれかに記載の音声処理装置。 - 【請求項10】 雑音抑圧手段は、音声成分を含まない
音声スペクトルの全周波数領域に減衰を行うことを特徴
とする請求項1から請求項9のいずれかに記載の音声処
理装置。 - 【請求項11】 生成された第一コムフィルタのピッチ
周期情報に基づいて失われたコムフィルタのピッチ調波
情報を修正する第一ピッチ修正手段を具備することを特
徴とする請求項1から請求項10のいずれかに記載の音
声処理装置。 - 【請求項12】 生成された第一コムフィルタにおいて
減衰を行わない周波数成分の数が所定の数より大きい場
合、第一識別手段の閾値を大きくし、前記減衰を行わな
い周波数成分の数が前記所定の数以下の場合、前記第一
識別手段の閾値を小さくする閾値調整手段を具備するこ
とを特徴とする請求項1から請求項11のいずれかに記
載の音声処理装置。 - 【請求項13】 生成された第一コムフィルタにおいて
減衰を行わない周波数成分の数が所定の数以下の場合、
コムフィルタを音声スペクトルの全周波数領域に対して
減衰を行う第一コムフィルタリセット手段を具備するこ
とを特徴とする請求項1から請求項12のいずれかに記
載の音声処理装置。 - 【請求項14】 第一コムフィルタにおいて音声を通過
する帯域が所定の数以下である場合、突発性のノイズが
発生していると判断し、生成されたコムフィルタを全て
の領域の入力音声信号を減衰するコムフィルタに設定す
る第一ミュジカルノイズ抑圧手段を具備することを特徴
とする請求項1から請求項13のいずれかに記載の音声
処理装置。 - 【請求項15】 所定の周波数単位で音声スペクトルと
ノイズベースに基づいて音声識別手段と異なる条件で前
記音声スペクトルに音声成分が含まれているか否か識別
する第三音声識別手段と、前記第三音声識別手段の識別
結果に基づいて所定の周波数単位でスペクトルパワの減
衰を行う第二コムフィルタを生成する第二コムフィルタ
生成手段と、音声スペクトルから入力音声信号のピッチ
周期を推測する音声ピッチ推測手段と、前記音声ピッチ
推測手段において推測されたピッチ周期に基づいて第二
コムフィルタのピッチ調波構造を修復してピッチ修復コ
ムフィルタを生成する音声ピッチ修復手段と、ピッチ修
復コムフィルタに基づいて第一コムフィルタの修正を行
うコムフィルタ修正手段とを具備することを特徴とする
請求項1から請求項14のいずれかに記載の音声処理装
置。 - 【請求項16】 第三音声識別手段は、音声スペクトル
に音声が含まれると判断する条件を音声識別手段が音声
スペクトルに音声が含まれると判断する条件より厳しく
することを特徴とする請求項15に記載の音声処理装
置。 - 【請求項17】 第三音声識別手段は、音声スペクトル
のパワとノイズベースのパワとの差分値が所定の閾値よ
り大きい場合に音声スペクトルに音声成分が含まれてい
ると判断し、前記差分値が前記閾値以下の場合に音声ス
ペクトルに音声成分が含まれていないと判断することを
特徴とする請求項15又は請求項16に記載の音声処理
装置。 - 【請求項18】 第三音声識別手段は、音声スペクトル
のパワとノイズベースのパワとの差分値が所定の第三閾
値より大きい場合には音声スペクトルに音声成分が含ま
れていると判断し、前記第三閾値より小さい第四閾値よ
り前記差分値が小さい場合には音声スペクトルに音声成
分が含まれていないと判断し、上記いずれの条件をも満
たさない場合には過去に行った判断を判断結果とするこ
とを特徴とする請求項15又は請求項16に記載の音声
処理装置。 - 【請求項19】 第二コムフィルタ生成手段は、音声成
分の含まれる周波数領域のスペクトルを強調し、雑音成
分の含まれる周波数領域のスペクトルを減衰することを
特徴とする請求項15から請求項18のいずれかに記載
の音声処理装置。 - 【請求項20】 雑音抑圧された音声スペクトルのパワ
の平均値を所定の周波数単位で算出する第二平均値計算
手段を具備することを特徴とする請求項15から請求項
19のいずれかに記載の音声処理装置。 - 【請求項21】 第二音声識別手段は、音声スペクトル
のパワの平均値に基づいて音声信号に音声成分が含まれ
ているか否か識別することを特徴とする請求項15から
請求項20のいずれかに記載の音声処理装置。 - 【請求項22】 生成された第二コムフィルタのピッチ
周期情報に基づいて失われた第二コムフィルタのピッチ
調波情報を修正する第二ピッチ修正手段を具備すること
を特徴とする請求項15から請求項21のいずれかに記
載の音声処理装置。 - 【請求項23】 入力音声信号の音声スペクトルと生成
されたコムフィルタとから入力音声信号の信号対雑音比
を算出するSNR算出手段と、信号対雑音比から入力音
声信号の音声スペクトルから音声成分を検出する音声検
出手段と、前記音声検出手段において検出された音声ス
ペクトルからピッチ周期を推定する音声ピッチ推定手段
と、を具備し、第二ピッチ修正手段は、音声ピッチ推定
手段において推定されたピッチ周期でコムフィルタのピ
ッチ調波情報を修正することを特徴とする請求項22に
記載の音声処理装置。 - 【請求項24】 音声検出部において音声成分が検出さ
れた場合、第二コムフィルタを音声スペクトルの全周波
数領域に対して減衰を行う第二コムフィルタリセット手
段を具備することを特徴とする請求項15から請求項2
3のいずれかに記載の音声処理装置。 - 【請求項25】 コムフィルタ修正手段は、ピッチ修復
コムフィルタの通過領域と第二コムフィルタの通過領域
の重複する部分を修正後の第二コムフィルタの通過領域
とし、この通過領域以外の周波数領域を阻止領域とする
ことを特徴とする請求項15から請求項24のいずれか
に記載の音声処理装置。 - 【請求項26】 第二コムフィルタにおいて音声を通過
する帯域が所定の数以下である場合、突発性のノイズが
発生していると判断し、生成されたコムフィルタを全て
の領域の入力音声信号を減衰するコムフィルタに設定す
る第二ミュジカルノイズ抑圧手段を具備することを特徴
とする請求項15から請求項25のいずれかに記載の音
声処理装置。 - 【請求項27】 入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手段と、前記周波数
分割手段において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手段と、前記音声識別手段の識別結果に基
づいて所定の周波数単位でスペクトルパワの減衰を行う
第一コムフィルタを生成する第一コムフィルタ生成手段
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抽出する雑音抽出手段と、前記雑音成分が
抽出された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手段と、前記音声識別
手段により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手段と、を具備することを特徴とする音声処理装置。 - 【請求項28】 第三コムフィルタ生成手段は、第三コ
ムフィルタの通過域においてノイズベースの推定値と乱
数を乗算して再構成することを特徴とする請求項27に
記載の音声処理装置。 - 【請求項29】 コムフィルタを用いた音声処理後の音
声スペクトルの周波数平均及び時間平均を算出するスペ
クトル平均手段を具備することを特徴とする請求項27
又は請求項28に記載の音声処理装置。 - 【請求項30】 請求項1から請求項29のいずれかに
記載の音声処理装置を有することを特徴とする無線通信
装置。 - 【請求項31】 入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記音声識別手順の識別結果に基
づいて所定の周波数単位でスペクトルパワの減衰を行う
第一コムフィルタを生成する第一コムフィルタ生成手順
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧する雑音抑圧手順と、前記雑音成分が
抑圧された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手順と、前記音声識別
手順により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手順と、を含む音声処理プログラム。 - 【請求項32】 入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記識別の結果に基づいて所定の
周波数単位でスペクトルパワの減衰を行うコムフィルタ
を生成するコムフィルタ生成手順と、前記コムフィルタ
を用いて所定の周波数単位で前記音声スペクトルの雑音
成分を抽出する雑音抽出手順と、前記雑音成分が抽出さ
れた音声スペクトルを周波数領域で連続した音声スペク
トルに合成する周波数合成手順と、前記音声識別手順に
より音声成分が含まれないとされた音声スペクトルを用
いて前記ノイズベースを更新するノイズベース推定手段
と、を含む音声処理プログラム。 - 【請求項33】 入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記音声識別手順の識別結果に基
づいて所定の周波数単位でスペクトルパワの減衰を行う
第一コムフィルタを生成する第一コムフィルタ生成手順
と、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧する雑音抑圧手順と、前記雑音成分が
抑圧された音声スペクトルを周波数領域で連続した音声
スペクトルに合成する周波数合成手順と、前記音声識別
手順により音声成分が含まれないとされた音声スペクト
ルを用いて前記ノイズベースを更新するノイズベース推
定手順と、を含む音声処理プログラムを記録し、要求に
応じて前記音声処理プログラムを要求元に転送すること
を特徴とするサーバ。 - 【請求項34】 入力音声信号の音声スペクトルを所定
の周波数単位で分割する周波数分割手順と、前記周波数
分割手順において周波数分割された音声スペクトル及び
雑音成分のスペクトルであるノイズベースに基づいて前
記音声スペクトルに音声成分が含まれているか否か識別
する音声識別手順と、前記音声識別手順により音声成分
が含まれないとされた音声スペクトルを用いてノイズベ
ースを推定して更新するノイズベース推定手順と、前記
識別の結果に基づいて所定の周波数単位でスペクトルパ
ワの減衰を行うコムフィルタを生成するコムフィルタ生
成手順と、前記コムフィルタを用いて所定の周波数単位
で前記音声スペクトルの雑音成分を抽出する雑音抽出手
順と、前記雑音成分が抽出された音声スペクトルを周波
数領域で連続した音声スペクトルに合成する周波数合成
手順と、を含む音声処理プログラムを記録し、要求に応
じて前記音声処理プログラムを要求元に転送することを
特徴とするサーバ。 - 【請求項35】 請求項33又は請求項34に記載のサ
ーバより転送された音声処理プログラムを実行すること
を特徴とするクライアント装置。 - 【請求項36】 入力音声信号の音声スペクトルを所定
の周波数単位で分割し、周波数分割された音声スペクト
ル及び雑音成分のスペクトルであるノイズベースに基づ
いて前記音声スペクトルに音声成分が含まれているか否
か識別し、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第一コムフィルタを生成
し、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抑圧し、前記雑音成分が抑圧された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
し、前記音声識別の結果が音声成分を含まないと識別さ
れた音声スペクトルを用いて前記ノイズベースを更新す
ることを特徴とする音声処理方法。 - 【請求項37】 入力音声信号の音声スペクトルを所定
の周波数単位で分割し、周波数分割された音声スペクト
ル及び雑音成分のスペクトルであるノイズベースに基づ
いて前記音声スペクトルに音声成分が含まれているか否
か識別し、前記識別の結果に基づいて所定の周波数単位
でスペクトルパワの減衰を行う第一コムフィルタを生成
し、前記第一コムフィルタを用いて前記音声スペクトル
の雑音成分を抽出し、前記雑音成分が抽出された音声ス
ペクトルを周波数領域で連続した音声スペクトルに合成
し、前記音声識別の結果が音声成分を含まないと識別さ
れた音声スペクトルを用いて前記ノイズベースを更新す
ることを特徴とする音声処理方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001259473A JP2002149200A (ja) | 2000-08-31 | 2001-08-29 | 音声処理装置及び音声処理方法 |
GB0210536A GB2374265B (en) | 2000-08-31 | 2001-08-31 | Speech processing apparatus and speech processing method |
AU2001282568A AU2001282568A1 (en) | 2000-08-31 | 2001-08-31 | Speech processing device and speech processing method |
US10/111,974 US7286980B2 (en) | 2000-08-31 | 2001-08-31 | Speech processing apparatus and method for enhancing speech information and suppressing noise in spectral divisions of a speech signal |
PCT/JP2001/007518 WO2002019319A1 (fr) | 2000-08-31 | 2001-08-31 | Dispositif de traitement vocal et procede de traitement vocal |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000-264197 | 2000-08-31 | ||
JP2000264197 | 2000-08-31 | ||
JP2001259473A JP2002149200A (ja) | 2000-08-31 | 2001-08-29 | 音声処理装置及び音声処理方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005351249A Division JP4445460B2 (ja) | 2000-08-31 | 2005-12-05 | 音声処理装置及び音声処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002149200A true JP2002149200A (ja) | 2002-05-24 |
Family
ID=26599014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001259473A Pending JP2002149200A (ja) | 2000-08-31 | 2001-08-29 | 音声処理装置及び音声処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7286980B2 (ja) |
JP (1) | JP2002149200A (ja) |
AU (1) | AU2001282568A1 (ja) |
GB (1) | GB2374265B (ja) |
WO (1) | WO2002019319A1 (ja) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003280696A (ja) * | 2002-03-19 | 2003-10-02 | Matsushita Electric Ind Co Ltd | 音声強調装置及び音声強調方法 |
JP2004029674A (ja) * | 2002-06-28 | 2004-01-29 | Matsushita Electric Ind Co Ltd | 雑音信号符号化装置及び雑音信号復号化装置 |
JP2004061617A (ja) * | 2002-07-25 | 2004-02-26 | Fujitsu Ltd | 受話音声処理装置 |
JP2004096185A (ja) * | 2002-08-29 | 2004-03-25 | Kenwood Corp | 雑音除去装置、雑音除去方法、及び、プログラム |
JP2004341339A (ja) * | 2003-05-16 | 2004-12-02 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2005037617A (ja) * | 2003-07-18 | 2005-02-10 | Fujitsu Ltd | 音声信号の雑音低減装置 |
WO2005124739A1 (ja) * | 2004-06-18 | 2005-12-29 | Matsushita Electric Industrial Co., Ltd. | 雑音抑圧装置および雑音抑圧方法 |
WO2006077934A1 (ja) * | 2005-01-21 | 2006-07-27 | Matsushita Electric Industrial Co., Ltd. | 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法 |
JP2007517249A (ja) * | 2003-12-29 | 2007-06-28 | ノキア コーポレイション | 暗騒音存在時の音声を改善するための方法および装置 |
JP2008085520A (ja) * | 2006-09-27 | 2008-04-10 | Kyushu Univ | 放送装置 |
JP2009105666A (ja) * | 2007-10-23 | 2009-05-14 | Panasonic Electric Works Co Ltd | 拡声通話装置 |
WO2010106752A1 (ja) * | 2009-03-19 | 2010-09-23 | パナソニック株式会社 | 歪補正受信機及び歪補正方法 |
JPWO2012070668A1 (ja) * | 2010-11-25 | 2014-05-19 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP2014110546A (ja) * | 2012-12-03 | 2014-06-12 | Nippon Telegr & Teleph Corp <Ntt> | ビデオ会議システム |
JP2014115377A (ja) * | 2012-12-07 | 2014-06-26 | Yamaha Corp | 音響処理装置 |
WO2016024363A1 (ja) * | 2014-08-14 | 2016-02-18 | 株式会社ピー・ソフトハウス | オーディオ信号処理装置、オーディオ信号処理方法およびオーディオ信号処理プログラム |
JP2016186652A (ja) * | 2010-07-02 | 2016-10-27 | ドルビー・インターナショナル・アーベー | ポストフィルタ、デコーダシステム、エンコーダシステム及び関連する方法 |
JP2017513046A (ja) * | 2014-03-31 | 2017-05-25 | グーグル インコーポレイテッド | 状況に応じた過渡抑制 |
WO2017104040A1 (ja) * | 2015-12-17 | 2017-06-22 | パイオニア株式会社 | ノイズ検出装置、ノイズ低減装置及びノイズ検出方法 |
JP2019194742A (ja) * | 2013-03-26 | 2019-11-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ分類および処理のための装置および方法 |
JP2023001605A (ja) * | 2021-06-21 | 2023-01-06 | アルインコ株式会社 | 無線通信装置 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7369603B2 (en) * | 2003-05-28 | 2008-05-06 | Intel Corporation | Compensating for spectral attenuation |
KR101035736B1 (ko) * | 2003-12-12 | 2011-05-20 | 삼성전자주식회사 | 이동통신 시스템의 단말 장치에서 반향 제거 장치 및 방법 |
WO2006006366A1 (ja) * | 2004-07-13 | 2006-01-19 | Matsushita Electric Industrial Co., Ltd. | ピッチ周波数推定装置およびピッチ周波数推定方法 |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
CN1815550A (zh) * | 2005-02-01 | 2006-08-09 | 松下电器产业株式会社 | 可识别环境中的语音与非语音的方法及系统 |
KR100735343B1 (ko) * | 2006-04-11 | 2007-07-04 | 삼성전자주식회사 | 음성신호의 피치 정보 추출장치 및 방법 |
JP4882899B2 (ja) * | 2007-07-25 | 2012-02-22 | ソニー株式会社 | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム |
JP5089295B2 (ja) * | 2007-08-31 | 2012-12-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理システム、方法及びプログラム |
JP5302968B2 (ja) * | 2007-09-12 | 2013-10-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 音声明瞭化を伴うスピーチ改善 |
KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
PL2410522T3 (pl) | 2008-07-11 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder sygnału audio, sposób kodowania sygnału audio i program komputerowy |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
CN103109320B (zh) * | 2010-09-21 | 2015-08-05 | 三菱电机株式会社 | 噪声抑制装置 |
RU2477533C2 (ru) * | 2011-04-26 | 2013-03-10 | Юрий Анатольевич Кропотов | Способ многоканального адаптивного подавления акустических шумов и сосредоточенных помех и устройство для его осуществления |
EP2702204B8 (en) * | 2011-04-28 | 2016-09-21 | ABB Schweiz AG | Determination of cd and md variations from scanning measurements of a sheet of material |
DE112011105791B4 (de) * | 2011-11-02 | 2019-12-12 | Mitsubishi Electric Corporation | Störungsunterdrückungsvorrichtung |
WO2013118192A1 (ja) * | 2012-02-10 | 2013-08-15 | 三菱電機株式会社 | 雑音抑圧装置 |
WO2013139038A1 (en) * | 2012-03-23 | 2013-09-26 | Siemens Aktiengesellschaft | Speech signal processing method and apparatus and hearing aid using the same |
US20130282373A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
US20140358552A1 (en) * | 2013-05-31 | 2014-12-04 | Cirrus Logic, Inc. | Low-power voice gate for device wake-up |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
US9406308B1 (en) | 2013-08-05 | 2016-08-02 | Google Inc. | Echo cancellation via frequency domain modulation |
JP6482173B2 (ja) * | 2014-01-20 | 2019-03-13 | キヤノン株式会社 | 音響信号処理装置およびその方法 |
DE112015004185T5 (de) * | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
US9548067B2 (en) | 2014-09-30 | 2017-01-17 | Knuedge Incorporated | Estimating pitch using symmetry characteristics |
US9396740B1 (en) * | 2014-09-30 | 2016-07-19 | Knuedge Incorporated | Systems and methods for estimating pitch in audio signals based on symmetry characteristics independent of harmonic amplitudes |
CN107210824A (zh) | 2015-01-30 | 2017-09-26 | 美商楼氏电子有限公司 | 麦克风的环境切换 |
US9842611B2 (en) | 2015-02-06 | 2017-12-12 | Knuedge Incorporated | Estimating pitch using peak-to-peak distances |
US9870785B2 (en) | 2015-02-06 | 2018-01-16 | Knuedge Incorporated | Determining features of harmonic signals |
US9922668B2 (en) | 2015-02-06 | 2018-03-20 | Knuedge Incorporated | Estimating fractional chirp rate with multiple frequency representations |
WO2017143334A1 (en) * | 2016-02-19 | 2017-08-24 | New York University | Method and system for multi-talker babble noise reduction using q-factor based signal decomposition |
US10319390B2 (en) * | 2016-02-19 | 2019-06-11 | New York University | Method and system for multi-talker babble noise reduction |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
WO2018133951A1 (en) * | 2017-01-23 | 2018-07-26 | Huawei Technologies Co., Ltd. | An apparatus and method for enhancing a wanted component in a signal |
US10332545B2 (en) * | 2017-11-28 | 2019-06-25 | Nuance Communications, Inc. | System and method for temporal and power based zone detection in speaker dependent microphone environments |
EP3792917B1 (en) * | 2018-05-10 | 2022-12-28 | Nippon Telegraph And Telephone Corporation | Pitch enhancement apparatus, method, computer program and recording medium for the same |
CN111402852B (zh) * | 2019-01-02 | 2023-02-28 | 香港科技大学 | 频率离散主动面板的低频吸声和软边界效应 |
CN114166334B (zh) * | 2021-11-23 | 2023-06-27 | 中国直升机设计研究所 | 一种非消声风洞旋翼噪声测点的声衰减系数校准方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3691486A (en) * | 1970-09-02 | 1972-09-12 | Bell Telephone Labor Inc | Modified time domain comb filters |
JPS5263317A (en) * | 1975-11-19 | 1977-05-25 | Nippon Gakki Seizo Kk | Electronic musical instrument |
US4417337A (en) * | 1981-06-29 | 1983-11-22 | Bell Telephone Laboratories, Incorporated, | Adaptive multitone transmission parameter test arrangement |
JPH0632000B2 (ja) * | 1984-06-11 | 1994-04-27 | 日本電気株式会社 | 音声楽音合成装置 |
WO1987000366A1 (en) | 1985-07-01 | 1987-01-15 | Motorola, Inc. | Noise supression system |
US4811404A (en) | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
JP2830276B2 (ja) * | 1990-01-18 | 1998-12-02 | 松下電器産業株式会社 | 信号処理装置 |
CA2040025A1 (en) * | 1990-04-09 | 1991-10-10 | Hideki Satoh | Speech detection apparatus with influence of input level and noise reduced |
US5434912A (en) * | 1993-08-11 | 1995-07-18 | Bell Communications Research, Inc. | Audio processing system for point-to-point and multipoint teleconferencing |
JP2616549B2 (ja) * | 1993-12-10 | 1997-06-04 | 日本電気株式会社 | 音声復号装置 |
JP3192051B2 (ja) * | 1994-07-28 | 2001-07-23 | 日本電気株式会社 | 音声符号化装置 |
JPH08223677A (ja) * | 1995-02-15 | 1996-08-30 | Nippon Telegr & Teleph Corp <Ntt> | 送話器 |
JPH1049197A (ja) * | 1996-08-06 | 1998-02-20 | Denso Corp | 音声復元装置及び音声復元方法 |
JPH09212196A (ja) | 1996-01-31 | 1997-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 雑音抑圧装置 |
US5673024A (en) * | 1996-04-22 | 1997-09-30 | Sensormatic Electronics Corporation | Electronic article surveillance system with comb filtering by polyphase decomposition and nonlinear filtering of subsequences |
JP3269969B2 (ja) * | 1996-05-21 | 2002-04-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
JPH1138999A (ja) * | 1997-07-16 | 1999-02-12 | Olympus Optical Co Ltd | 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体 |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
JP3310225B2 (ja) | 1998-09-29 | 2002-08-05 | 松下電器産業株式会社 | 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置 |
US7003120B1 (en) * | 1998-10-29 | 2006-02-21 | Paul Reed Smith Guitars, Inc. | Method of modifying harmonic content of a complex waveform |
US6366880B1 (en) | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
-
2001
- 2001-08-29 JP JP2001259473A patent/JP2002149200A/ja active Pending
- 2001-08-31 US US10/111,974 patent/US7286980B2/en not_active Expired - Lifetime
- 2001-08-31 GB GB0210536A patent/GB2374265B/en not_active Expired - Fee Related
- 2001-08-31 AU AU2001282568A patent/AU2001282568A1/en not_active Abandoned
- 2001-08-31 WO PCT/JP2001/007518 patent/WO2002019319A1/ja active Application Filing
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003280696A (ja) * | 2002-03-19 | 2003-10-02 | Matsushita Electric Ind Co Ltd | 音声強調装置及び音声強調方法 |
JP2004029674A (ja) * | 2002-06-28 | 2004-01-29 | Matsushita Electric Ind Co Ltd | 雑音信号符号化装置及び雑音信号復号化装置 |
JP2004061617A (ja) * | 2002-07-25 | 2004-02-26 | Fujitsu Ltd | 受話音声処理装置 |
JP2004096185A (ja) * | 2002-08-29 | 2004-03-25 | Kenwood Corp | 雑音除去装置、雑音除去方法、及び、プログラム |
JP2004341339A (ja) * | 2003-05-16 | 2004-12-02 | Mitsubishi Electric Corp | 雑音抑圧装置 |
JP2005037617A (ja) * | 2003-07-18 | 2005-02-10 | Fujitsu Ltd | 音声信号の雑音低減装置 |
JP2007517249A (ja) * | 2003-12-29 | 2007-06-28 | ノキア コーポレイション | 暗騒音存在時の音声を改善するための方法および装置 |
KR100870502B1 (ko) * | 2003-12-29 | 2008-11-25 | 노키아 코포레이션 | 배경잡음의 존재하에 음성 강화를 위한 방법 및 기기 |
WO2005124739A1 (ja) * | 2004-06-18 | 2005-12-29 | Matsushita Electric Industrial Co., Ltd. | 雑音抑圧装置および雑音抑圧方法 |
WO2006077934A1 (ja) * | 2005-01-21 | 2006-07-27 | Matsushita Electric Industrial Co., Ltd. | 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法 |
JP2008085520A (ja) * | 2006-09-27 | 2008-04-10 | Kyushu Univ | 放送装置 |
JP2009105666A (ja) * | 2007-10-23 | 2009-05-14 | Panasonic Electric Works Co Ltd | 拡声通話装置 |
WO2010106752A1 (ja) * | 2009-03-19 | 2010-09-23 | パナソニック株式会社 | 歪補正受信機及び歪補正方法 |
US9858940B2 (en) | 2010-07-02 | 2018-01-02 | Dolby International Ab | Pitch filter for audio signals |
US10811024B2 (en) | 2010-07-02 | 2020-10-20 | Dolby International Ab | Post filter for audio signals |
US11996111B2 (en) | 2010-07-02 | 2024-05-28 | Dolby International Ab | Post filter for audio signals |
US11610595B2 (en) | 2010-07-02 | 2023-03-21 | Dolby International Ab | Post filter for audio signals |
JP2016186652A (ja) * | 2010-07-02 | 2016-10-27 | ドルビー・インターナショナル・アーベー | ポストフィルタ、デコーダシステム、エンコーダシステム及び関連する方法 |
US11183200B2 (en) | 2010-07-02 | 2021-11-23 | Dolby International Ab | Post filter for audio signals |
US9595270B2 (en) | 2010-07-02 | 2017-03-14 | Dolby International Ab | Selective post filter |
US10236010B2 (en) | 2010-07-02 | 2019-03-19 | Dolby International Ab | Pitch filter for audio signals |
US9830923B2 (en) | 2010-07-02 | 2017-11-28 | Dolby International Ab | Selective bass post filter |
JPWO2012070668A1 (ja) * | 2010-11-25 | 2014-05-19 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
US9792925B2 (en) | 2010-11-25 | 2017-10-17 | Nec Corporation | Signal processing device, signal processing method and signal processing program |
JP6064600B2 (ja) * | 2010-11-25 | 2017-01-25 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP2014110546A (ja) * | 2012-12-03 | 2014-06-12 | Nippon Telegr & Teleph Corp <Ntt> | ビデオ会議システム |
JP2014115377A (ja) * | 2012-12-07 | 2014-06-26 | Yamaha Corp | 音響処理装置 |
JP2019194742A (ja) * | 2013-03-26 | 2019-11-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ分類および処理のための装置および方法 |
JP2017513046A (ja) * | 2014-03-31 | 2017-05-25 | グーグル インコーポレイテッド | 状況に応じた過渡抑制 |
US9881633B2 (en) | 2014-08-14 | 2018-01-30 | P Softhouse Co., Ltd. | Audio signal processing device, audio signal processing method, and audio signal processing program |
WO2016024363A1 (ja) * | 2014-08-14 | 2016-02-18 | 株式会社ピー・ソフトハウス | オーディオ信号処理装置、オーディオ信号処理方法およびオーディオ信号処理プログラム |
JPWO2017104040A1 (ja) * | 2015-12-17 | 2018-10-11 | パイオニア株式会社 | ノイズ検出装置、ノイズ低減装置及びノイズ検出方法 |
WO2017104040A1 (ja) * | 2015-12-17 | 2017-06-22 | パイオニア株式会社 | ノイズ検出装置、ノイズ低減装置及びノイズ検出方法 |
JP2023001605A (ja) * | 2021-06-21 | 2023-01-06 | アルインコ株式会社 | 無線通信装置 |
JP7221335B2 (ja) | 2021-06-21 | 2023-02-13 | アルインコ株式会社 | 無線通信装置 |
Also Published As
Publication number | Publication date |
---|---|
GB0210536D0 (en) | 2002-06-19 |
AU2001282568A1 (en) | 2002-03-13 |
GB2374265A (en) | 2002-10-09 |
US20030023430A1 (en) | 2003-01-30 |
GB2374265B (en) | 2005-01-12 |
US7286980B2 (en) | 2007-10-23 |
WO2002019319A1 (fr) | 2002-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002149200A (ja) | 音声処理装置及び音声処理方法 | |
JP3591068B2 (ja) | 音声信号の雑音低減方法 | |
RU2329550C2 (ru) | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума | |
CA2732723C (en) | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction | |
JP3484757B2 (ja) | 音声信号の雑音低減方法及び雑音区間検出方法 | |
EP2546831B1 (en) | Noise suppression device | |
US8484020B2 (en) | Determining an upperband signal from a narrowband signal | |
EP1376539A1 (en) | Noise suppressor | |
US20080219472A1 (en) | Noise suppressor | |
US20100057476A1 (en) | Signal bandwidth extension apparatus | |
WO2005124739A1 (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP2002536707A (ja) | 音声活動に基づくゲイン制限による音声強化 | |
US20110238417A1 (en) | Speech detection apparatus | |
JP5752324B2 (ja) | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 | |
US20080052067A1 (en) | Noise suppressor for removing irregular noise | |
JP2000330597A (ja) | 雑音抑圧装置 | |
JP4445460B2 (ja) | 音声処理装置及び音声処理方法 | |
JP4006770B2 (ja) | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 | |
JP2006126859A5 (ja) | ||
Krishnamoorthy et al. | Temporal and spectral processing methods for processing of degraded speech: a review | |
EP1635331A1 (en) | Method for estimating a signal to noise ratio | |
JP2002258899A (ja) | 雑音抑圧方法および雑音抑圧装置 | |
WO2006077934A1 (ja) | 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法 | |
Hendriks et al. | Adaptive time segmentation of noisy speech for improved speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051004 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060214 |