JP2010529511A - 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 - Google Patents

符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 Download PDF

Info

Publication number
JP2010529511A
JP2010529511A JP2010511708A JP2010511708A JP2010529511A JP 2010529511 A JP2010529511 A JP 2010529511A JP 2010511708 A JP2010511708 A JP 2010511708A JP 2010511708 A JP2010511708 A JP 2010511708A JP 2010529511 A JP2010529511 A JP 2010529511A
Authority
JP
Japan
Prior art keywords
signal
quantization noise
encoding
quantization
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010511708A
Other languages
English (en)
Inventor
ガルシア ジャン−リュク
マロー クロード
コヴシー バラーツ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2010529511A publication Critical patent/JP2010529511A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、量子化操作(Q)を適用する所定種類の符号化によって圧縮符号化し(COD)、その後に復号化した(DEC)信号の処理に関するものであり、このため、復号化した信号(S*)中に量子化ノイズが存在する。本発明の信号処理は、量子化ノイズの低減(TBQ)を復号化した信号(S)に、好適には次の方法で適用することを含む:まず、圧縮符号化の種類についての情報(INF)を取得し、符号化が発生し得た量子化ノイズ(BQ)を推定することによって、この情報に適応させた量子化ノイズ低減用のモデルを選択し、選択したモデルに応じて、復号化した信号(S*)に量子化ノイズを低減するための処理(FIL)を適用する。

Description

本発明は信号処理に関するものであり、特に、電気通信分野におけるデジタル信号の信号処理に関するものであり、これらの信号は、例えば音声、音楽、ビデオ又は他の信号とすることができる。
通常、オーディオ信号及び/又はビデオ信号を十分な品質で伝送するために必要なビットレートは、電気通信における重要なパラメータである。このパラメータを低減し、同一のネットワーク経由で可能な通信の数を増加させるために、特に、信号を伝送するために必要な情報の量を圧縮するためのオーディオ符号器が開発されてきた。
特定の符号器は、特に高い情報の圧縮比を達成することができる。こうした符号器は通常、情報をモデル化し量子化するための先進技術を用いている。従って、こうした符号器は、信号のモデル又は部分データしか伝送しない。
復号化信号は、(量子化操作により情報の一部が伝送されていないので)原信号とは同一でないが、それにもかかわらず、復号化信号は原信号に非常な類似性を留めている。数学的観点からの、復号化信号と原信号との相違を、「量子化ノイズ」と称する。この相違は、符号化−復号化によって導入された「歪み」と言うこともできる。
信号の圧縮処理は、量子化ノイズを最小にするように設計されることが多く、特に、オーディオ信号の処理を含む際は、量子化ノイズをできる限り不可聴にするように設計される。従って、この量子化ノイズを「マスキング」する目的で、ヒアリングの心理音響特性を考慮する技術が存在する。しかし、可能な最低ビットレートを得るためには、時として、量子化ノイズが可聴なまま残ることがあり、このことは、特定の状況では、信号の了解度を劣化させる。
このノイズを低減するために、2つの技術群が通常用いられる。
まず、例えば、CELP(符号励振線形予測Coded Excited Linear Prediction)型の音声復号器で用いられるタイプの知覚ポストフィルタを用いることができる。これは、歪みという代償を払って主観的品質を改善するフィルタリングを含む。具体的には、信号の減衰を、量子化ノイズが最も耳につく区間(特に、2つのホルマント間)に適用する。現在の知覚的なポストフィルタは、音声信号に対しては良好な結果を与えるが、他の種類の信号(例えば音楽信号)に対しては、より良好でない結果を与える。
具体的には、符号化音声を改善するためのポストフィルタは、特に非特許文献1に記載されている。記載されたモデルは、次の2つの区分への分割に基づく:
「長期」区分は、高調波(基本周波数の高調波)を強化し、2つの高調波間にスペクトルの谷間を開ける。
「短期」区分は、ホルマントを強化し、2つのホルマント間にスペクトルの谷間を開ける。
高調波とホルマントは、音声の周知のスペクトル特性であるが、この種の処理を音声以外の信号に適用することは、大きな歪みを生成する。例えば、音楽信号の豊富なスペクトルは、こうした単純な信号モデルで処理することができない。
従って、知覚ポストフィルタは歪みを発生し得る、というのは、これらは十分正確でないモデルに基づくからである。さらに、知覚ポストフィルタは通常、無音の期間中は無効である。これらの問題は、CELP型ではない復号器、例えばG.711規格またはG.722規格の範囲内の復号器に、この種の知覚フィルタを内蔵させることを最初に追求した出願人が、実験的に気付くことができた。
他の処理群は、有効信号をスプリアスノイズ(不要輻射雑音)と区別するための、従来のノイズ低減処理を目標としている。従って、この種の処理は、信号捕捉の環境に関連するノイズを低減することを可能にし、音声信号用に用いられることが多い。しかし、この例では、この処理を、音を拾う環境に関連するノイズに対して透明にすることができず、このことは特に、音楽信号の符号化にとって問題を生じさせる。従って、符号化/復号化に当たり、周囲ノイズを伝送することは望むことができ、従って、このノイズ低減は、この種のノイズには適用しないことが望ましい。
Chen J.H., Gersho A., (チェン・ジェイ・エッチ,ゲルショー・エー) "Adaptive Postfiltering for Quality Enhancement of Coded Speech" 「符号化音声の品質の向上のための適応的ポストフィルタリング」, IEEE Trans. On Speech and Audio Proc.(音声及びオーディオ処理に関するアイ・イー・イー・イー・トランザクション),1995年1月
本発明は、上記状況を改善する。
従って、本発明は、量子化操作を適用する所定種類の符号化により圧縮符号化し、その後に復号化した信号を処理する方法を提案する。
本発明に関する方法は、圧縮符号化の種類について先験的に得られた、信号の特性とは無関係である情報に基づいて、圧縮符号化によって導入された量子化ノイズを推定するステップと、復号化した信号に推定量子化ノイズ低減処理を適用するために、復号化した信号に適用するフィルタリング関数を、推定した量子化ノイズに基づいて決定するステップとを含む。
「ノイズ−低減処理」とは、この例では、上述した種類の操作を意味し、この操作は、処理する信号から有効信号を抽出すること、及び、例えば、復号化した信号に適用するフィルタにおいて動作するゲイン関数を規定することによって、スプリアス信号をフィルタ処理することから成る。この例では、量子化ノイズはこのようにしてフィルタ処理される。
従って、これは従来のノイズ低減の問題であるが、この例では、量子化ノイズを低減するために適用される。このノイズ低減は、非特許文献1に記載された種類の知覚的ポストフィルタには全く類似しておらず、この知覚的ポストフィルタは、信号の特性及び動特性に完全に基づくのに対し、本発明の範囲内のノイズ低減処理はむしろ、量子化ノイズの測定に基づく。
好適例では:
圧縮符号化の種類についての情報に基づいて、量子化ノイズ低減モデルを選定し、
選定したモデルに応じて、量子化ノイズ低減処理を、復号化した信号に適用する。
特に、一旦、モデルを選定すると:
このモデルに基づいて、圧縮符号化が導入した量子化ノイズを推定し、
推定した量子化ノイズに基づき、復号化した信号に量子化ノイズ低減処理を適用するために、復号化した信号に適用するフィルタリング関数(及び特に、このフィルタリング関数のパラメータ)を決定する。
従って、実行する各種類の圧縮符号化に特有の種類のノイズ低減処理が提供される。ノイズ低減フィルタの特性(ゲイン関数の種類、ゲイン関数のパラメータ、等)を推定する方法そのものは、実行する符号化の種類に依存する。
特に、以下に挙げる好適な実施例では、量子化ノイズ自体が、実行する符号化の種類に大きく依存することがわかる。量子化ノイズの変化を、復号化した信号の変化の関数として確立することができること、及び、この量子化ノイズの変化は、使用する符号化の種類に特有であることがわかる。
従って、有利な好適例では:
符号化の種類の情報に基づいて、量子化ノイズの変化を、復号化した信号の少なくとも1つのパラメータの関数として推定し、
復号化した信号中のこのパラメータの現在値に応じて、量子化ノイズを推定して、このパラメータの現在値を有する復号化した信号に適用するフィルタリング関数を決定する。
従って、圧縮符号化の種類についての情報は、信号の特性とは無関係の先験的情報であり、これより、次のものを有利に推定することができることは明らかである:
復号化した信号の少なくとも1つのパラメータの関数としての、信号対量子化ノイズ比の変化モデル、及び/又は、
量子化ノイズのスペクトル配色(即ち、復号化した信号の特性の関数としての、量子化ノイズのスペクトル変化)。
1つの可能な好適例では、圧縮符号化の種類についての上記先験的情報は、符号器の宣言手続き中に得られる。
本発明は、圧縮符号化の種類がG.711規格による符号化である状況に特に適している。
本発明の他の主題は、所定種類の符号化により最初に圧縮符号化し、その後に復号化した信号を処理する装置である。この装置は:
圧縮符号化の種類について先験的に得られた、信号の特性とは無関係の情報に基づいて、圧縮符号化によって導入された量子化ノイズを推定する手段と、
復号化した信号に推定量子化ノイズ低減処理を適用するために、復号化した信号に適用するフィルタリング関数を、推定した量子化ノイズに基づいて決定する手段と
を備えている。
より一般的には、この装置は、上述した方法を適用する手段を備えていることが有利である。
こうした装置は、図1に示すように、復号器内の、復号化装置の下流に内蔵されていることが有利であり、図1は、復号化装置DECの下流にある前述した種類の装置TBQを示す。図1は、以下で詳細に説明する。
本発明の他の主題は、前述した種類の処理装置のメモリに記憶されるように設計したコンピュータプログラムであり、このプログラムは、当該命令を処理装置のプロセッサによって実行すると、量子化ノイズ、及び量子化ノイズ低減フィルタのパラメータを計算するための命令を含む。
有利な好適例は、使用する符号化の種類毎に命令セットを用意すること、及び、各命令セットにおいて、量子化ノイズの変化を復号化信号の関数として規定することから成る。従って、上記先験的な情報を受信すると、適切な命令セットを選択する。この命令セットにより:
復号化信号中に存在する量子化ノイズを計算し、
この量子化ノイズに対応してポストフィルタのパラメータを計算して、この量子化ノイズを制限し、さらには除去する。
使用する符号化の種類について行った観測(以下に説明する好適な実施例による理論的又は実験的観測)に基づいて、量子化ノイズの変化についての命令は、オフラインでプログラムすることができる。これらの命令を実行する方法自体は、以下で図2及び図5を参照して詳細に説明し、図2及び図5は、本発明の範囲内のコンピュータプログラムのフローチャートを形成することができる。
従って、本発明は、復号化後に実行され、符号器が実行する量子化操作の特性についての先験的情報を用いる後処理を提案する。信号を処理するために選定される処理(又は、上記一般用語によれば「処理モデル」)の種類は、信号自体の特性とは無関係である。当然、処理自体(特に、ゲイン関数の推定)は、信号に依存することができ、例えば、この信号のエネルギー又は電力に依存することができる。他方では、この処理が、音楽信号の処理を含んでも、音声信号の処理を含んでも、(高調波、パルス、等の性質の)他のあらゆる信号の処理を含んでも、処理の種類は同じであり、例えば、受信し復号化したフレームのエネルギーのみに基づく。具体的には、量子化ノイズの特性を、特に、種々の符号器群の関数として、理論的方法で確定することができる。そして、本発明の範囲内で、この情報を用いて、復号化装置の下流に存在するノイズ低減装置の少なくとも1つのゲイン関数を規定するために使用する大きさを推定する。
従って、本発明は、量子化操作を適用する信号の圧縮符号器が通常導入する量子化ノイズ(従って歪み)を低減することを可能にする。
本発明が提案する1つの利点によれば、そのいかなる修正もせずに、同じ符号化/復号化の構造を、あらゆる変更を加えることなしに保つことができ、さらに、復号化した信号のより良好な品質を保証することができ、そしてこのことは、符号器によって送信する情報量を増加せずに行うことができる。
他の利点によれば、本発明は、無音の期間中でも、量子化ノイズのみを有利に低減することができ、そしてこのことは、あらゆる種類の信号に対して行うことができる。
さらに他の利点によれば、本発明の適用は、通常のノイズ低減を生じさせず、従って、信号の捕捉の環境に関連するノイズを変更しない。
本発明の適用は、単に、使用する符号器の種類についての先験的情報(例えば、符号器の圧縮モデルの特性、量子化器の特性、又は他の特性)を用いることによって、信号を歪ませずに量子化ノイズを低減し、さらには除去することができ、そしてこのことは、あらゆる種類の信号に対して行うことができることは、特筆すべきことである。
本発明は、音声及び音楽の処理の分野において、より一般的には、あらゆる符号器が量子化ノイズを導入する際の、信号、特に画像の処理において、有利な応用を見出す。
より一般的には、本発明は、信号の量子化ノイズを低減する必要のある全ての分野に適用される。
本発明の他の特徴及び利点は、以下の詳細な説明及び図面を検討すれば明らかになる。
本発明の範囲内の処理装置の一般構造を概略的に示す図である。 本発明の範囲内の方法のステップを概略的に示す図である。 本発明の好適な実施例を示すために、G.711規格による符号化における振幅−圧縮則(「A則」と称される)の変化を示す図である。 信号対量子化ノイズ比RSBの変化を負荷率の関数として示す図であり、この変化は、図3に示す変化から描いたものである。 G.711規格による符号化の場合における、好適な処理のステップを示す図であり、特に図3及び図4の変化の観測に基づく。 G.722規格による符号化について、信号スペクトル(破線の曲線)及び量子化ノイズスペクトル(実線の曲線)の例を示す図である。 G.722規格による符号化/復号化について、音声信号S*(*は上付きを示す)(上部の曲線)及び信号対量子化ノイズ比RSB(下部の曲線)の波形例を示す図である。 G.722規格による符号化/復号化への適用における、80サンプルのセグメント毎の、信号対量子化ノイズ比RSBと信号のエネルギーとの相関を示すドットの群である。 G.722規格による符号化/復号化への適用における、信号対量子化ノイズ比RSBの推定誤差が6 dBより大きく、信号対量子化ノイズ比RSBが25 dBより小さい信号セグメント(黒色)を示す図である。 セグメント毎に、ノイズのエネルギーを信号のエネルギーの関数として表すドットの群を反復して示す図であり、この例では、ノイズレベルの推定値(一点鎖線)、推定値の誤差が6 dBより小さい区間(破線)、及び信号対量子化ノイズ比RSBが25 dBより大きい限界(実線)を示す。
まず図1を参照し、図中の信号Sは:
既知の種類の符号器CODによって、特に、量子化操作Qを信号Sに適用することによって圧縮符号化され、
伝送チャネルCA経由で送信され、
符号器CODに対応する復号器DECによって復号化される。
このように復号化した信号を記号S*で表し、従って信号S*は量子化ノイズを有し、量子化ノイズは、原信号Sに対する差(S*−S)として数学的に定義される。
再び図1を参照すれば、本発明の範囲内で、信号S*中の量子化ノイズを除去又は少なくとも制限するために、復号器DECの下流に、量子化ノイズ低減処理装置TBQを設ける。
この目的のために、量子化ノイズ低減処理装置TBQは、使用する符号化/復号化の種類についての情報INFを復号器DECから受信するための少なくとも1つの入力端子Eを備え、情報INFは、適用するノイズ低減処理モデルを選定することを可能にする。特に、受信し復号化した信号S*に基づき、そして使用した符号化/復号化の種類の関数として、受信した信号S*中の量子化ノイズの影響を推定する。この目的のために、選定したモデルに基づき、受信した信号S*の関数として量子化ノイズBQの推定値を与える計算モジュールを設ける。この計算モジュールは一般に、プロセッサと作業メモリ(図示せず)との組合せの形をとることができる。推定した量子化ノイズBQに基づき、従来のフィルタFILを信号S*に適用することによって、推定した量子化ノイズBQを単純に処理して、処理した信号S* Tを最終的に伝達する。ここでも強調すべきこととして、信号S*に適用するフィルタFILのパラメータPAR(例えば、信号のフィルタ処理のためのゲイン関数)は、特に、推定した量子化ノイズBQを低減すべく決定する。
具体的には、図2を参照すれば、使用する符号化/復号化の種類についての受信した情報INFに基づいて(ステップS2)、ノイズ低減処理モデルを決定する(ステップS3)。選定した量子化ノイズ低減処理モデルは、例えば、信号がG.711規格により符号化/復号化されたか、G.722規格により符号化/復号化されたかに応じて異なり得ることは、以下に説明する好適な実施例でわかる。
従って、信号を連続したブロック(又はステップS1では、TRiで表す連続したフレーム)で受信すると、選定したモデルに特有の量子化ノイズレベルが推定される(ステップS4)。以下の例でわかるように、量子化ノイズレベルは、信号対量子化ノイズ比(RSBで表す)の計算に基づいて推定することが有利である。この情報RSBは、復号化した信号S*に依存するが、使用した符号化の種類にも依存する。従って、情報INFを得ることによって、符号化の先験的知識を信号S*の特定の統計的特性と組み合わせて、この例では信号対量子化ノイズ比RSBを推定することができる。
従って、このステップS4は、使用した符号器の種類の先験的知識を必要とし、この先験的知識は、例えば、「符号器トランザクション」と称される符号器を宣言する手順中に得ることのできる情報であり、取得されているものと仮定する。
符号器の種類、その圧縮モデルの特性、及び量子化器Qの特性は、信号対量子化ノイズ比の変化を、信号の特定の統計パラメータ、例えばその分散、パワースペクトル密度、又は他のパラメータの関数として推定することを可能にする。信号対量子化ノイズ比と信号の統計パラメータとのこうした関係には、符号器に特有の量子化則が働き、これらの量子化則は少数の好適な実施例について以下に説明する。
必要な統計パラメータは、従来の大きさ(例えば分散)の推定器によって計算することができる。これらの推定値の関数として、信号対量子化ノイズ比の推定値を外挿補間することができる。これらの推定値は、時間フィールド又は周波数フィールド、あるいは(例えばウェーブレットに変換された)他の時間−周波数フィールド内で、区別なしに作り出すことができる。
再び図2を参照すれば、次のステップS5は、受信した信号S*中の量子化ノイズを低減するためのフィルタのパラメータを計算することから成る。信号対量子化ノイズ比を知ることは、量子化ノイズ低減フィルタの式をそこから導出することを可能にし、以下、このフィルタを「ポストフィルタ」(復号器の下流)と称する。具体的には、ノイズを低減することを目的としたデジタルフィルタの表現式を導出することができ、このノイズの特性(例えば、そのパワースペクトル密度)の大部分は先験的に知られ、このノイズのレベルは、前のステップS4で得られた信号対量子化ノイズ比の推定値に基づいて決定される。例えば、フィルタは周波数フィールド内で計算することができ、そしてあらゆる短期スペクトル減衰技術(スペクトル減算法、ウィーナーフィルタ、又は他の技術)を適用することができる。ステップS5におけるポストフィルタの計算は、時間フィールド又は周波数フィールド、あるいは他の時間−周波数フィールド内で実行することができる。
最後に、ノイズ低減処理ステップS6自体は、この例では、ステップS5で計算したポストフィルタによる復号化信号S*のフィルタ処理を意味する。このステップS6は、応用に関連する制約、及び前のステップにおける、パラメータPAR及び信号対量子化ノイズ比RSBの推定のフィールドに応じて、時間フィールド又は周波数フィールド内で実行することができる。このことは最後に、ステップS7における量子化ノイズの低減によって処理されたフレームTRi’を与える。
以下に説明することは、G.711規格による(「A則」と称される欧州則による)符号化/復号化のための本発明の好適な実施例である。
従来の一次元信号のデジタル表現は、サンプルの一様(均一)量子化を用いる。従って、量子化器の能力を超えなければ、信号対量子化ノイズ比RSBは、信号の分散
Figure 2010529511
、ダイナミックレンジによって決まる飽和レベルxmax、及び必然的に、サンプルを表現するために使用するビット数bに依存し、次の形の表現式による:
Figure 2010529511
又はdBで表せば、
Figure 2010529511
大きさ
Figure 2010529511
は、「負荷率」と称されるパラメータを表し、量子化器のダイナミックレンジの信号による使用の質を定める。ここに、
maxは、選定した量子化器によるサンプルの最大可能なデジタル振幅レベルであり、
σxは、信号の標準偏差(分散の平方根)であり、サンプルの完結したブロック(又は「フレーム」)について、このブロック上の信号の平均パワーPmの平方根によって推定することができる。
式(1)は、このパラメータΓの値に大きく依存する。なお、特に、最大の信号対量子化ノイズ比は、フルスケールの信号に対して得られ、信号の振幅が低下すれば急速に減少する。
一様量子化則の低いビットレートにおける限界は、信号の広いダイナミックレンジについては、信号対量子化ノイズ比が信号の分散にほとんど依存しない量子化則の開発をもたらした。このことは実際には、G.711規格(欧州では「A則」と称され、又、北米では「μ則」と称される)による符号化のために、対数量子化則が達成することである。
欧州で使用されているA則は、量子化したサンプルの値xに依存する表現式によって次式のように定義される:
Figure 2010529511
図3を参照すれば、圧縮則の第1の変化
Figure 2010529511
は直線的であり、一様量子化則を生じさせ、以下「一様変化」と称するのに対し、圧縮則の第2の変化
Figure 2010529511
は対数的であり、以下「対数変化」と称する。
欧州則は、A=87.56の値(数値的に式A/(1+lnA)=16を満足する)を用いる。
これらの観察に基づいて、A則による圧縮について、信号対量子化ノイズ比を次のように計算することができる。
低強度の信号(圧縮則の一様部分)については、A則は、10log(A/(1+lnA))の信号対量子化ノイズ比を与え、これは、同数の(量子化)レベル上で、一様量子化によって得られるよりも(dB値が)大きく、その表現式は次式によって与えられる:
Figure 2010529511
(b=8について)
より大きい振幅の信号(圧縮則の対数部分)については、信号対量子化ノイズ比は一定であり、(b=8ビットに対して)38.16dBである。すなわち、
Figure 2010529511
(b=8について)
図4は、b=8ビットでのA則について、信号対量子化ノイズ比RSBの変化を表す。直ちに識別されることは:
第1の増加部分は、圧縮則の一様変化に対応し、
次の部分は一定であり、圧縮則の対数変化に対応する。
G.711規格による符号化によって導入される量子化ノイズの低減処理をするために、この例では、次の2つの情報アイテムを使用する:
上記の式(3)及び(4)によって与えられる信号対量子化ノイズ比、及び、
当該情報によれば、この種の符号化については量子化ノイズが「ホワイトノイズ」である、という周知の情報。
量子化ノイズの低減処理を適用することは、これらの先験的情報アイテムの使用に基づく。このことは特に、負荷率Γの推定値を生成することを必要とし、量子化ノイズのパワーは、下記のようにこのパラメータに依存する。
図5を参照すれば、現在ブロックTRiの平均パワーPmを推定し(ステップS52)、この値から、平均パワーの平方根の逆数として変化する負荷率Γを推定する(ステップS53)。特に、この例では、(一定の飽和レベルで)負荷率の分子xmaxが一定であることが考えられる。テストT54では、負荷率Γとして見出した値を、次のように、圧縮則の変曲点を規定する閾値ΓS(図4)と比較する:
負荷率Γが:
−20log(Γ)>−20log(ΓS)=38.16−64.97〜=−27dB
であれば(テストT54の出力にある矢印o)、信号対量子化ノイズ比は、ステップS55で決定されるように一定であり、RSBM〜=+38dB(図4の平坦域)であり、
さもなければ(テストT54の出力にある矢印n)、信号対量子化ノイズ比RSBは、ステップS56で決定されるように、次式(3):
RSB=f(Γ)=65−20log(Γ)[dB]
から描かれる負荷率の関数としての直線的変化により計算することができる。
そして、ゲイン関数を評価して(ステップS57)、ポストフィルタを適用する(ステップS58)。純然たる実例として、ゲイン関数g(RSB)としてウィーナーフィルタを用意することができる。ウィーナーフィルタfwの表現式は、その周波数依存性を当然考慮して、前に計算した信号対量子化ノイズ比の値RSBによって次式のように与えることができる:
g(RSB)=fw =RSB/(RSB+1)
この例では、RSBの値はdBではなく自然数で表される。
特に、信号対量子化ノイズ比の低い信号、従って振幅レベルの低い信号に対する(図4における−20log(Γ)<−50dBのような負荷率に対する)ノイズ低減処理を減らすことは、随意的に次のものを用意することによって、有利に行うことができる:
ポストフィルタの閾値化、及び/又は、
音声信号用の音声活性検出器(音声不活性期間中の量子化ノイズ低減のより軽い処理を行う)。
ここに示される処理の変形例は、連続ブロックによる処理ではなく、サンプル毎に量子化ノイズを低減することであることが示される。この場合は、負荷率はサンプルの振幅のレベルによって直接与えられ(振幅の平方根の逆数)、処理の残りは、以上で説明したことと同様である。
以下、本発明の、異なる符号化の種類への他の可能な適用、この例ではG.722規格による符号化への適用を説明する。
64kbit/s デジタルチャネル上での電話会議用途向けに1988年に標準化されたITU−T G.722符号化は、未だに非常に広く用いられている。これは3ビット階層的符号化/復号化であり、64、56及び48kbit/s である。その信号は、QMF(Quadrature Mirror Filter:直交ミラーフィルタ)と称されるフィルタによって2つのサブバンドに分割される。得られる2つのバンドはADPCM(Adaptive Differential Pulse Code Modulation:適応差分パルス符号変調)符号器を用いて符号化される。
高域は、1サンプル当たり2ビットで符号化される。上記3つのビットレート間の相違は、最高ビットレートについては1サンプル当たり6ビットで符号化される低域から来るが、最終ビット又は最後2つのビットはデータ伝送用に取っておくことができる。
最高ビットレートの品質は非常に良好であるが、48 kbit/s の最低ビットレートについては、符号化ノイズが非常に耳につき、煩わしい。本発明の範囲内の量子化ノイズ低減処理は、この場合に有利に適用することができる。
既に、量子化ノイズの特性は、復号化信号に基づいて有効に推定することができる。図6に示すように、量子化ノイズスペクトル(実線の曲線)は、信号スペクトル(破線)にかかわらず常に平坦である。信号対量子化ノイズ比は、信号の平均パワー及びその性質に依存する。図7では、信号対量子化ノイズ比RSBは、信号S*の平均パワーと高い相関があることがわかる。図に示す例では、信号対量子化ノイズ比RSBは、80サンプルのセグメント上で推定される(16kHz のサンプリング周波数については5ms )。
図8のドット群形式の表示は、80サンプルのセグメントによって計算した信号の平均パワー(横軸)と信号対量子化ノイズ比(縦軸)との相関を、さらに良好に例示する。
この観察より、信号対量子化ノイズ比をセグメントの平均パワーPmoyの関数として推定するための第1の単純なルールを導出することができ(図8に破線で示す相関直線)、次式によって与えられる:
RSB=Pmoy−CST[dB] (5)
ここに、CSTは定数であり、図8の例では約10dBである。
この表現式よりわかることは、ここで実験的に決定された量子化ノイズの平均パワーは、一定値CST=10dBであり、従ってこの値は信号の平均パワーとは無関係であり、このため、信号対量子化ノイズ比RSBは実際には、信号の平均パワーと共に増加する。
信号対量子化ノイズ比RSBの最良の推定値は、低い信号レベルに対して得られ、即ち、信号対量子化ノイズ比RSBが低い際(従って量子化ノイズが最も耳につく)際に得られる。しかし、特定のセグメントは、破線の十分下方に位置するドットを有し、従って、この単純なルールの使用は準最適である。しかし、これらのゾーンは、量子化ノイズが恐らくは有効な信号によって既にマスクされている高い信号対量子化ノイズ比RSBに対応することがわかっている。
一般的には、それにもかかわらず、ここで適用される本発明の範囲内の処理は、量子化ノイズの有利な低減を達成することがわかる。
式(5)の単純なルールを用いれば、図9は、信号対量子化ノイズ比RSBの推定誤差が6dBより大きく、かつ信号対量子化ノイズ比RSB自体が25dBより小さい信号のゾーン、即ち、予測器が量子化ノイズを過小推定する信号のゾーンを、グレー色の背景上に黒色で表し、このことは量子化ノイズ低減処理の効果をより小さくする。しかし、これらのゾーンは無声信号セグメントに対応し、これらのセグメントでは、信号の本質的にノイズ的な性質により、量子化ノイズはそれほどの障害ではない、ということが言える。
図10は、実験式(5)による、信号パワーに対するノイズパワーの図である。一点鎖線は、ノイズパワーの推定値を表す。破線は、推定誤差が6dBより小さいゾーンを区切る。実線の下側は、信号対量子化ノイズ比RSBが25dBより大きい。黒色のドットは(他のグレー色のドットに対して)図9の黒色のセグメントに対応する。
このことは、復号化信号のエネルギーのみに基づく信号対量子化ノイズ比RSBの非常に単純な推定値が、ADPCM符号化/復号化にとって良好な結果を与えることができることを示す。例えば、G.722復号器で使用されているARMA(Auto-Regressive Moving Average:移動平均自己回帰)フィルタの予測ゲインを考慮することによって、信号対量子化ノイズ比RSBの推定値をさらに改善することができる。
量子化ノイズのスペクトル形状及びそのエネルギーを知れば、本発明の量子化ノイズ低減処理をこの種の符号化/復号化に有効に適用することができる。この例は、G.726規格又はG.727規格の符号化/復号化のような同一ファミリーの他の種類の符号化/復号化にとって、まさに明らかに有効である。
当然、本発明は、一例として上述した実施例に限定されず、他の変形例に拡張される。
従って、本発明の有利な応用は、適用する量子化則の特性を用いる、例えば特に欧州のA則によるITU-G.711規格符号器の量子化ノイズを低減することを目標とすることができることが示された。具体的には、この応用では、量子化ノイズがホワイトノイズであり、信号対量子化ノイズ比を推定することができ、これより、この量子化ノイズを低減することを可能にするゲイン関数を推定することができる。従って、本発明の有利な応用の目的は、G.711規格符号器を広帯域(ITU-T SG16, G.711WB)に拡張する過程における量子化ノイズの低減にある。
しかし、A則の場合の処理は、一例として上記に挙げたものである。同様に、μ則の例を記載することができる(米国で適用されているG.711規格の部分)。
より一般的には、当該符号化/復号化の本質的特性を知れば、本発明は任意の種類の符号化/復号化に適用される。

Claims (11)

  1. 量子化操作を適用する所定種類の符号化によって圧縮符号化し(COD)、その後に復号化した(DEC)信号を処理する方法において、
    圧縮符号化の種類について先験的に得られ、前記信号の特性とは無関係である情報(INF)に基づいて、前記圧縮符号化によって導入された量子化ノイズを推定するステップ(S4)と、
    前記復号化した信号に推定量子化ノイズ低減処理(TBQ)を適用する(S6)ために、前記復号化した信号に適用するフィルタリング関数を、前記推定した量子化ノイズに基づいて決定する(S5)ステップと
    を含むことを特徴とする信号処理方法。
  2. 請求項1に記載の方法において、
    前記情報(INF)に基づいて、量子化ノイズ低減モデルを選定するステップ(S3)と、
    前記選定したモデルに応じて、前記量子化ノイズ低減処理を、前記復号化した信号(S*)に適用するステップ(S6)と
    を含むことを特徴とする方法。
  3. 請求項2に記載の方法において、
    前記選定したモデル(S3)に基づいて、前記圧縮符号化によって導入された前記量子化ノイズを推定する(S4)ことを特徴とする方法。
  4. 請求項1に記載の方法において、
    前記情報(INF)に基づいて、前記量子化ノイズ(RSB)の変化(図4)を、前記復号化した信号の少なくとも1つのパラメータ(Γ)の関数として推定するステップと、
    前記復号化した信号の前記パラメータ(Γ)の現在値に応じて(S52,S53)、前記量子化ノイズを推定して(S55,S56)、前記パラメータ(Γ)の現在値を有する前記復号化した信号に適用する(S58)前記フィルタリング関数を決定する(S57)ステップと
    を含むことを特徴とする方法。
  5. 請求項1に記載の方法において、
    信号対量子化ノイズ比(RSB)の変化モデル(図4)を、前記復号化した信号の少なくとも1つのパラメータ(Γ)の関数として、前記先験的に得られた情報から導出することを特徴とする方法。
  6. 請求項5に記載の方法において、
    前記量子化ノイズのスペクトル配色を、前記先験的に得られた情報から導出し、前記スペクトル配色も考慮して、前記復号化した信号に適用する前記フィルタリング関数を決定することを特徴とする方法。
  7. 請求項1〜6のいずれかに記載の方法において、
    前記先験的に得られた情報は、符号器の宣言手順中に得られることを特徴とする方法。
  8. 請求項1〜7のいずれかに記載の方法において、
    前記圧縮符号化の種類が、G.711規格による符号化であることを特徴とする方法。
  9. 量子化操作を適用する所定種類の符号化によって最初に圧縮符号化し、その後に復号化した信号を処理する装置(TBQ)において、
    圧縮符号化の種類について先験的に得られ、前記信号の特性とは無関係である情報(INF)に基づいて、前記圧縮符号化によって導入された量子化ノイズ(BQ)を推定する手段と、
    前記復号化した信号に推定量子化ノイズ低減処理(FIL)を適用する(S6)ために、前記復号化した信号に適用するフィルタリング関数を、前記推定した量子化ノイズに基づいて決定する手段と
    を備えていることを特徴とする信号処理装置。
  10. 請求項9に記載の装置において、
    復号器内の、復号化装置(DEC)の下流に内蔵されていることを特徴とする装置。
  11. 量子化操作を適用する所定種類の符号化によって最初に圧縮符号化し、その後に復号化した信号を処理する装置(TBQ)のメモリに記憶されるように設計されたコンピュータプログラムにおいて、
    前記信号を処理する装置のプロセッサによって当該命令が実行されると、
    圧縮符号化の種類について先験的に得られ、前記信号の特性とは無関係である情報(INF)に基づいて、前記圧縮符号化によって導入された量子化ノイズ(BQ)を推定するための命令と、
    前記推定した量子化ノイズを低減するフィルタ(FIL)のパラメータ(PAR)を計算するための命令と
    を含むことを特徴とするコンピュータプログラム。
JP2010511708A 2007-06-14 2008-06-13 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置 Pending JP2010529511A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0704242 2007-06-14
PCT/FR2008/051057 WO2009004225A1 (fr) 2007-06-14 2008-06-13 Post-traitement de reduction du bruit de quantification d'un codeur, au decodage

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014180564A Division JP5881791B2 (ja) 2007-06-14 2014-09-04 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置

Publications (1)

Publication Number Publication Date
JP2010529511A true JP2010529511A (ja) 2010-08-26

Family

ID=38990872

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010511708A Pending JP2010529511A (ja) 2007-06-14 2008-06-13 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置
JP2014180564A Active JP5881791B2 (ja) 2007-06-14 2014-09-04 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014180564A Active JP5881791B2 (ja) 2007-06-14 2014-09-04 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置

Country Status (6)

Country Link
US (1) US8175145B2 (ja)
EP (1) EP2153438B1 (ja)
JP (2) JP2010529511A (ja)
AT (1) ATE531038T1 (ja)
ES (1) ES2376178T3 (ja)
WO (1) WO2009004225A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258542A (zh) * 2012-02-15 2013-08-21 瑞萨电子株式会社 半导体装置和语音通信装置
JP2015087616A (ja) * 2013-10-31 2015-05-07 株式会社アクセル フィルタの設計方法及びそのフィルタを備えた音響再生装置
JP2016105188A (ja) * 2016-01-12 2016-06-09 株式会社アクセル 音声信号圧縮装置及び音声信号圧縮方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2715432C (en) * 2008-03-05 2016-08-16 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
JP5141633B2 (ja) * 2009-04-24 2013-02-13 ソニー株式会社 画像処理方法及びそれを用いた画像情報符号化装置
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
HUE063594T2 (hu) * 2013-03-04 2024-01-28 Voiceage Evs Llc Készülék és eljárás kvantálási zaj csökkentésére egy idõ-domain dekóderben
FR3007184A1 (fr) * 2013-06-14 2014-12-19 France Telecom Controle du traitement d'attenuation d'un bruit de quantification introduit par un codage en compresssion
EP2887350B1 (en) * 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
US9881630B2 (en) * 2015-12-30 2018-01-30 Google Llc Acoustic keystroke transient canceler for speech communication terminals using a semi-blind adaptive filter model

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62126716A (ja) * 1985-11-27 1987-06-09 Nec Corp 雑音除去回路
US20030182104A1 (en) * 2002-03-22 2003-09-25 Sound Id Audio decoder with dynamic adjustment
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
JP2007079606A (ja) * 1997-12-08 2007-03-29 Mitsubishi Electric Corp 音信号加工方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03116197A (ja) * 1989-09-29 1991-05-17 Matsushita Electric Ind Co Ltd 音声復号化装置
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
US6128346A (en) * 1998-04-14 2000-10-03 Motorola, Inc. Method and apparatus for quantizing a signal in a digital system
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000269821A (ja) * 1999-03-18 2000-09-29 Oki Micro Design Co Ltd 予測符号化信号復号化装置及び雑音除去方法
CN100414606C (zh) * 2002-01-25 2008-08-27 Nxp股份有限公司 用于从pcm信号中减去量化噪声的方法和单元
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
AU2003274864A1 (en) 2003-10-24 2005-05-11 Nokia Corpration Noise-dependent postfiltering
WO2005099243A1 (ja) * 2004-04-09 2005-10-20 Nec Corporation 音声通信方法及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62126716A (ja) * 1985-11-27 1987-06-09 Nec Corp 雑音除去回路
JP2007079606A (ja) * 1997-12-08 2007-03-29 Mitsubishi Electric Corp 音信号加工方法
US20030182104A1 (en) * 2002-03-22 2003-09-25 Sound Id Audio decoder with dynamic adjustment
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258542A (zh) * 2012-02-15 2013-08-21 瑞萨电子株式会社 半导体装置和语音通信装置
JP2013167720A (ja) * 2012-02-15 2013-08-29 Renesas Electronics Corp 半導体装置及び音声通信装置
JP2015087616A (ja) * 2013-10-31 2015-05-07 株式会社アクセル フィルタの設計方法及びそのフィルタを備えた音響再生装置
JP2016105188A (ja) * 2016-01-12 2016-06-09 株式会社アクセル 音声信号圧縮装置及び音声信号圧縮方法

Also Published As

Publication number Publication date
JP2015007805A (ja) 2015-01-15
ES2376178T3 (es) 2012-03-09
EP2153438B1 (fr) 2011-10-26
WO2009004225A1 (fr) 2009-01-08
JP5881791B2 (ja) 2016-03-09
US20100183067A1 (en) 2010-07-22
EP2153438A1 (fr) 2010-02-17
US8175145B2 (en) 2012-05-08
ATE531038T1 (de) 2011-11-15

Similar Documents

Publication Publication Date Title
JP5881791B2 (ja) 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置
KR102237718B1 (ko) 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법
EP2830062B1 (en) Method and apparatus for high-frequency encoding/decoding for bandwidth extension
RU2470385C2 (ru) Система и способ улучшения декодированного тонального звукового сигнала
US6732075B1 (en) Sound synthesizing apparatus and method, telephone apparatus, and program service medium
EP1997101B1 (en) Method and system for reducing effects of noise producing artifacts
CN110223704B (zh) 对音频信号的频谱执行噪声填充的装置
CN107068158B (zh) 用于改善低速率码激励线性预测解码器的非语音内容的方法及其设备
US9082398B2 (en) System and method for post excitation enhancement for low bit rate speech coding
EP2384509A1 (en) Filtering speech
RU2648953C2 (ru) Наполнение шумом без побочной информации для celp-подобных кодеров
RU2622863C2 (ru) Эффективное ослабление опережающего эха в цифровом звуковом сигнале
JP5291004B2 (ja) 通信ネットワークにおける方法及び装置
CN112086107B (zh) 用于辨别和衰减前回声的方法、设备、解码器和存储介质
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
JP2022127601A (ja) 信号依存的な数および精度制御を伴うオーディオエンコーダ、オーディオデコーダ、ならびに関連する方法およびコンピュータプログラム
Jelinek et al. Noise reduction method for wideband speech coding
Konaté et al. Quantization noise estimation for log-PCM
CN116504256A (zh) 一种语音编码方法、装置、介质、设备和程序产品
CN116978391A (zh) 音频编码方法、系统、编码器、介质及设备
JP2010532875A (ja) ディジタル信号の復号中に後処理ステップによってもたらされるひずみの制限

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120921

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140507