JP6069526B2 - オーディオフレーム損失のコンシールメントを制御する方法及び装置 - Google Patents

オーディオフレーム損失のコンシールメントを制御する方法及び装置 Download PDF

Info

Publication number
JP6069526B2
JP6069526B2 JP2015555964A JP2015555964A JP6069526B2 JP 6069526 B2 JP6069526 B2 JP 6069526B2 JP 2015555964 A JP2015555964 A JP 2015555964A JP 2015555964 A JP2015555964 A JP 2015555964A JP 6069526 B2 JP6069526 B2 JP 6069526B2
Authority
JP
Japan
Prior art keywords
frame
spectrum
frequency
transient
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015555964A
Other languages
English (en)
Other versions
JP2016510432A (ja
Inventor
ステファン ブルーン,
ステファン ブルーン,
スヴェドベリ, ヨナス
ヨナス スヴェドベリ,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2016510432A publication Critical patent/JP2016510432A/ja
Application granted granted Critical
Publication of JP6069526B2 publication Critical patent/JP6069526B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Stereophonic System (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Auxiliary Devices For Music (AREA)
  • Error Detection And Correction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、受信したオーディオ信号の損失オーディオフレームに対するコンシールメント(concealment)方法を制御する方法及び装置に関する。
従来のオーディオ通信システムは、音声信号及びオーディオ信号をフレームごとに送信する。送信側は、まず信号を例えば20〜40msの短いセグメント又はフレームとして配列する。これらは順次、符号化され、例えば送信パケットにおける論理ユニットとして送信される。受信機は、それらの論理ユニットの各々を復号化し、対応する信号フレームを再構成する。再構成されたフレームは、最終的には再構成信号サンプルの連続シーケンスとして出力される。符号化に先立って、マイクロホンからのアナログ音声信号又はアナログオーディオ信号をオーディオサンプルのシーケンスに変換するアナログ/デジタル(A/D)変換ステップが通常実行される。逆に、受信端では、再構成デジタル信号サンプルをスピーカ再生のための連続時間アナログ信号に変換する最終D/A変換ステップが通常実行される。
しかし、音声信号及びオーディオ信号のそのような送信システムにおいては、送信エラーが生じ、これにより送信フレームのうち1つ又はいくつかを受信機で再構成のために利用できないという状況が起きる可能性がある。その場合、デコーダは、消失したフレーム、すなわち利用不可能なフレームの各々に対して代替の信号を生成する必要がある。これは、受信側信号デコーダのいわゆるフレーム損失コンシールメント(frame loss concealment)ユニット又はエラーコンシールメント(error concealment)ユニットで実行される。フレーム損失コンシールメントの目的は、フレーム損失を可能な限り聴き取れないようにし、それにより、フレーム損失が再構成信号の品質に与える影響を可能な限り軽減することである。
従来のフレーム損失コンシールメント方法は、コーデックの構造又はアーキテクチャに依存して、例えば過去に受信されたコーデックパラメータを反復して適用するというものである。そのようなパラメータ反復技術は、使用されるコーデックの特定のパラメータに明らかに依存しており、従って、異なる構造を有する他のコーデックには容易に適用することはできない。従来のフレーム損失コンシールメント方法は、損失フレームに対する代替フレームを生成するために、例えば過去に受信されたフレームのパラメータのフリーズと外挿を行うというものがある。
従来技術によるこれらのフレーム損失コンシールメント方法は、何らかのバースト損失処理方法を含む。一般に、1つの列の中のいくつかのフレーム損失があると、合成信号は、長いエラーのバーストの後に完全に消音されるまで減衰される。更に、基本的に反復され外挿される符号化パラメータは、減衰が実現されスペクトルのピークが平坦化されるよう修正される。
従来のフレーム損失コンシールメント技術は、通常、損失フレームに対する代替フレームを生成するために、通常、過去に受信されたフレームのパラメータをフリーズして外挿を行うという概念を適用する。AMR又はAMR−WBなどの線形予測コーデックのような多くのパラメトリック音声コーデックは、通常、過去に受信されたパラメータをフリーズするか又はその何らかの外挿を使用し、そのようなパラメータとともにデコーダを使用する。本質的には、この原理は、符号化/復号化のために所定のモデルを設定し、フリーズされたパラメータ又は外挿されたパラメータによって同一のモデルを適用するというものである。AMR及びAMR−WBのフレーム損失コンシールメント技術は代表的な技術であると考えることができる。それらの技術は、対応する規格仕様書の中で詳細に記述されている。
各種あるオーディオコーデックのうちの多くのコーデックは、何らかの周波数領域変換の後にスペクトルパラメータに符号化モデルが適用される周波数領域符号化技術を適用する。デコーダは、受信したパラメータから信号スペクトルを再構成し、最終的にスペクトルを変換して時間信号に戻す。通常、時間信号はフレームごとに再構成される。そのようなフレームは、オーバラップ加算技術により最終再構成信号として合成される。そのオーディオコーデックの場合であっても、従来のエラーコンシールメントは、損失フレームに対して同一の又は少なくとも類似する復号化モデルを通常適用する。過去に受信されたフレームからの周波数領域パラメータがフリーズされるか又は適切に外挿され、その後、周波数/時間領域変換で使用される。そのような技術の例は、3GPP規格に準拠した3GPPオーディオコーデックによって提供される。
従来技術によるフレーム損失コンシールメントの方法では、一般に、品質の不足が問題となる。例えば、パラメータのフリーズ、外挿技術や損失フレーム対しても同一のデコーダモデルを再適用することによって、必ずしも、過去に復号化された信号フレームから損失フレームへの円滑かつ忠実な信号発展(signal evolution)が保証されるものではないということが主な問題点である。そのため、可聴信号はしばしば不連続になり、品質にも影響が出る。
音声及びオーディオ伝送システムの新規なフレーム損失コンシールメント方式を説明する。新規な方式により、従来のフレーム損失コンシールメント技術で実現可能であった品質と比較して、フレーム損失の場合の品質が改善される。
本発明の実施形態の目的は、以下に説明される関連する新規な種類の方法であるのが好ましいフレーム損失コンシールメント方式を、可能な限り最良の再構成信号音質が実現されるように制御することである。実施形態は、信号の特性及びフレーム損失の時間的分布の双方に関して再構成品質を最適化することを目的とする。高い品質を提供することに関してフレーム損失コンシールメントで特に問題になるのは、オーディオ信号がエネルギの立ち上がりや立ち下がりのような大きく変化する特性を有する場合、又はオーディオ信号のスペクトルが非常に大きく変動する場合である。その場合、説明したコンシールメント方法では、上記立ち上がり、立ち下がり、又はスペクトルの変動を繰り返してしまい、原信号から大きな変化して品質が劣化する。
問題となる別のケースは、フレーム損失のバーストが連続的に起こる場合である。概念的には、説明した方法に係るフレーム損失コンシールメント方法では、そのような場合に対処しても、依然として音のアーチファクト(tonal artifacts)を生じてしまう。本発明の実施形態の別の目的は、そのような音のアーチファクトを可能な限り大きく軽減することである。
第1の態様によれば、損失オーディオフレームのコンシールメントを行うデコーダの方法は、過去に受信され再構成されたオーディオ信号の特性又は観測されたフレーム損失の統計的特性における、損失フレームの代替によって品質が相対的に低下するような条件を検出するステップを含む。そのような条件が検出された場合、代替フレームスペクトルの位相又はスペクトル振幅を選択的に調整することにより、コンシールメント方法を修正する。
第2の態様によれば、デコーダは損失オーディオフレームのコンシールメントを実現するように構成される。デコーダは、過去に受信され再構成されたオーディオ信号の特性又は観測されたフレーム損失の統計的特性における、損失フレームの代替により品質が相対的に低下するような条件を検出するコントローラを備える。そのような条件が検出された場合、コントローラは、代替フレームスペクトルの位相又はスペクトル振幅を選択的に調整することによりコンシールメント方法を修正する。
デコーダは、例えば移動電話などの装置で実現可能である。
第3の態様によれば、受信機は、上述の第2の態様に係るデコーダを備える。
第4の態様によれば、損失オーディオフレームのコンシールメントを行うためのコンピュータプログラムが定義される。コンピュータプログラムは、プロセッサにより実行されると、プロセッサに上述の第1の態様に従って損失オーディオフレームのコンシールメントを行わせる命令を含む。
第5の態様によれば、コンピュータプログラム製品は、上述の第4の態様に係るコンピュータプログラムを記憶するコンピュータ読み取り可能な媒体を備える。
一実施形態の利点は、従来のコンシールメント方法のみの場合に実現される品質と比較して、符号化音声信号及び符号化オーディオ信号の伝送におけるフレーム損失による音質への影響を大きく軽減できるフレーム損失コンシールメント方法の適応制御が実現されることである。実施形態の一般的利点は、損失フレームに対しても円滑かつ忠実な再構成信号の発展(evolution)が提供されることである。フレーム損失の聴感上の影響は、従来技術と比べて大幅に低減される。
方形窓関数を示す図。 ハミング窓と方形窓との組み合わせを示す図。 窓関数の振幅スペクトルの一例を示す図。 周波数fkの例示的な正弦波信号の線スペクトルを示す図。 周波数fkの窓掛け後の正弦波信号のスペクトルを示す図。 分析フレームに基づくDFTのグリッドポイントの大きさに対応するバーを示す図。 DFTグリッドポイントP1、P2及びP3を通るパラボラフィッティングを示す図。 窓スペクトルのメインローブのフィッティングを示す図。 DFTグリッドポイントP1及びP2を通るメインローブ近似関数Pのフィッティングを示す図。 受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する本発明の実施形態に係る例示的な方法を示すフローチャート。 受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する本発明の実施形態に係る別の例示的な方法を示すフローチャート。 本発明の別の例示的な実施形態を示す図。 本発明の一実施形態に係る装置の一例を示す図。 本発明の一実施形態に係る装置の別の例を示す図。 本発明の一実施形態に係る装置の別の例を示す図。
説明する新規なフレーム損失コンシールメント技術に関する新規な制御方式は、図10に示されるような以下のステップを含む。なお、方法はデコーダのコントローラによって実行可能である。
1.前述の方法では損失フレームの代替によって音質が劣化してしまうような、過去に受信され再構成されたオーディオ信号の特性または観測されたフレーム損失の統計的特性の状態を検出する(101)。
2.ステップ1でそのような状態が検出された場合、位相又はスペクトル振幅を選択的に調整することにより、Z(m)=Y(m)・e kによって代替フレームスペクトルを計算する方法の要素を修正する(102)。
(正弦波分析)
新規な制御技術が適用されうるフレーム損失コンシールメント技術の第1のステップは、過去に受信された信号の一部の正弦波分析(sinusoidal analysis)を含む。この正弦波分析の目的は、その信号の主正弦波の周波数を特定することである。これは、限定された数の個別の正弦波から信号が構成されていること、すなわち信号が以下に示す種類のマルチ正弦波信号であることが、基本的な前提となっている。
Figure 0006069526
ただし、Kは、信号を構成すると想定される正弦波の数である。添字k=1…Kの各正弦波に対して、akは振幅、fkは周波数、φkは位相である。サンプリング周波数はfsで表され、時間離散信号サンプルs(n)の時間インデックスはnで表される。
可能な限り正確な正弦波の周波数を特定することが第1に重要である。理想的な正弦波信号は線周波数fkの線スペクトルを有すると考えられるが、その真の値を特定するには、原理上、無限の測定時間が必要になるであろう。従って、実際には、本明細書において説明される正弦波分析に使用される信号セグメントに対応する短時間の測定に基づいて線周波数を推定することしかできないので、線周波数を発見するのは難しい。以下の説明中、この信号セグメントは分析フレームと呼ばれる。別の困難な問題は、信号が実際には時変信号であり、上記の式のパラメータが時間の経過に伴って変動するということである。そこで、測定をより正確にするためには長い分析フレームを使用することが望ましいが、起こりうる信号変動に更に適切に対応するためには、測定時間を短縮することが必要になる。その適切なトレードオフとしては、例えば20〜40ms程度の長さの分析フレームを使用することである。
正弦波の周波数fkを特定可能にする好適な方法は、分析フレームの周波数領域分析を実行することである。この目的のために、例えばDFT又はDCT、あるいは類似する周波数領域変換によって、分析フレームは周波数領域に変換される。分析フレームのDFTが使用される場合、スペクトルは次式により表される。
Figure 0006069526
ただし、w(n)は、長さLの分析フレームを抽出し重み付けする窓関数を表す。典型的な窓関数は、例えば、図1に示されるようなn∈[0…L−1]に対して1であり、その他の場合は0である方形窓である。過去に受信されたオーディオ信号の時間指標は、分析フレームが時間指標n=0…L−1により参照されるように設定されると想定する。スペクトル分析に更に適すると思われる他の窓関数としては、例えばハミング窓、ハニング窓、カイザー窓又はブラックマン窓がある。特に有用であるとわかっている窓関数は、ハミング窓と方形窓との組み合わせである。図2に示されるように、この窓は、長さL1のハミング窓の左半分のような立ち上がり端形状及び長さL1のハミング窓の右半分のような立ち下がり端形状を有し、立ち上がり端と立ち下がり端との間で、窓は、長さL−L1の場合に1に等しい。
窓分析フレーム|X(m)|の振幅スペクトルのピークは、必要とされる正弦波周波数fkの近似を構成する。しかし、この近似の正確度は、DFTの周波数間隔により限定される。ブロック長LのDFTの場合、正確度はfs/(2L)に限定される。
実験によれば、このレベルの正確度は、本明細書において説明される方法の範囲内では低すぎるかもしれない。以下のことを考慮した結果に基づき、正確度の改善を得ることができる。
窓分析フレームのスペクトルは、正弦波モデル信号S(Ω)の線スペクトルによる窓関数のスペクトルの畳み込みと、その後に続く次式のDFTのグリッドポイントにおけるサンプリングによって与えられる。
Figure 0006069526
正弦波モデル信号のスペクトル表現を使用することにより、これを次のように書き換えることができる。
Figure 0006069526
従って、サンプリングされたスペクトルは次式により表される。
Figure 0006069526
ただし、m=0…L−1
この考えに基づき、分析フレームの振幅スペクトルの中で観測されるピークは、それらのピークの近傍で真の正弦波周波数が特定されるK個の正弦波を含む窓掛け後正弦波信号に由来するものと想定される。観測されたk番目のピークのDFTインデックス(グリッドポイント)をmkとすると、対応する周波数は、
Figure 0006069526
であり、これは、真の正弦波周波数fkの近似であるとみなすことができる。真の正弦波周波数fkは、区間
Figure 0006069526
の中にあると想定できる。
なお、明確にするため、正弦波モデル信号の線スペクトルのスペクトルによる窓関数のスペクトルの畳み込みは、窓関数スペクトルの周波数シフトバージョンの重畳であると理解することができ、このため、シフト周波数は正弦波の周波数である。次に、この重畳はDFTグリッドポイントでサンプリングされる。それらのステップは図3以降の図により示される。図3は窓関数の振幅スペクトルの一例を示す。図4は、周波数の1つの正弦波と共に正弦波信号の一例の振幅スペクトル(線スペクトル)を示す。図5は、正弦波の周波数における周波数シフト窓スペクトルを再現し、重畳する窓掛け後正弦波信号の振幅スペクトルを示す。図6の点線は、分析フレームのDFTを計算することにより取得された窓掛け後正弦波におけるDFTのグリッドポイントの振幅に対応する。なお、すべてのスペクトルは正規化周波数パラメータΩによって周期的である。ここで、Ωは、サンプリング周波数fsに対応する2πである。
先の説明及び図6は、使用される周波数領域変換の周波数分解能と比較して探索の分解能を増加させることによってのみ、正弦波周波数をよりよく近似できることを示唆する。
正弦波の周波数fkの更によい近似を発見する好適な方法の1つは、放物線補間(parabolic interpolation)を適用することである。そのような方式の1つは、ピークを取り囲むDFT振幅スペクトルのグリッドポイントを通してパラボラフィッティングを行い、放物線最大値に属する各々の周波数を計算することである。放物線の次の適切な選択肢は2である。詳細には、以下の手順を適用することができる。
1.窓掛け後分析フレームのDFTのピークを特定する。ピーク探索はピークの数K及びピークの対応するDFTインデックスを出力する。ピーク探索は、通常、DFT振幅スペクトル又は対数DFT振幅スペクトルに対して実行可能である。
2.対応するDFTインデックスmkを有するピークk(k=1…K)ごとに、3つのポイント
Figure 0006069526
を通してパラボラフィッティングを行う。その結果、次式により定義される放物線の放物線係数bk(0)、bk(1)、bk(2)が得られる。
Figure 0006069526
このパラボラフィッティングは、図7に示される。
3.K個の放物線の各々に対して、その放物線が最大値を有するqの値に対応する補間周波数インデックス
Figure 0006069526
を計算する。正弦波周波数fkの近似として
Figure 0006069526
を使用する。
説明した方式は良好な結果を提供するが、放物線は、窓関数の振幅スペクトル|W(Ω)|のメインローブの形状を近似しないので、いくつかの制限があるかもしれない。これを実行する代替方式は、以下に説明されるように、メインローブ近似を使用する改良型周波数推定である。この代替方式の主要な概念は、
Figure 0006069526
のメインローブを近似する関数P(q)を、ピークを取り囲むDFT振幅スペクトルのグリッドポイントを通してフィッティングし、関数最大値に属する各々の周波数を計算することである。関数P(q)は、窓関数の周波数シフト振幅スペクトル
Figure 0006069526
と同一でありうる。しかし、数値的に単純にするために、これを関数最大値の容易な計算を可能にする多項式にすべきである。以下に詳細に説明される手順を適用できる。
1.窓分析フレームのDFTのポイントを特定する。ピーク探索はピークの数K及びピークの対応するDFTインデックスを出力する。ピーク探索は、通常、DFT振幅スペクトル又は対数DFT振幅スペクトルに対して実行可能である。
2.所定の区間(q1,q2)に対して窓関数の振幅スペクトル
Figure 0006069526
または対数振幅スペクトル
Figure 0006069526
を近似する関数P(q)を取り出す。窓スペクトルのメインローブを近似する近似関数の選択は、図8により示される。
3.対応するDFTインデックスmkを伴うピークk(k=1…K)ごとに、窓正弦波信号の連続スペクトルの予想される真のピークを取り囲む2つのDFTグリッドポイントを通して周波数シフト関数
Figure 0006069526
のフィッティングを行う。従って、
|X(mk−1)|が|X(mk+1)|より大きい場合、ポイント
Figure 0006069526
を通して
Figure 0006069526
のフィッティングを行い、そうでない場合、ポイント
Figure 0006069526
を通して
Figure 0006069526
のフィッティングを行う。簡単にするため、P(q)を2次又は4次のいずれかの多項式として選択できる。これにより、ステップ2の近似は単純な線形回帰計算及び
Figure 0006069526
の簡単な計算となる。区間(q1、q2)は、すべてのピークに対して一定かつ同一になるように選択でき、例えば(q1、q2)=(−1,1)であるか、又は適応的である。適応的方式の場合、関数
Figure 0006069526
が関連するDFTグリッドポイント{P1;P2}の範囲内で窓関数スペクトルのメインローブのフィッティングを行うように、区間を選択できる。このフィッティング処理は図9に示される。
4.窓正弦波信号の連続スペクトルがピークを有すると予測されるK個の周波数パラメータ
Figure 0006069526
の各々に対して、
Figure 0006069526
を正弦波周波数fkの近似として計算する。
送信された信号が高調波である場合、何らかの基本周波数f0の整数倍数であるような周波数を有する正弦波から信号が構成される場合が多い。これは、信号が例えば有声音声又は何らかの楽器の持続音のように非常に周期的である場合である。実施形態の正弦波モデルの周波数は周波数依存ではなく、同一の基本周波数に対して高調波の関係にあり、同一の基本周波数に由来する。この高調波特性を考慮に入れることにより、結果的に正弦波成分周波数の分析を相当に改善できる。
改善の可能性の1つの概要は次の通りである。
1.信号が高調波であるか否かを検査する。これは、例えば、フレーム損失以前の信号の周期性を評価することにより実行可能である。簡単な方法の1つは信号の自動相関分析を実行することである。何らかの時間遅延τ>0に関する自動相関関数の最大値を指標として使用できる。この最大値の値が所定の閾値を超えた場合、信号は高調波であるとみなすことができる。その場合、対応する時間遅延τは、
Figure 0006069526
によって基本周波数と関連する信号の周期に対応する。
多くの線形予測音声符号化法は、適応コードブックを使用していわゆる開ループ又は閉ループピッチ予測符号化、すなわちCELP符号化を適用する。信号が高調波である場合、そのような符号化方法により取り出されるピッチゲイン及び関連するピッチラグパラメータも、時間遅延に関してそれぞれ有用な指標である。
0を取得する更なる方法を以下に説明する。
2.整数範囲1…Jmaxの中の高調波インデックスjごとに、高調波周波数fj=j・f0の近傍に分析フレームの(対数)DFT振幅スペクトルのピークが存在するか否かを検査する。fjの近傍は、デルタがDFTの周波数分解能DFT(fs/L)に対応するfjの周囲のデルタ範囲、すなわち区間
Figure 0006069526
として定義されうる。対応する推定正弦波周波数
Figure 0006069526
を有するピークが存在する場合、f^kをf^k=j・f0と置換する。
上記の2ステップ手順の場合、信号が高調波であるか否かの検査及び基本周波数の偏移を黙示的に、おそらくは反復方式で必ずしも何らかの別の方法からの指標を使用せずに取り出すことも可能である。そのような技術の一例を以下に示す。
候補値{f0,1…f0,P}の集合の中からのf0,pごとに、
Figure 0006069526
を置換することなく、高調波周波数の周囲の近傍に存在するDFTピークの数、すなわちf0,pの整数倍数をカウントしつつ、手順のステップ2を適用する。高調波周波数に又はその周囲に最大数のピークが取得される基本周波数f0,pmaxを特定する。このピークの最大数が所定の閾値を超えた場合、信号は高調波であると想定される。その場合、f0,pmaxは、ステップ2の実行に際して使用され、その結果、改善された正弦波周波数f^kをもたらす基本周波数であると想定できる。しかし、これに代わる更に好適な方法は、まず、高調波周波数と一致することがわかっているピーク周波数f^kに基づいて基本周波数f0を最適化することである。M個の高調波より成る集合、すなわち、周波数f^k(m), m = 1…MでM個のスペクトルピークの何らかの集合と一致することがわかっている何らかの基本周波数の整数倍数{n1…nM}を想定すると、基礎を成す(最適化)基本周波数f0,optは、高調波周波数とスペクトルピーク周波数との誤差を最小限にするように計算できる。最小にすべき誤差が平均2乗誤差
Figure 0006069526
である場合、最適基本周波数は、
Figure 0006069526
として計算される。候補値の初期集合{f0,1…f0,P}は、DFTピークの周波数又は推定正弦波周波数
Figure 0006069526
から取得できる。
推定正弦波周波数
Figure 0006069526
の正確度を改善する更なる可能性は、その時間発展(temporal evolution)を考慮することである。その目的のために、複数の分析フレームからの正弦波周波数の推定値を例えば平均化又は予測によって組み合わせることができる。平均化又は予測に先立って、各推定スペクトルピークを同一の基調となる各正弦波に結び付けるピーク追跡を適用することができる。
(正弦波モデルの適用)
以下、フレーム損失コンシールメント演算を実行するための正弦波モデルの適用について説明する。
対応する符号化情報が利用不可能であるため符号化信号の所定のセグメントをデコーダにより再構成できない場合を想定する。更に、このセグメントより過去の信号の部分が利用可能であるとする。y(n)(ただし、n=0…N−1)を、代替フレームz(n)が生成されなければならない利用不可能セグメントであるとし、n<0の場合のy(n)を、過去に復号された利用可能信号であるとする。この場合、第1のステップにおいて、長さL及び開始インデックスn-1の利用可能信号のプロトタイプフレームが窓関数w(n)によって抽出され、例えば次式のDFTによって周波数領域に変換される。
Figure 0006069526
窓関数は、先に正弦波分析に関して説明した窓関数のうち1つでありうる。数値の複雑さを軽減するために、周波数領域変換後のフレームは、正弦波分析において使用されるフレームと同一であるのが好ましい。
次のステップにおいて、想定正弦波モデルが適用される。想定正弦波モデルによれば、プロトタイプフレームのDFTを次のように書き表すことができる。
Figure 0006069526
次のステップは、使用される窓関数のスペクトルが0にごく近い周波数範囲において重大な寄与をすると理解することである。図3に示されるように、窓関数の振幅スペクトルは、0にごく近い周波数に対しては大きく、そうでない周波数に対しては小さい(サンプリング周波数の2分の1に対応する−π〜πの正規化周波数範囲内)。従って、近似として、窓スペクトルW(m)は、区間M=[−mmin,mmax](mmin及びmmaxは小さな正の整数)に対してのみ0ではないと仮定する。特に、窓関数スペクトルの近似は、kごとに、上記の式中のシフトされた窓スペクトルの寄与が厳密に互いに重なり合わないように使用される。上記の式において、周波数インデックスごとに、1つの被加数からの、すなわち1つのシフトされた窓スペクトルからの寄与のみが常に最大である。これは、上記の式が下記の近似式に縮小されることを意味する。
非負であるm∈Mkに対して、kごとに、
Figure 0006069526
ここで、Mkは、整数区間
Figure 0006069526
を示し、mmin,k及びmmax,kは、区間が互いに重なり合わないようにするという先に説明した制約に適合する。mmin,k及びmmax,kの適切な選択は、それらの値を小さな整数値δ、例えばδ=3に設定することである。しかし、2つの隣接する正弦波周波数fk及びfk+1に関連するDFTインデックスが2δより小さい場合、区間が重なり合わないことが保証されるように、δは、
Figure 0006069526
に設定される。関数floor(・)は、それ以下である関数引数に最も近い整数である。
一実施形態による次のステップは、上記の式による正弦波モデルを適用し、そのK個の正弦波を時間的に発展(evolve)させることである。プロトタイプフレームの時間インデックスと比較して、消去セグメントの時間インデックスはn-1サンプルだけ異なるという仮定は、正弦波の位相が
Figure 0006069526
だけ進んでいることを意味する。従って、発展させた正弦波モデルのDFTスペクトルは次式により表される。
Figure 0006069526
シフトされた窓関数スペクトルが互いに重なり合わないという近似を再び適用すると、非負であるm∈Mkに対して、kごとに以下の式が得られる。
Figure 0006069526
近似を使用することにより、プロトタイプフレームY-1Y(m)のDFTを、発展させた正弦波モデルY0(m)のDFTと比較すると、m∈Mkごとに位相が
Figure 0006069526
だけシフトされる間、振幅スペクトルは不変のままであることがわかる。従って、各正弦波の近傍のプロトタイプフレームの周波数スペクトル係数は、正弦波周波数fkと、損失オーディオフレームとプロトタイプフレームn-1との間の時間差とに比例してシフトされる。
従って、本実施形態によれば、次式により代替フレームを計算できる。
非負のm∈Mkに対して、kごとに、
Figure 0006069526
とし、
Figure 0006069526
特定の一実施形態は、どの区間Mkにも属さないDFTインデックスに関する位相ランダム化に対処する。先に説明したように、区間Mk,k=1…Kは、それらの区間が厳密に重なり合わないように設定されなければならず、これは、区間のサイズを制御する何らかのパラメータδを使用して実行される。2つの隣接する正弦の周波数距離に関連して、δが小さいということが起こりうる。従って、その場合、2つの区間の間に隙間ができることもありうる。そのため、対応するDFTインデックスmに対して、上記の式
Figure 0006069526
に従った位相シフトは定義されない。本実施形態による適切な選択肢は、それらのインデックスに対して位相をランダム化することであり、その結果、Z(m)=Y(m)・ej2πrand(・)となる。ここで、関数rand(・)は何らかの乱数を返す。
再構成信号の品質に関して、区間Mkのサイズを最適化することは有益であることがわかっている。特に信号が非常にトーン信号に近い場合、すなわち鮮明かつ明確なスペクトルピークを有する場合、区間を大きくすべきである。これは、例えば信号が明確な周期性を有する高調波である場合である。信号が広いスペクトル最大値を有し、さほど明確ではないスペクトル構造を有する他の場合には、狭い区間を使用することにより品質がよくなることがわかっている。この発見により、信号の特性に従って区間サイズを適応化させるという更なる改善が得られる。実施形態の1つはトーン性検出器又は周期性検出器を使用する。この検出器が信号がトーン信号に近いと判定すると、区間サイズを制御するδパラメータは、相対的に大きな値に設定される。そうでない場合、δパラメータは相対的に小さな値に設定される。
上記の説明に基づき、オーディオフレーム損失コンシールメント方法は次のステップを含む。
1.利用可能な、過去に合成された信号のセグメントを分析して、例えば改善周波数推定値を使用して、正弦波モデルの組成する正弦波周波数fkを取得する。
2.利用可能な、過去に合成された信号からプロトタイプフレームy-1を抽出し、そのフレームのDFTを計算する。
3.正弦波周波数fkと、プロトタイプフレームと代替フレームとの間の時間の進みn-1とに応じて、正弦波kごとの位相シフトθkを計算する。このステップにおいて、例えば、区間Mのサイズがオーディオ信号のトーン性に応じて適応化されうる。
4.正弦波kごとに、正弦波周波数fkの周囲の近傍に関連するDFTインデックスに対して、プロトタイプフレームDFTの位相を選択的にθk進ませる。
5.ステップ4で取得されたスペクトルの逆DFTを計算する。
(信号及びフレーム損失特性の分析及び検出)
上述した方法は、オーディオ信号の特性は、短時間の間では、過去に受信され再構成された信号フレーム及び損失フレームから大きく変化することはないという仮定に基づいている。この場合、過去に再構成されたフレームの振幅スペクトルを保持し、過去に再構成された信号において検出された正弦波主成分の位相を発展させる(evolve)ことは、非常に良い選択である。しかし、例えば急激なエネルギ変化や急激なスペクトル変化を伴う過渡状態が存在する場合には、この仮定は誤りとなりうる。
そのため、本発明に係る過渡検出器の第1の実施形態は、過去に再構成された信号のエネルギ変動に基づくことができる。図11に示されるこの方法は、分析フレーム113の左側部分及び右側部分のエネルギを計算する。分析フレームは、前述した正弦波分析に使用されるフレームと同一でよい。分析フレームの一部(左側又は右側)は、その分析フレームの最初の半分の部分または最後の半分の部分であってもよいし、例えば分析フレーム110の最初の4分の1の部分または最後の4分の1の部分であってもよい。それぞれの部分のエネルギ計算は、それらの部分フレームにおけるサンプルの2乗を加算することにより実行される。
Figure 0006069526
ただし、y(n)は分析フレームを示し、nleft及びnrightは共に、サイズNpartの部分フレームの開始インデックスを示す。
左右の部分フレームのエネルギは、信号不連続性の検出に使用される。これは、比
Figure 0006069526
を計算することにより実行される。比Rl/rが閾値(例えば、10)を超えた場合、急激なエネルギ減少(立ち下がり)による不連続性を検出できる(115)。同様に、比Rl/rが他の閾値(例えば、0.1)を下回った場合、急激なエネルギ増加(立ち上がり)による不連続性を検出できる(117)。
前述したコンシールメント方法に関連して、上記定義したエネルギ比は多くの場合で感度の低すぎる指標であるかもしれないということが判明した。特に、実信号、とりわけ音楽信号の場合、ある周波数のトーンが急激に現れるのに対し、他の周波数の他のトーンが急激に消滅することがある。上記定義したエネルギ比を使用して信号フレームを分析すると、この指標は異なる周波数に対しては低い感度しか示さないので、いずれの場合にも、上記トーンのうちの少なくとも1つについて誤った検出結果を導く可能性がある。
この問題に対する解決方法を以下の実施形態で説明する。まず、過渡検出が時間-周波数平面で実行される。分析フレームは、同様に左側部分フレームと右側部分フレームとに分割される(110)。しかし、それら2つの部分フレームは、(例えば、ハミング窓による適切な窓掛け(111)の後に)例えばNpart点DFTによって周波数領域に変換される(112)。
Figure 0006069526
及び、m=0…Npart−1の場合、
Figure 0006069526
ここで、インデックスmのDFTビンごとに、過渡検出を周波数選択的に実行可能である。DFTインデックスmごとに、左右の部分フレームの振幅スペクトルのパワを用いてエネルギ比を次のように計算できる(113)。
Figure 0006069526
経験上、DFTビン分解能による周波数選択的過渡検出は、統計的変動(推定誤差)のために相対的に不正確であることがわかっている。周波数帯域に基づいて周波数選択的過渡検出を実行した場合、演算の品質が向上することが判明している。lk=[mk-1+1,…,mk]がmk-1+1からmkまでのDFTビンを含むk番目の区間(k=1…K)を指定するとすれば、それらの区間は、K個の周波数帯域を定義する。そこで、左側部分フレームと右側部分フレームの各帯域エネルギの帯域ごとの比に基づいて、周波数群選択的過渡検出を実行できる。
Figure 0006069526
なお、区間lk=[mk-1+1,…,mk]は、周波数帯域
Figure 0006069526
に対応し、fsはオーディオサンプリング周波数である。
最も低い下限周波数帯域境界m0を0に設定することは可能であるが、周波数が低くなるほど増加する推定誤差を軽減するために、それより高い周波数に対応するDFTインデックスに境界が設定されてもよい。最も高い上限周波数帯域境界mk
Figure 0006069526
に設定することは可能であるが、これは、過渡状態が依然として聞こえの効果に重大な影響を及ぼす低い周波数に対応するように選択されるのが好ましい。
それらの周波数帯域のサイズ又は幅の適切な選択の1つは、それらを等しい大きさ、例えば数百Hzの幅、にすることである。別の好適な方法は、周波数帯域の幅を人間の聴覚の臨界帯域のサイズに従うこと、すなわちそれらを聴覚系の周波数分解能に関連付けることである。これは、周波数帯域の幅を1kHzまでの周波数に対しては等しくし、約1kHzを超えた後は指数関数的に増加させることとほぼ同じである。指数関数的増加は、例えば帯域インデックスkの増分に伴って周波数帯域幅を2倍にすることを意味する。
2つの部分フレームのエネルギ比に基づく過渡検出器の第1の実施形態で説明したように、2つの部分フレームの帯域エネルギ又はDFTビンエネルギに関連する比が、閾値と比較される。(周波数選択的)立ち下がり検出115には上限閾値が用いられ、(周波数選択的)立ち上がり検出117には下限閾値が用いられる。
フレーム損失コンシールメント方法の適応化に適する更に別のオーディオ信号依存指標は、デコーダへ送信されるコーデックパラメータに基づくことができる。例えば、コーデックは、ITU−TG.718のようなマルチモードコーデックであってもよい。そのようなコーデックは、信号の異なる種類に対して特定のコーデックモードを使用し、フレーム損失の直前のフレームにおけるコーデックモードの変更は、過渡の指標とみなされうる。
フレーム損失コンシールメントの適応化に有用な別の指標は、有声音特性及び送信信号に関連するコーデックパラメータである。有声音は、人間の声道の周期的な声門励振により生成される極めて周期的な音声に関連する。
更なる好適な指標は、信号コンテンツが音楽であるか音声であるかの推定の指標である。そのような指標は、通常はコーデックの一部でありうる信号分類器から取得できる。コーデックがそのような分類を実行し、デコーダに対する符号化パラメータとして利用可能な対応する分類がされた場合、このパラメータは、フレーム損失コンシールメント方法を適応化させるために使用される信号コンテンツ指標として使用されるのが好ましい。
フレーム損失コンシールメント方法の適応化に使用されるのが好ましい別の指標は、フレーム損失のバースト性である。フレーム損失のバースト性は、数回のフレーム損失が連続的に起こり、そのため、フレーム損失コンシールメント方法がその演算に最近復号された有効信号部分を使用するのが難しくなっていることを意味する。従来の技術による指標は、連続して観測されたフレーム損失の数nburstである。このカウンタは、フレーム損失が起こるたびに1増分され、有効フレームが受信されると0にリセットされる。この指標は、本発明の例示的な実施形態に関連して使用される。
(フレーム損失コンシールメント方法の適応化)
実行された上記のステップがフレーム損失コンシールメント演算の適応化を示唆する状態を示す場合、代替フレームのスペクトルの計算が修正される。
代替フレームスペクトルの当初の計算は、式Z(m)=Y(m)・e kに従って実行されるが、振幅及び位相の双方を修正する適応化が導入される。振幅は2つの係数α(m)及びβ(m)によるスケーリングによって修正され、位相は追加位相成分
Figure 0006069526
によって修正される。これにより、代替フレームは次のように修正計算される。
Figure 0006069526
なお、
Figure 0006069526
である場合、当初の(非適応)フレーム損失コンシールメント方法が使用される。従って、それらの値はそれぞれデフォルト値である。
振幅適応化を導入することの一般的目的は、フレーム損失コンシールメント方法の音のアーチファクトを回避することである。そのような音のアーチファクトは、過渡音の反復から生じる音楽音、トーン音、あるいは異常音となりうる。そのような音のアーチファクトは品質の劣化につながると考えられるので、音のアーチファクトを回避することが、ここで説明する適応化の目的である。そのような適応化に適する方法は、代替フレームの振幅スペクトルを適切な程度に修正することである。
図12は、コンシールメント方法修正の一実施形態を示す。バースト損失カウンタnburstが閾値thrburst(例えばthrburst=3)を超えた場合(121)、振幅適応化が実行されるのが好ましい(123)。その場合、減衰率として、1より小さい値(例えばα(m)=0.1)が使用される。
ただし、徐々に程度が増加する減衰を実行するのが有益であることがわかっている。これを実現する好適な一実施形態は、フレームごとの減衰量の対数増加att_per_frameを指定する対数パラメータを定義することである。そこで、バーストカウンタが閾値を超えた場合の、徐々に増加する減衰率は、次式により計算される。
Figure 0006069526
ただし、定数cは、例えばデシベル(dB)単位でパラメータatt_per_frameを指定することを可能にする単なるスケーリング定数である。
追加的な好適な適応化は、信号が音楽であるか音声であるかの推定を示す指標に応じて実行されるものである。音楽コンテンツの場合、音声コンテンツと比較して閾値thrburstを増加させ、フレームごとの減衰を減少させることが好ましい。これは、程度を下げながらフレーム損失コンシールメント方法の適応化を実行することに等しい。この種の適応化の背景にあるのは、一般に、音声と比較して音楽のほうが長い損失バーストの影響を受けやすいことである。従ってこの場合、少なくとも複数のフレーム損失が含まれる場合には、当初のフレーム損失コンシールメント方法、すなわち未修正のフレーム損失コンシールメント方法が依然として好適である。
指標Rl/r,band(k)、あるいはRl/r(m)又はRl/rが閾値を超えたことに基づいて過渡が検出された場合、振幅減衰率に関する更なるコンシールメント方法の適応化が実行されるのが好ましい(122)。その場合、適切な適応化動作(125)は、全減衰量が2つの係数の積α(m)・β(m)により制御されるように第2の振幅減衰率β(m)を修正することである。
β(m)は、過渡が示されたことに応じて設定される。立ち下がりが検出された場合、係数β(m)は、その立ち下がりのエネルギ減少を反映するように選択されるのが好ましい。適切な選択肢は、β(m)を検出されたゲイン変化に設定することである。すなわち、
m∈Ik,k=1…Kとして、
Figure 0006069526
立ち上がりが検出された場合、代替フレームにおけるエネルギ増加を制限するのが有利であることがわかっている。その場合、係数は、減衰も増幅もしないことを意味する固定値(例えば1)に設定することができる。
なお、上記の説明において、振幅減衰率は周波数選択的に、すなわち、周波数帯域ごとに、個別に計算された係数によって適用されるのが好ましい。帯域方式が使用されない場合、対応する振幅減衰率をアナログ的に取得することが可能である。DFTビンレベルで周波数選択的過渡検出が使用される場合、DFTビンごとに個別にβ(m)を設定できる。あるいは、周波数選択的過渡指示がまったく使用されない場合、すべてのmに対してβ(m)を包括的に同一にすることができる。
振幅減衰率の更なる好適な適応化は、位相の修正と関連して追加位相成分
Figure 0006069526
によって実行される(127)。所定のmに対して、そのような位相修正が使用される場合、減衰率β(m)は更に減少される。位相修正の程度まで考慮に入れられるのが好ましい。位相修正が適度に実行されるだけの場合、β(m)はわずかにスケールダウンされるのみであるが、位相修正が強力である場合、β(m)は更に大幅にスケールダウンされる。
位相適応化を導入することの一般的な目的は、生成される代替フレームのトーン性又は信号周期性が強すぎることによる品質劣化を招くようなことを回避することである。そのような適応化に適した方法は、位相を適切な程度にランダム化(randomize)又はディザリング(dithering)することである。
そのような位相ディザリングは、追加位相成分
Figure 0006069526
が制御係数によってスケーリングされたランダム値
Figure 0006069526
に設定されることにより実現される。
関数rand(・)により得られるランダム値は、例えば疑似乱数発生器により生成される。ここで、疑似乱数発生器は、区間[0,2π]の中で1つの乱数を出力すると想定する。
上式のスケーリング係数α(m)は、当初の位相θkがディザリングされる程度を制御する。以下に示す実施形態は、このスケーリング係数を制御することによって位相適応化に対処する。スケーリング係数の制御は、先に説明した振幅修正係数の制御と同様に実行される。
第1の実施形態によれば、スケーリング係数α(m)は、バースト損失カウンタに応じて適応化される。バースト損失カウンタnburstが閾値thrburst(例えばburst=3)を超えた場合、0より大きい数(例えば、α(m)=0.2)が使用される。
しかし、徐々に程度を増加させながらディザリングを実行するのが有益であることが分かっている。これを実現する好適な一実施形態は、フレームごとのディザリングの増加を指定するパラメータdith_increase_per_frameを定義することである。そこで、バーストカウンタが閾値を超えた場合、徐々に増加するディザリング制御係数は次式により計算される。
Figure 0006069526
ただし、上式において、α(m)は、全位相ディザリングが達成される最大値1に制限されなければならない。
なお、位相ディザリングを開始するために使用されるバースト損失閾値thrburstは、振幅減衰に使用される閾値と同一の閾値であってもよい。しかし、それらの閾値を個別に最適値に設定することにより、より高い品質を得ることができ、これは、一般にそれらの閾値が異なっていてもよいことを意味する。
信号が音楽であるか音声であるかの推定を示す指標に応じて、好適な追加的な適応化が実行される。音楽コンテンツの場合、音声コンテンツと比較して閾値thrburstを増加させるのが好ましい。これは、音声と比較して、音楽の場合の位相ディザリングは、連続する損失フレームの数が多い場合にのみ実行されることを意味する。これは、程度を下げながら音楽の場合のフレーム損失コンシールメント方法の適応化を実行することと同等である。この種の適応化の背景には、一般に音楽は、音声より長い損失バーストの影響を受けにくいということがある。従って、この場合、少なくとも多数の連続するフレーム損失に対しては、当初のフレーム損失コンシールメント方法、すなわち未修正のフレーム損失コンシールメント方法が依然として好ましい。
更なる好適な実施形態は、検出された過渡に応じて位相ディザリングを適応化することである。その場合、そのビン、対応する周波数帯域のDFTビン、又はフレーム全体のDFTビンに関して過渡が示されたDFTビンmに対して、より強力な程度の位相ディザリングを使用できる。
説明される方式の一部は、高調波信号、特に有声音の高調波信号に対してフレーム損失コンシールメント方法を最適化することに対処する。
前述したような改善型周波数推定を使用する方法が実現されない場合、有声音声信号に対して品質を最適化するフレーム損失コンシールメント方法の別の適応可能性は、音楽及び音声を含む一般的なオーディオ信号に関する方法ではなく、音声に特定して設計されかつ最適化された他のフレーム損失コンシールメント方法に切り替えることである。その場合、信号が有声音声信号を含むという指標が、前述した方式ではなく別の音声最適化フレーム損失コンシールメント方式を選択するために使用される。
実施形態は、図13に示されるようなデコーダのコントローラに適用される。図13は実施形態に係るデコーダの概略ブロック図である。デコーダ130は、符号化オーディオ信号を受信するように構成された入力ユニット132を備える。図は、論理フレーム損失コンシールメントユニット134によるフレーム損失コンシールメントを示し、これは、先述した実施形態に従ってデコーダが損失オーディオフレームのコンシールメントを実現するように構成されていることを示す。デコーダは、先述した実施形態を実現するコントローラ136を更に備える。コントローラ136は、受信され、再構成されたオーディオ信号の特性の中で又は観測されたフレーム損失の統計的特性において、先述した方法に従った損失フレームの代替が相対的に品質を低下させるような状態を検出するように構成される。そのような状態が検出された場合、コントローラ136は、位相又はスペクトル振幅を選択的に調整することにより、
Figure 0006069526
に従って代替フレームスペクトルを計算するコンシールメント方法の要素を修正するように構成される。検出は、検出器ユニット146により実行可能であり、修正は、図14に示されるような修正器ユニット148により実行可能である。
デコーダは、そこに含まれるユニットと共に、ハードウェアで実現可能である。デコーダのユニットの機能を実現するために使用可能であり、組み合わせ可能である回路素子には数多くの変形がありうる。そのような変形例は実施形態に含まれる。デコーダのハードウェア実現形態の特定の実施例は、共に汎用電子回路及び特定用途向け回路を含むデジタルシグナルプロセッサ(DSP)ハードウェアと集積回路技術である。
あるいは、図13に示されるような本明細書において説明される実施形態に係るオーディオフレーム損失コンシールメントの実行を含めて、オーディオ信号を再構成するために、本明細書において説明されるデコーダ150は、例えば図15に示されるように、すなわち、プロセッサ154及び適切な記憶装置又はメモリ156を伴う適切なソフトウェア155のうち1つ以上により実現可能である。入力される符号化オーディオ信号は入力端子(IN)152により受信され、この入力端子(IN)152には、プロセッサ154及びメモリ156が接続される。ソフトウェアから取得された復号化、再構成化オーディオ信号は、出力端子(OUT)158から出力される。
上述の技術は、例えば、移動体装置(例えば、移動電話、ラップトップ)又はパーソナルコンピュータなどの固定デバイスで使用可能な受信機において使用されうる。
相互に作用するユニット又はモジュールの選択、並びにそれらのユニットの名前は単なる例であり、開示される処理動作を実行可能にするために複数の代替方法で構成されうることは理解されよう。
なお、本明細書において説明されるユニット又はモジュールは、必ずしも個別の物理エンティティではなく、論理エンティティとしてみなされるべきものである。本明細書において開示される技術の範囲は、当業者には自明であると思われる他の実施形態をすべて含み、それに従って、本明細書の開示の範囲が限定されるべきではないことが理解されるだろう。
単数形の要素を説明する場合、明示して指示のない限り、それは「ただ1つの」要素を意味するのではなく、「1つ以上の」要素を表す。先に説明された実施形態の要素と同等の、当業者には知られているすべての構造及び機能は、そこで参照することにより本発明に明白に取り入れられており、本発明に含まれることが意図される。更に、装置又は方法は、本発明に含まれるために、本明細書において開示された技術により解決されようとしているありとあらゆる問題に対処する必要はない。
以上の説明の中で、開示される技術を完全に理解させるために、説明の便宜上、特定の構造、インタフェース、技術などの特定の詳細を述べたが、それは本発明を限定するものではない。しかし、それらの特定の詳細から逸脱した他の実施形態及び/又は実施形態の組み合わせにおいて、開示された技術が実施されてもよいことは当業者には明らかだろう。すなわち、本明細書には明示して説明又は図示されてはいないが、開示された技術の原理を具現化する種々の構成を当業者は考案できるだろう。場合によっては、不必要に詳細を述べることによって、開示される技術の説明をわかりにくくしないように、周知のデバイス、回路及び方法の詳細な説明を省略した。開示される技術の原理、態様及び実施形態、並びにその特定の実施例を説明した本明細書のすべての記述は、それらと同等な構造及び同等な機能を共に含むことを意図する。更に、そのような同等物は、現在知られている同等物に加えて、将来開発される同等物、例えば、構造に関わらず同一の機能を実行するように開発された何らかの要素をも含むことが意図される。
従って、例えば、添付の図は、技術の原理を具現化する例示的な回路又は他の機能ユニット、及び/又はコンピュータ読み取り可能な媒体で実質的に表現されてもよく、図には明示して示されてはいないが、コンピュータ又はプロセッサにより実行されうる種々の処理の概念図を表すことができることが当業者には理解されるだろう。
機能ブロックを含む種々の要素の機能は、回路ハードウェア及び/又はコンピュータ読み取り可能な媒体に記憶された符号化命令の形のソフトウェアを実行可能なハードウェアの使用によって提供されてもよい。従って、そのような機能及び図示される機能ブロックは、ハードウェアで実現されかつ/又はコンピュータで実現され、従って機械で実現されると理解されるべきである。
以上説明した実施形態は、本発明のいくつかの例示として理解されるべきである。本発明の範囲から逸脱することなく、それらの実施形態に対して種々の修正、組み合わせ及び変更が行われてもよいことは当業者には理解されよう。特に、異なる実施形態の異なる部分の方法は、技術的に可能であるならば、他の構成で組み合わせ可能である。

Claims (31)

  1. 受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する方法であって、
    過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出するステップ(101,122)と、
    前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正するステップ(102,125)と、
    観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出するステップ(101,121)と、
    前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正するステップ(102,123,127)と、
    を有することを特徴とする方法。
  2. 前記当初のコンシールメント方法は、
    過去に受信され再構成されたオーディオ信号から、プロトタイプフレームとして用いられるセグメントを抽出するステップと、
    正弦波モデルを前記プロトタイプフレームに適用して前記正弦波モデルの正弦波周波数を取得するステップと、
    得られた正弦波を時間発展させて前記代替フレームを生成するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記時間発展は、前記得られた正弦波(k)に関するスペクトル係数の位相をθkだけ進めることを含み、
    前記代替フレームスペクトルの計算は、Y(m)を前記プロトタイプフレームの周波数領域表現とすると、式Z(m)=Y(m)・e kに従って実行されることを特徴とする請求項2に記載の方法。
  4. 前記過渡状態は、検出された立ち下がりを含むことを特徴とする請求項1乃至3のいずれか1項に記載の方法。
  5. 前記過渡状態の検出が周波数領域で実行されることを特徴とする請求項1乃至4のいずれか1項に記載の方法。
  6. 前記過渡状態の検出は、周波数帯域に基づいて周波数選択的に実行されることを特徴とする請求項5に記載の方法。
  7. 周波数帯域幅は人間の聴覚の臨界帯域の大きさに従うことを特徴とする請求項6に記載の方法。
  8. 前記代替フレームスペクトルの前記スペクトル振幅の選択的な調整は、前記周波数帯域において検出された前記過渡状態に応じて周波数帯域選択的に行われることを特徴とする請求項6又は7に記載の方法。
  9. 前記第2の状態は、数個の連続するフレーム損失が発生したことであることを特徴とする請求項1乃至8のいずれか1項に記載の方法。
  10. 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、程度が徐々に増加する減衰を行うことにより調整されることを特徴とする請求項9に記載の方法。
  11. 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、第1の減衰率を徐々に増加させることにより調整されることを特徴とする請求項9又は10に記載の方法。
  12. 前記過渡状態が検出されたことに応じて第2の減衰率が設定され、前記第1の減衰率と前記第2の減衰率との積により全減衰量が制御されることを特徴とする請求項11に記載の方法。
  13. 前記代替フレームスペクトルの前記位相の調整は、位相スペクトルのランダム化又はディザリングを含むことを特徴とする請求項1に記載の方法。
  14. 前記位相スペクトルは、前記ディザリングを、徐々に程度を増加させながら実行することにより調整されることを特徴とする請求項13に記載の方法。
  15. 請求項1乃至14のうちいずれか1項に記載の方法を実行する手段を備えることを特徴とする装置。
  16. 装置であって、
    プロセッサ(154)と、
    命令(155)を記憶するメモリ(156)と、
    を備え、前記命令(155)は、前記プロセッサにより実行されたとき、前記装置に、
    過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出させ、
    前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正させ、
    観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出させ、
    前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正させる
    ことを特徴とする装置。
  17. 前記当初のコンシールメント方法を用いて前記代替フレームを生成するとき、前記装置は、
    過去に受信され再構成されたオーディオ信号から、プロトタイプフレームとして用いられるセグメントを抽出し、
    正弦波モデルを前記プロトタイプフレームに適用して前記正弦波モデルの正弦波周波数を取得し、
    得られた正弦波を時間発展させて前記代替フレームを生成する、
    ように動作することを特徴とする請求項16に記載の装置。
  18. 前記時間発展は、前記得られた正弦波(k)に関するスペクトル係数の位相をθkだけ進めることを含み、
    前記代替フレームスペクトルの計算は、Y(m)を前記プロトタイプフレームの周波数領域表現とすると、式Z(m)=Y(m)・e kに従って実行されることを特徴とする請求項17に記載の装置。
  19. 前記過渡状態の検出を行う過渡検出器を更に有することを特徴とする請求項16乃至18のいずれか1項に記載の装置。
  20. 前記過渡検出器は、周波数領域で前記過渡状態の検出を実行することを特徴とする請求項19に記載の装置。
  21. 前記過渡検出器は、周波数帯域に基づく周波数選択的な前記過渡状態の検出を実行することを特徴とする請求項20に記載の装置。
  22. 前記代替フレームスペクトルの前記スペクトル振幅の選択的な調整は、前記周波数帯域において検出された前記過渡状態に応じて周波数帯域選択的に行われることを特徴とする請求項21に記載の装置。
  23. 前記第2の状態は、数個の連続するフレーム損失が発生したことであることを特徴とする請求項16乃至22のいずれか1項に記載の装置。
  24. 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、程度が徐々に増加する減衰を行うことにより調整されることを特徴とする請求項23に記載の装置。
  25. 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、第1の減衰率を徐々に増加させることにより調整されることを特徴とする請求項23又は24に記載の装置。
  26. 前記過渡状態が検出されたことに応じて第2の減衰率が設定され、前記第1の減衰率と前記第2の減衰率との積により全減衰量が制御されることを特徴とする請求項25に記載の装置。
  27. 前記代替フレームスペクトルの前記位相の調整は、位相スペクトルのランダム化又はディザリングを含むことを特徴とする請求項16に記載の装置。
  28. 前記装置は移動体装置のデコーダであることを特徴とする請求項15又は16に記載の装置。
  29. コンピュータ読み取り可能なコードユニットを含むコンピュータプログラム(155)であって、装置で実行されると、前記装置に、
    過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出させ(101)、
    前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正させ(102)、
    観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出させ、
    前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正させる
    ことを特徴とするコンピュータプログラム。
  30. 符号化オーディオ信号を受信する入力ユニット(132)と、
    損失オーディオフレームのコンシールメントを行う論理フレーム損失コンシールメントユニット(134)と、
    過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出し、前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正し、観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出し、前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正するコントローラ(136)と、
    を有することを特徴とするデコーダ(130)。
  31. 前記コントローラ(136)は、前記過去に受信され再構成されたオーディオ信号の特性又は前記観測されたフレーム損失の前記統計的特性における状態の前記検出を実行する検出器ユニット(146)と、前記コンシールメント方法の前記修正を実行する修正器ユニット(148)とを含むことを特徴とする請求項30に記載のデコーダ。
JP2015555964A 2013-02-05 2014-01-22 オーディオフレーム損失のコンシールメントを制御する方法及び装置 Active JP6069526B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361761051P 2013-02-05 2013-02-05
US201361760814P 2013-02-05 2013-02-05
US201361760822P 2013-02-05 2013-02-05
US61/760,822 2013-02-05
US61/761,051 2013-02-05
US61/760,814 2013-02-05
PCT/SE2014/050068 WO2014123471A1 (en) 2013-02-05 2014-01-22 Method and apparatus for controlling audio frame loss concealment

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016251224A Division JP6440674B2 (ja) 2013-02-05 2016-12-26 オーディオフレーム損失のコンシールメントを制御する方法及び装置

Publications (2)

Publication Number Publication Date
JP2016510432A JP2016510432A (ja) 2016-04-07
JP6069526B2 true JP6069526B2 (ja) 2017-02-01

Family

ID=50114514

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015555964A Active JP6069526B2 (ja) 2013-02-05 2014-01-22 オーディオフレーム損失のコンシールメントを制御する方法及び装置
JP2016251224A Active JP6440674B2 (ja) 2013-02-05 2016-12-26 オーディオフレーム損失のコンシールメントを制御する方法及び装置
JP2018217479A Active JP6698792B2 (ja) 2013-02-05 2018-11-20 オーディオフレーム損失のコンシールメントを制御する方法及び装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2016251224A Active JP6440674B2 (ja) 2013-02-05 2016-12-26 オーディオフレーム損失のコンシールメントを制御する方法及び装置
JP2018217479A Active JP6698792B2 (ja) 2013-02-05 2018-11-20 オーディオフレーム損失のコンシールメントを制御する方法及び装置

Country Status (21)

Country Link
US (6) US9293144B2 (ja)
EP (5) EP4322159A3 (ja)
JP (3) JP6069526B2 (ja)
KR (4) KR102349025B1 (ja)
CN (3) CN108831490B (ja)
AU (5) AU2014215734B2 (ja)
BR (1) BR112015018316B1 (ja)
CA (2) CA2978416C (ja)
DK (2) DK3125239T3 (ja)
ES (4) ES2603827T3 (ja)
HK (2) HK1210315A1 (ja)
MX (3) MX2020001307A (ja)
MY (1) MY170368A (ja)
NZ (2) NZ739387A (ja)
PH (3) PH12015501507B1 (ja)
PL (2) PL3561808T3 (ja)
PT (2) PT2954518T (ja)
RU (3) RU2728832C2 (ja)
SG (3) SG11201505231VA (ja)
WO (1) WO2014123471A1 (ja)
ZA (1) ZA201504881B (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3576087T3 (pl) 2013-02-05 2021-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Ukrywanie klatki utraconej sygnału audio
US9478221B2 (en) 2013-02-05 2016-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced audio frame loss concealment
NO2780522T3 (ja) * 2014-05-15 2018-06-09
EP3664086B1 (en) 2014-06-13 2021-08-11 Telefonaktiebolaget LM Ericsson (publ) Burst frame error handling
US10373608B2 (en) 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
ES2870959T3 (es) * 2016-03-07 2021-10-28 Fraunhofer Ges Forschung Unidad de ocultación de error, decodificador de audio y método relacionado y programa informático que usa características de una representación decodificada de una trama de audio decodificada apropiadamente
CN109313905B (zh) * 2016-03-07 2023-05-23 弗劳恩霍夫应用研究促进协会 隐藏音频帧丢失的错误隐藏单元、音频解码器及相关方法
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
CN108922551B (zh) * 2017-05-16 2021-02-05 博通集成电路(上海)股份有限公司 用于补偿丢失帧的电路及方法
US20190074805A1 (en) * 2017-09-07 2019-03-07 Cirrus Logic International Semiconductor Ltd. Transient Detection for Speaker Distortion Reduction
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2020126120A1 (en) 2018-12-20 2020-06-25 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling multichannel audio frame loss concealment
CN111402904B (zh) * 2018-12-28 2023-12-01 南京中感微电子有限公司 音频数据恢复方法、装置及蓝牙设备
CN109887515B (zh) * 2019-01-29 2021-07-09 北京市商汤科技开发有限公司 音频处理方法及装置、电子设备和存储介质
CN113454713B (zh) * 2019-02-21 2024-06-25 瑞典爱立信有限公司 相位ecu f0插值分割方法及相关控制器
AU2019437394A1 (en) * 2019-03-25 2021-10-21 Razer (Asia-Pacific) Pte. Ltd. Method and apparatus for using incremental search sequence in audio error concealment
WO2020249380A1 (en) * 2019-06-13 2020-12-17 Telefonaktiebolaget Lm Ericsson (Publ) Time reversed audio subframe error concealment
CN111883173B (zh) * 2020-03-20 2023-09-12 珠海市杰理科技股份有限公司 基于神经网络的音频丢包修复方法、设备和系统
EP4252227A1 (en) 2020-11-26 2023-10-04 Telefonaktiebolaget LM Ericsson (publ) Noise suppression logic in error concealment unit using noise-to-signal ratio

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06130999A (ja) * 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd コード励振線形予測復号化装置
JP3617503B2 (ja) * 1996-10-18 2005-02-09 三菱電機株式会社 音声復号化方法
EP0907258B1 (en) * 1997-10-03 2007-01-03 Matsushita Electric Industrial Co., Ltd. Audio signal compression, speech signal compression and speech recognition
JP3567750B2 (ja) * 1998-08-10 2004-09-22 株式会社日立製作所 圧縮音声再生方法及び圧縮音声再生装置
US6975655B2 (en) * 2000-04-07 2005-12-13 Broadcom Corporation Method of controlling data sampling clocking of asynchronous network nodes in a frame-based communications network
US6996521B2 (en) * 2000-10-04 2006-02-07 The University Of Miami Auxiliary channel masking in an audio signal
JP2002229593A (ja) * 2001-02-06 2002-08-16 Matsushita Electric Ind Co Ltd 音声信号復号化処理方法
KR100591350B1 (ko) * 2001-03-06 2006-06-19 가부시키가이샤 엔.티.티.도코모 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
JP4215448B2 (ja) * 2002-04-19 2009-01-28 日本電気株式会社 音声復号装置及び音声復号方法
US20040122680A1 (en) * 2002-12-18 2004-06-24 Mcgowan James William Method and apparatus for providing coder independent packet replacement
US6985856B2 (en) 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
WO2004068098A1 (ja) * 2003-01-30 2004-08-12 Fujitsu Limited 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
GB2416467B (en) * 2003-05-14 2006-08-30 Oki Electric Ind Co Ltd Apparatus and method for concealing erased periodic signal data
ATE486348T1 (de) * 2003-06-30 2010-11-15 Koninkl Philips Electronics Nv Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US7324937B2 (en) * 2003-10-24 2008-01-29 Broadcom Corporation Method for packet loss and/or frame erasure concealment in a voice communication system
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP1722359B1 (en) * 2004-03-05 2011-09-07 Panasonic Corporation Error conceal device and error conceal method
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
US7930184B2 (en) 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US7734381B2 (en) * 2004-12-13 2010-06-08 Innovive, Inc. Controller for regulating airflow in rodent containment system
KR101203348B1 (ko) * 2005-01-31 2012-11-20 스카이프 가중 오버랩 애드 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7457746B2 (en) * 2006-03-20 2008-11-25 Mindspeed Technologies, Inc. Pitch prediction for packet loss concealment
US8358704B2 (en) * 2006-04-04 2013-01-22 Qualcomm Incorporated Frame level multimedia decoding with frame information table
WO2008022200A2 (en) 2006-08-15 2008-02-21 Broadcom Corporation Re-phasing of decoder states after packet loss
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
FR2907586A1 (fr) 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
KR100957711B1 (ko) 2006-10-25 2010-05-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 서브밴드 값을 생성하는 장치 및 방법과 시간 영역 오디오 샘플을 생성하는 장치 및 방법
US7991612B2 (en) * 2006-11-09 2011-08-02 Sony Computer Entertainment Inc. Low complexity no delay reconstruction of missing packets for LPC decoder
BRPI0721490A2 (pt) 2006-11-10 2014-07-01 Panasonic Corp Dispositivo de decodificação de parâmetro, dispositivo de codificação de parâmetro e método de decodificação de parâmetro.
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
CN101261833B (zh) * 2008-01-24 2011-04-27 清华大学 一种使用正弦模型进行音频错误隐藏处理的方法
CN101308660B (zh) * 2008-07-07 2011-07-20 浙江大学 一种音频压缩流的解码端错误恢复方法
CN102222505B (zh) 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
WO2012158159A1 (en) 2011-05-16 2012-11-22 Google Inc. Packet loss concealment for audio codec

Also Published As

Publication number Publication date
RU2628144C2 (ru) 2017-08-15
AU2016225836A1 (en) 2016-10-06
ES2964807T3 (es) 2024-04-09
EP3125239B1 (en) 2019-07-17
KR102110212B1 (ko) 2020-05-13
PL3125239T3 (pl) 2019-12-31
AU2014215734B2 (en) 2016-08-11
PT2954518T (pt) 2016-12-01
KR20210041107A (ko) 2021-04-14
SG11201505231VA (en) 2015-08-28
PH12018500600A1 (en) 2019-06-10
HK1210315A1 (en) 2016-04-15
CN104969290B (zh) 2018-07-31
BR112015018316A2 (pt) 2017-07-18
ES2881510T3 (es) 2021-11-29
KR102238376B1 (ko) 2021-04-08
NZ710308A (en) 2018-02-23
JP6698792B2 (ja) 2020-05-27
CN108899038B (zh) 2023-08-29
CN108831490A (zh) 2018-11-16
MX344550B (es) 2016-12-20
US20200126567A1 (en) 2020-04-23
JP2017097365A (ja) 2017-06-01
RU2017124644A3 (ja) 2020-05-27
DK3125239T3 (da) 2019-08-19
RU2728832C2 (ru) 2020-07-31
KR20150108937A (ko) 2015-09-30
BR112015018316B1 (pt) 2022-03-08
ZA201504881B (en) 2016-12-21
US20150228287A1 (en) 2015-08-13
MX2021000353A (es) 2023-02-24
EP3561808A1 (en) 2019-10-30
RU2020122689A (ru) 2022-01-10
AU2021212049B2 (en) 2023-02-16
RU2015137708A (ru) 2017-03-10
US20220375480A1 (en) 2022-11-24
HK1258094A1 (zh) 2019-11-01
US10332528B2 (en) 2019-06-25
EP3855430A1 (en) 2021-07-28
AU2020200577A1 (en) 2020-02-13
CA2978416A1 (en) 2014-08-14
PH12018500600B1 (en) 2019-06-10
CN108831490B (zh) 2023-05-02
EP3561808B1 (en) 2021-03-31
AU2014215734A1 (en) 2015-08-06
AU2018203449A1 (en) 2018-06-07
EP2954518B1 (en) 2016-08-31
MX2020001307A (es) 2021-01-12
EP4322159A3 (en) 2024-04-17
PL3561808T3 (pl) 2021-10-04
EP3855430B1 (en) 2023-10-18
KR102349025B1 (ko) 2022-01-07
US20160155446A1 (en) 2016-06-02
KR20200052983A (ko) 2020-05-15
US11437047B2 (en) 2022-09-06
DK3561808T3 (da) 2021-05-03
US9721574B2 (en) 2017-08-01
KR20160045917A (ko) 2016-04-27
JP6440674B2 (ja) 2018-12-19
EP4322159A2 (en) 2024-02-14
US9293144B2 (en) 2016-03-22
CA2900354C (en) 2017-10-24
EP3125239A1 (en) 2017-02-01
MY170368A (en) 2019-07-24
ES2750783T3 (es) 2020-03-27
AU2016225836B2 (en) 2018-06-21
US20170287494A1 (en) 2017-10-05
WO2014123471A1 (en) 2014-08-14
RU2020122689A3 (ja) 2022-01-10
JP2016510432A (ja) 2016-04-07
EP2954518A1 (en) 2015-12-16
NZ739387A (en) 2020-03-27
ES2603827T3 (es) 2017-03-01
CN108899038A (zh) 2018-11-27
US20190267011A1 (en) 2019-08-29
EP3855430C0 (en) 2023-10-18
SG10202106262SA (en) 2021-07-29
MX2015009210A (es) 2015-11-25
PH12015501507A1 (en) 2015-09-28
AU2021212049A1 (en) 2021-08-26
PH12015501507B1 (en) 2015-09-28
US10559314B2 (en) 2020-02-11
PH12018500083A1 (en) 2019-06-10
AU2018203449B2 (en) 2020-01-02
AU2020200577B2 (en) 2021-08-05
RU2017124644A (ru) 2019-01-30
CA2978416C (en) 2019-06-18
PH12018500083B1 (en) 2019-06-10
PT3125239T (pt) 2019-09-12
SG10201700846UA (en) 2017-03-30
CN104969290A (zh) 2015-10-07
CA2900354A1 (en) 2014-08-14
JP2019061254A (ja) 2019-04-18

Similar Documents

Publication Publication Date Title
JP6440674B2 (ja) オーディオフレーム損失のコンシールメントを制御する方法及び装置
US20210350811A1 (en) Burst frame error handling
JP2023166423A (ja) Mdct係数からのスペクトル形状予測

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160715

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6069526

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250