JP6069526B2

JP6069526B2 - オーディオフレーム損失のコンシールメントを制御する方法及び装置

Info

Publication number: JP6069526B2
Application number: JP2015555964A
Authority: JP
Inventors: ステファンブルーン，; スヴェドベリ，　ヨナス; ヨナススヴェドベリ，
Original assignee: テレフオンアクチーボラゲットエルエムエリクソン（パブル）
Priority date: 2013-02-05
Filing date: 2014-01-22
Publication date: 2017-02-01
Anticipated expiration: 2034-01-22
Also published as: RU2628144C2; AU2016225836A1; ES2964807T3; EP3125239B1; KR102110212B1; PL3125239T3; AU2014215734B2; PT2954518T; KR20210041107A; SG11201505231VA; PH12018500600A1; HK1210315A1; CN104969290B; BR112015018316A2; ES2881510T3; KR102238376B1; NZ710308A; JP6698792B2; CN108899038B; CN108831490A

Description

本発明は、受信したオーディオ信号の損失オーディオフレームに対するコンシールメント（concealment）方法を制御する方法及び装置に関する。

従来のオーディオ通信システムは、音声信号及びオーディオ信号をフレームごとに送信する。送信側は、まず信号を例えば２０〜４０ｍｓの短いセグメント又はフレームとして配列する。これらは順次、符号化され、例えば送信パケットにおける論理ユニットとして送信される。受信機は、それらの論理ユニットの各々を復号化し、対応する信号フレームを再構成する。再構成されたフレームは、最終的には再構成信号サンプルの連続シーケンスとして出力される。符号化に先立って、マイクロホンからのアナログ音声信号又はアナログオーディオ信号をオーディオサンプルのシーケンスに変換するアナログ／デジタル（Ａ／Ｄ）変換ステップが通常実行される。逆に、受信端では、再構成デジタル信号サンプルをスピーカ再生のための連続時間アナログ信号に変換する最終Ｄ／Ａ変換ステップが通常実行される。

しかし、音声信号及びオーディオ信号のそのような送信システムにおいては、送信エラーが生じ、これにより送信フレームのうち１つ又はいくつかを受信機で再構成のために利用できないという状況が起きる可能性がある。その場合、デコーダは、消失したフレーム、すなわち利用不可能なフレームの各々に対して代替の信号を生成する必要がある。これは、受信側信号デコーダのいわゆるフレーム損失コンシールメント（frame loss concealment）ユニット又はエラーコンシールメント（error concealment）ユニットで実行される。フレーム損失コンシールメントの目的は、フレーム損失を可能な限り聴き取れないようにし、それにより、フレーム損失が再構成信号の品質に与える影響を可能な限り軽減することである。

従来のフレーム損失コンシールメント方法は、コーデックの構造又はアーキテクチャに依存して、例えば過去に受信されたコーデックパラメータを反復して適用するというものである。そのようなパラメータ反復技術は、使用されるコーデックの特定のパラメータに明らかに依存しており、従って、異なる構造を有する他のコーデックには容易に適用することはできない。従来のフレーム損失コンシールメント方法は、損失フレームに対する代替フレームを生成するために、例えば過去に受信されたフレームのパラメータのフリーズと外挿を行うというものがある。

従来技術によるこれらのフレーム損失コンシールメント方法は、何らかのバースト損失処理方法を含む。一般に、１つの列の中のいくつかのフレーム損失があると、合成信号は、長いエラーのバーストの後に完全に消音されるまで減衰される。更に、基本的に反復され外挿される符号化パラメータは、減衰が実現されスペクトルのピークが平坦化されるよう修正される。

従来のフレーム損失コンシールメント技術は、通常、損失フレームに対する代替フレームを生成するために、通常、過去に受信されたフレームのパラメータをフリーズして外挿を行うという概念を適用する。ＡＭＲ又はＡＭＲ−ＷＢなどの線形予測コーデックのような多くのパラメトリック音声コーデックは、通常、過去に受信されたパラメータをフリーズするか又はその何らかの外挿を使用し、そのようなパラメータとともにデコーダを使用する。本質的には、この原理は、符号化／復号化のために所定のモデルを設定し、フリーズされたパラメータ又は外挿されたパラメータによって同一のモデルを適用するというものである。ＡＭＲ及びＡＭＲ−ＷＢのフレーム損失コンシールメント技術は代表的な技術であると考えることができる。それらの技術は、対応する規格仕様書の中で詳細に記述されている。

各種あるオーディオコーデックのうちの多くのコーデックは、何らかの周波数領域変換の後にスペクトルパラメータに符号化モデルが適用される周波数領域符号化技術を適用する。デコーダは、受信したパラメータから信号スペクトルを再構成し、最終的にスペクトルを変換して時間信号に戻す。通常、時間信号はフレームごとに再構成される。そのようなフレームは、オーバラップ加算技術により最終再構成信号として合成される。そのオーディオコーデックの場合であっても、従来のエラーコンシールメントは、損失フレームに対して同一の又は少なくとも類似する復号化モデルを通常適用する。過去に受信されたフレームからの周波数領域パラメータがフリーズされるか又は適切に外挿され、その後、周波数／時間領域変換で使用される。そのような技術の例は、３ＧＰＰ規格に準拠した３ＧＰＰオーディオコーデックによって提供される。

従来技術によるフレーム損失コンシールメントの方法では、一般に、品質の不足が問題となる。例えば、パラメータのフリーズ、外挿技術や損失フレーム対しても同一のデコーダモデルを再適用することによって、必ずしも、過去に復号化された信号フレームから損失フレームへの円滑かつ忠実な信号発展（signal evolution）が保証されるものではないということが主な問題点である。そのため、可聴信号はしばしば不連続になり、品質にも影響が出る。

音声及びオーディオ伝送システムの新規なフレーム損失コンシールメント方式を説明する。新規な方式により、従来のフレーム損失コンシールメント技術で実現可能であった品質と比較して、フレーム損失の場合の品質が改善される。

本発明の実施形態の目的は、以下に説明される関連する新規な種類の方法であるのが好ましいフレーム損失コンシールメント方式を、可能な限り最良の再構成信号音質が実現されるように制御することである。実施形態は、信号の特性及びフレーム損失の時間的分布の双方に関して再構成品質を最適化することを目的とする。高い品質を提供することに関してフレーム損失コンシールメントで特に問題になるのは、オーディオ信号がエネルギの立ち上がりや立ち下がりのような大きく変化する特性を有する場合、又はオーディオ信号のスペクトルが非常に大きく変動する場合である。その場合、説明したコンシールメント方法では、上記立ち上がり、立ち下がり、又はスペクトルの変動を繰り返してしまい、原信号から大きな変化して品質が劣化する。

問題となる別のケースは、フレーム損失のバーストが連続的に起こる場合である。概念的には、説明した方法に係るフレーム損失コンシールメント方法では、そのような場合に対処しても、依然として音のアーチファクト（tonal artifacts）を生じてしまう。本発明の実施形態の別の目的は、そのような音のアーチファクトを可能な限り大きく軽減することである。

第１の態様によれば、損失オーディオフレームのコンシールメントを行うデコーダの方法は、過去に受信され再構成されたオーディオ信号の特性又は観測されたフレーム損失の統計的特性における、損失フレームの代替によって品質が相対的に低下するような条件を検出するステップを含む。そのような条件が検出された場合、代替フレームスペクトルの位相又はスペクトル振幅を選択的に調整することにより、コンシールメント方法を修正する。

第２の態様によれば、デコーダは損失オーディオフレームのコンシールメントを実現するように構成される。デコーダは、過去に受信され再構成されたオーディオ信号の特性又は観測されたフレーム損失の統計的特性における、損失フレームの代替により品質が相対的に低下するような条件を検出するコントローラを備える。そのような条件が検出された場合、コントローラは、代替フレームスペクトルの位相又はスペクトル振幅を選択的に調整することによりコンシールメント方法を修正する。

デコーダは、例えば移動電話などの装置で実現可能である。

第３の態様によれば、受信機は、上述の第２の態様に係るデコーダを備える。

第４の態様によれば、損失オーディオフレームのコンシールメントを行うためのコンピュータプログラムが定義される。コンピュータプログラムは、プロセッサにより実行されると、プロセッサに上述の第１の態様に従って損失オーディオフレームのコンシールメントを行わせる命令を含む。

第５の態様によれば、コンピュータプログラム製品は、上述の第４の態様に係るコンピュータプログラムを記憶するコンピュータ読み取り可能な媒体を備える。

一実施形態の利点は、従来のコンシールメント方法のみの場合に実現される品質と比較して、符号化音声信号及び符号化オーディオ信号の伝送におけるフレーム損失による音質への影響を大きく軽減できるフレーム損失コンシールメント方法の適応制御が実現されることである。実施形態の一般的利点は、損失フレームに対しても円滑かつ忠実な再構成信号の発展（evolution）が提供されることである。フレーム損失の聴感上の影響は、従来技術と比べて大幅に低減される。

方形窓関数を示す図。ハミング窓と方形窓との組み合わせを示す図。窓関数の振幅スペクトルの一例を示す図。周波数ｆ_kの例示的な正弦波信号の線スペクトルを示す図。周波数ｆ_kの窓掛け後の正弦波信号のスペクトルを示す図。分析フレームに基づくＤＦＴのグリッドポイントの大きさに対応するバーを示す図。ＤＦＴグリッドポイントＰ１、Ｐ２及びＰ３を通るパラボラフィッティングを示す図。窓スペクトルのメインローブのフィッティングを示す図。ＤＦＴグリッドポイントＰ１及びＰ２を通るメインローブ近似関数Ｐのフィッティングを示す図。受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する本発明の実施形態に係る例示的な方法を示すフローチャート。受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する本発明の実施形態に係る別の例示的な方法を示すフローチャート。本発明の別の例示的な実施形態を示す図。本発明の一実施形態に係る装置の一例を示す図。本発明の一実施形態に係る装置の別の例を示す図。本発明の一実施形態に係る装置の別の例を示す図。

説明する新規なフレーム損失コンシールメント技術に関する新規な制御方式は、図１０に示されるような以下のステップを含む。なお、方法はデコーダのコントローラによって実行可能である。

１．前述の方法では損失フレームの代替によって音質が劣化してしまうような、過去に受信され再構成されたオーディオ信号の特性または観測されたフレーム損失の統計的特性の状態を検出する（１０１）。

２．ステップ１でそのような状態が検出された場合、位相又はスペクトル振幅を選択的に調整することにより、Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^jθ _kによって代替フレームスペクトルを計算する方法の要素を修正する（１０２）。

（正弦波分析）
新規な制御技術が適用されうるフレーム損失コンシールメント技術の第１のステップは、過去に受信された信号の一部の正弦波分析（sinusoidal analysis）を含む。この正弦波分析の目的は、その信号の主正弦波の周波数を特定することである。これは、限定された数の個別の正弦波から信号が構成されていること、すなわち信号が以下に示す種類のマルチ正弦波信号であることが、基本的な前提となっている。

ただし、Ｋは、信号を構成すると想定される正弦波の数である。添字ｋ＝１…Ｋの各正弦波に対して、ａ_kは振幅、ｆ_kは周波数、φ_kは位相である。サンプリング周波数はｆ_sで表され、時間離散信号サンプルｓ（ｎ）の時間インデックスはｎで表される。

可能な限り正確な正弦波の周波数を特定することが第１に重要である。理想的な正弦波信号は線周波数ｆ_kの線スペクトルを有すると考えられるが、その真の値を特定するには、原理上、無限の測定時間が必要になるであろう。従って、実際には、本明細書において説明される正弦波分析に使用される信号セグメントに対応する短時間の測定に基づいて線周波数を推定することしかできないので、線周波数を発見するのは難しい。以下の説明中、この信号セグメントは分析フレームと呼ばれる。別の困難な問題は、信号が実際には時変信号であり、上記の式のパラメータが時間の経過に伴って変動するということである。そこで、測定をより正確にするためには長い分析フレームを使用することが望ましいが、起こりうる信号変動に更に適切に対応するためには、測定時間を短縮することが必要になる。その適切なトレードオフとしては、例えば２０〜４０ｍｓ程度の長さの分析フレームを使用することである。

正弦波の周波数ｆ_kを特定可能にする好適な方法は、分析フレームの周波数領域分析を実行することである。この目的のために、例えばＤＦＴ又はＤＣＴ、あるいは類似する周波数領域変換によって、分析フレームは周波数領域に変換される。分析フレームのＤＦＴが使用される場合、スペクトルは次式により表される。

ただし、ｗ（ｎ）は、長さＬの分析フレームを抽出し重み付けする窓関数を表す。典型的な窓関数は、例えば、図１に示されるようなｎ∈［０…Ｌ−１］に対して１であり、その他の場合は０である方形窓である。過去に受信されたオーディオ信号の時間指標は、分析フレームが時間指標ｎ＝０…Ｌ−１により参照されるように設定されると想定する。スペクトル分析に更に適すると思われる他の窓関数としては、例えばハミング窓、ハニング窓、カイザー窓又はブラックマン窓がある。特に有用であるとわかっている窓関数は、ハミング窓と方形窓との組み合わせである。図２に示されるように、この窓は、長さＬ１のハミング窓の左半分のような立ち上がり端形状及び長さＬ１のハミング窓の右半分のような立ち下がり端形状を有し、立ち上がり端と立ち下がり端との間で、窓は、長さＬ−Ｌ１の場合に１に等しい。

窓分析フレーム｜Ｘ（ｍ）｜の振幅スペクトルのピークは、必要とされる正弦波周波数ｆ_kの近似を構成する。しかし、この近似の正確度は、ＤＦＴの周波数間隔により限定される。ブロック長ＬのＤＦＴの場合、正確度はｆ_s／（２Ｌ）に限定される。

実験によれば、このレベルの正確度は、本明細書において説明される方法の範囲内では低すぎるかもしれない。以下のことを考慮した結果に基づき、正確度の改善を得ることができる。

窓分析フレームのスペクトルは、正弦波モデル信号Ｓ（Ω）の線スペクトルによる窓関数のスペクトルの畳み込みと、その後に続く次式のＤＦＴのグリッドポイントにおけるサンプリングによって与えられる。

正弦波モデル信号のスペクトル表現を使用することにより、これを次のように書き換えることができる。

従って、サンプリングされたスペクトルは次式により表される。

ただし、ｍ＝０…Ｌ−１

この考えに基づき、分析フレームの振幅スペクトルの中で観測されるピークは、それらのピークの近傍で真の正弦波周波数が特定されるＫ個の正弦波を含む窓掛け後正弦波信号に由来するものと想定される。観測されたｋ番目のピークのＤＦＴインデックス（グリッドポイント）をｍ_kとすると、対応する周波数は、

であり、これは、真の正弦波周波数ｆ_kの近似であるとみなすことができる。真の正弦波周波数ｆ_kは、区間

の中にあると想定できる。

なお、明確にするため、正弦波モデル信号の線スペクトルのスペクトルによる窓関数のスペクトルの畳み込みは、窓関数スペクトルの周波数シフトバージョンの重畳であると理解することができ、このため、シフト周波数は正弦波の周波数である。次に、この重畳はＤＦＴグリッドポイントでサンプリングされる。それらのステップは図３以降の図により示される。図３は窓関数の振幅スペクトルの一例を示す。図４は、周波数の１つの正弦波と共に正弦波信号の一例の振幅スペクトル（線スペクトル）を示す。図５は、正弦波の周波数における周波数シフト窓スペクトルを再現し、重畳する窓掛け後正弦波信号の振幅スペクトルを示す。図６の点線は、分析フレームのＤＦＴを計算することにより取得された窓掛け後正弦波におけるＤＦＴのグリッドポイントの振幅に対応する。なお、すべてのスペクトルは正規化周波数パラメータΩによって周期的である。ここで、Ωは、サンプリング周波数ｆ_sに対応する２πである。

先の説明及び図６は、使用される周波数領域変換の周波数分解能と比較して探索の分解能を増加させることによってのみ、正弦波周波数をよりよく近似できることを示唆する。

正弦波の周波数ｆ_kの更によい近似を発見する好適な方法の１つは、放物線補間（parabolic interpolation）を適用することである。そのような方式の１つは、ピークを取り囲むＤＦＴ振幅スペクトルのグリッドポイントを通してパラボラフィッティングを行い、放物線最大値に属する各々の周波数を計算することである。放物線の次の適切な選択肢は２である。詳細には、以下の手順を適用することができる。

１．窓掛け後分析フレームのＤＦＴのピークを特定する。ピーク探索はピークの数Ｋ及びピークの対応するＤＦＴインデックスを出力する。ピーク探索は、通常、ＤＦＴ振幅スペクトル又は対数ＤＦＴ振幅スペクトルに対して実行可能である。

２．対応するＤＦＴインデックスｍ_kを有するピークｋ（ｋ＝１…Ｋ）ごとに、３つのポイント

を通してパラボラフィッティングを行う。その結果、次式により定義される放物線の放物線係数ｂ_k（０）、ｂ_k（１）、ｂ_k（２）が得られる。

このパラボラフィッティングは、図７に示される。

３．Ｋ個の放物線の各々に対して、その放物線が最大値を有するｑの値に対応する補間周波数インデックス

を計算する。正弦波周波数ｆ_kの近似として

を使用する。

説明した方式は良好な結果を提供するが、放物線は、窓関数の振幅スペクトル｜Ｗ（Ω）｜のメインローブの形状を近似しないので、いくつかの制限があるかもしれない。これを実行する代替方式は、以下に説明されるように、メインローブ近似を使用する改良型周波数推定である。この代替方式の主要な概念は、

のメインローブを近似する関数Ｐ（ｑ）を、ピークを取り囲むＤＦＴ振幅スペクトルのグリッドポイントを通してフィッティングし、関数最大値に属する各々の周波数を計算することである。関数Ｐ（ｑ）は、窓関数の周波数シフト振幅スペクトル

と同一でありうる。しかし、数値的に単純にするために、これを関数最大値の容易な計算を可能にする多項式にすべきである。以下に詳細に説明される手順を適用できる。

１．窓分析フレームのＤＦＴのポイントを特定する。ピーク探索はピークの数Ｋ及びピークの対応するＤＦＴインデックスを出力する。ピーク探索は、通常、ＤＦＴ振幅スペクトル又は対数ＤＦＴ振幅スペクトルに対して実行可能である。

２．所定の区間（ｑ₁，ｑ₂）に対して窓関数の振幅スペクトル

または対数振幅スペクトル

を近似する関数Ｐ（ｑ）を取り出す。窓スペクトルのメインローブを近似する近似関数の選択は、図８により示される。

３．対応するＤＦＴインデックスｍ_kを伴うピークｋ（ｋ＝１…Ｋ）ごとに、窓正弦波信号の連続スペクトルの予想される真のピークを取り囲む２つのＤＦＴグリッドポイントを通して周波数シフト関数

のフィッティングを行う。従って、
｜Ｘ（ｍ_k−１）｜が｜Ｘ（ｍ_k＋１）｜より大きい場合、ポイント

を通して

のフィッティングを行い、そうでない場合、ポイント

を通して

のフィッティングを行う。簡単にするため、Ｐ（ｑ）を２次又は４次のいずれかの多項式として選択できる。これにより、ステップ２の近似は単純な線形回帰計算及び

の簡単な計算となる。区間（ｑ₁、ｑ₂）は、すべてのピークに対して一定かつ同一になるように選択でき、例えば（ｑ₁、ｑ₂）＝（−１，１）であるか、又は適応的である。適応的方式の場合、関数

が関連するＤＦＴグリッドポイント｛Ｐ₁；Ｐ₂｝の範囲内で窓関数スペクトルのメインローブのフィッティングを行うように、区間を選択できる。このフィッティング処理は図９に示される。

４．窓正弦波信号の連続スペクトルがピークを有すると予測されるＫ個の周波数パラメータ

の各々に対して、

を正弦波周波数ｆ_kの近似として計算する。

送信された信号が高調波である場合、何らかの基本周波数ｆ₀の整数倍数であるような周波数を有する正弦波から信号が構成される場合が多い。これは、信号が例えば有声音声又は何らかの楽器の持続音のように非常に周期的である場合である。実施形態の正弦波モデルの周波数は周波数依存ではなく、同一の基本周波数に対して高調波の関係にあり、同一の基本周波数に由来する。この高調波特性を考慮に入れることにより、結果的に正弦波成分周波数の分析を相当に改善できる。

改善の可能性の１つの概要は次の通りである。

１．信号が高調波であるか否かを検査する。これは、例えば、フレーム損失以前の信号の周期性を評価することにより実行可能である。簡単な方法の１つは信号の自動相関分析を実行することである。何らかの時間遅延τ＞０に関する自動相関関数の最大値を指標として使用できる。この最大値の値が所定の閾値を超えた場合、信号は高調波であるとみなすことができる。その場合、対応する時間遅延τは、

によって基本周波数と関連する信号の周期に対応する。

多くの線形予測音声符号化法は、適応コードブックを使用していわゆる開ループ又は閉ループピッチ予測符号化、すなわちＣＥＬＰ符号化を適用する。信号が高調波である場合、そのような符号化方法により取り出されるピッチゲイン及び関連するピッチラグパラメータも、時間遅延に関してそれぞれ有用な指標である。

ｆ₀を取得する更なる方法を以下に説明する。

２．整数範囲１…Ｊ_maxの中の高調波インデックスｊごとに、高調波周波数ｆ_j＝ｊ・ｆ₀の近傍に分析フレームの（対数）ＤＦＴ振幅スペクトルのピークが存在するか否かを検査する。ｆ_jの近傍は、デルタがＤＦＴの周波数分解能ＤＦＴ（ｆ_s／Ｌ）に対応するｆ_jの周囲のデルタ範囲、すなわち区間

として定義されうる。対応する推定正弦波周波数

を有するピークが存在する場合、f^kをf^k=j・f₀と置換する。

上記の２ステップ手順の場合、信号が高調波であるか否かの検査及び基本周波数の偏移を黙示的に、おそらくは反復方式で必ずしも何らかの別の方法からの指標を使用せずに取り出すことも可能である。そのような技術の一例を以下に示す。

候補値｛ｆ_0,1…ｆ_0,P｝の集合の中からのｆ_0,pごとに、

を置換することなく、高調波周波数の周囲の近傍に存在するＤＦＴピークの数、すなわちｆ_0,pの整数倍数をカウントしつつ、手順のステップ２を適用する。高調波周波数に又はその周囲に最大数のピークが取得される基本周波数ｆ_0,pmaxを特定する。このピークの最大数が所定の閾値を超えた場合、信号は高調波であると想定される。その場合、ｆ_0,pmaxは、ステップ２の実行に際して使用され、その結果、改善された正弦波周波数f^kをもたらす基本周波数であると想定できる。しかし、これに代わる更に好適な方法は、まず、高調波周波数と一致することがわかっているピーク周波数f^kに基づいて基本周波数ｆ₀を最適化することである。Ｍ個の高調波より成る集合、すなわち、周波数f^k(m), m = 1…MでＭ個のスペクトルピークの何らかの集合と一致することがわかっている何らかの基本周波数の整数倍数｛ｎ₁…ｎ_M｝を想定すると、基礎を成す（最適化）基本周波数ｆ_0,optは、高調波周波数とスペクトルピーク周波数との誤差を最小限にするように計算できる。最小にすべき誤差が平均２乗誤差

である場合、最適基本周波数は、

として計算される。候補値の初期集合｛ｆ_0,1…ｆ_0,P｝は、ＤＦＴピークの周波数又は推定正弦波周波数

から取得できる。
推定正弦波周波数

の正確度を改善する更なる可能性は、その時間発展（temporal evolution）を考慮することである。その目的のために、複数の分析フレームからの正弦波周波数の推定値を例えば平均化又は予測によって組み合わせることができる。平均化又は予測に先立って、各推定スペクトルピークを同一の基調となる各正弦波に結び付けるピーク追跡を適用することができる。

（正弦波モデルの適用）
以下、フレーム損失コンシールメント演算を実行するための正弦波モデルの適用について説明する。

対応する符号化情報が利用不可能であるため符号化信号の所定のセグメントをデコーダにより再構成できない場合を想定する。更に、このセグメントより過去の信号の部分が利用可能であるとする。ｙ（ｎ）（ただし、ｎ＝０…Ｎ−１）を、代替フレームｚ（ｎ）が生成されなければならない利用不可能セグメントであるとし、ｎ＜０の場合のｙ（ｎ）を、過去に復号された利用可能信号であるとする。この場合、第１のステップにおいて、長さＬ及び開始インデックスｎ_-1の利用可能信号のプロトタイプフレームが窓関数ｗ（ｎ）によって抽出され、例えば次式のＤＦＴによって周波数領域に変換される。

窓関数は、先に正弦波分析に関して説明した窓関数のうち１つでありうる。数値の複雑さを軽減するために、周波数領域変換後のフレームは、正弦波分析において使用されるフレームと同一であるのが好ましい。

次のステップにおいて、想定正弦波モデルが適用される。想定正弦波モデルによれば、プロトタイプフレームのＤＦＴを次のように書き表すことができる。

次のステップは、使用される窓関数のスペクトルが０にごく近い周波数範囲において重大な寄与をすると理解することである。図３に示されるように、窓関数の振幅スペクトルは、０にごく近い周波数に対しては大きく、そうでない周波数に対しては小さい（サンプリング周波数の２分の１に対応する−π〜πの正規化周波数範囲内）。従って、近似として、窓スペクトルＷ（ｍ）は、区間Ｍ＝［−ｍ_min，ｍ_max］（ｍ_min及びｍ_maxは小さな正の整数）に対してのみ０ではないと仮定する。特に、窓関数スペクトルの近似は、ｋごとに、上記の式中のシフトされた窓スペクトルの寄与が厳密に互いに重なり合わないように使用される。上記の式において、周波数インデックスごとに、１つの被加数からの、すなわち１つのシフトされた窓スペクトルからの寄与のみが常に最大である。これは、上記の式が下記の近似式に縮小されることを意味する。

非負であるｍ∈Ｍ_kに対して、ｋごとに、

ここで、Ｍ_kは、整数区間

を示し、ｍ_min,k及びｍ_max,kは、区間が互いに重なり合わないようにするという先に説明した制約に適合する。ｍ_min,k及びｍ_max,kの適切な選択は、それらの値を小さな整数値δ、例えばδ＝３に設定することである。しかし、２つの隣接する正弦波周波数ｆ_k及びｆ_k+1に関連するＤＦＴインデックスが２δより小さい場合、区間が重なり合わないことが保証されるように、δは、

に設定される。関数floor(・)は、それ以下である関数引数に最も近い整数である。

一実施形態による次のステップは、上記の式による正弦波モデルを適用し、そのＫ個の正弦波を時間的に発展（evolve）させることである。プロトタイプフレームの時間インデックスと比較して、消去セグメントの時間インデックスはｎ_-1サンプルだけ異なるという仮定は、正弦波の位相が

だけ進んでいることを意味する。従って、発展させた正弦波モデルのＤＦＴスペクトルは次式により表される。

シフトされた窓関数スペクトルが互いに重なり合わないという近似を再び適用すると、非負であるｍ∈Ｍ_kに対して、ｋごとに以下の式が得られる。

近似を使用することにより、プロトタイプフレームＹ_-1Ｙ（ｍ）のＤＦＴを、発展させた正弦波モデルＹ₀（ｍ）のＤＦＴと比較すると、ｍ∈Ｍ_kごとに位相が

だけシフトされる間、振幅スペクトルは不変のままであることがわかる。従って、各正弦波の近傍のプロトタイプフレームの周波数スペクトル係数は、正弦波周波数ｆ_kと、損失オーディオフレームとプロトタイプフレームｎ_-1との間の時間差とに比例してシフトされる。

従って、本実施形態によれば、次式により代替フレームを計算できる。
非負のｍ∈Ｍ_kに対して、ｋごとに、

とし、

特定の一実施形態は、どの区間Ｍ_kにも属さないＤＦＴインデックスに関する位相ランダム化に対処する。先に説明したように、区間Ｍ_k，ｋ＝１…Ｋは、それらの区間が厳密に重なり合わないように設定されなければならず、これは、区間のサイズを制御する何らかのパラメータδを使用して実行される。２つの隣接する正弦の周波数距離に関連して、δが小さいということが起こりうる。従って、その場合、２つの区間の間に隙間ができることもありうる。そのため、対応するＤＦＴインデックスｍに対して、上記の式

に従った位相シフトは定義されない。本実施形態による適切な選択肢は、それらのインデックスに対して位相をランダム化することであり、その結果、Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^{j2πrand(・)}となる。ここで、関数rand(・)は何らかの乱数を返す。

再構成信号の品質に関して、区間Ｍ_kのサイズを最適化することは有益であることがわかっている。特に信号が非常にトーン信号に近い場合、すなわち鮮明かつ明確なスペクトルピークを有する場合、区間を大きくすべきである。これは、例えば信号が明確な周期性を有する高調波である場合である。信号が広いスペクトル最大値を有し、さほど明確ではないスペクトル構造を有する他の場合には、狭い区間を使用することにより品質がよくなることがわかっている。この発見により、信号の特性に従って区間サイズを適応化させるという更なる改善が得られる。実施形態の１つはトーン性検出器又は周期性検出器を使用する。この検出器が信号がトーン信号に近いと判定すると、区間サイズを制御するδパラメータは、相対的に大きな値に設定される。そうでない場合、δパラメータは相対的に小さな値に設定される。

上記の説明に基づき、オーディオフレーム損失コンシールメント方法は次のステップを含む。

１．利用可能な、過去に合成された信号のセグメントを分析して、例えば改善周波数推定値を使用して、正弦波モデルの組成する正弦波周波数ｆ_kを取得する。

２．利用可能な、過去に合成された信号からプロトタイプフレームｙ_-1を抽出し、そのフレームのＤＦＴを計算する。

３．正弦波周波数ｆ_kと、プロトタイプフレームと代替フレームとの間の時間の進みｎ_-1とに応じて、正弦波ｋごとの位相シフトθ_kを計算する。このステップにおいて、例えば、区間Ｍのサイズがオーディオ信号のトーン性に応じて適応化されうる。

４．正弦波ｋごとに、正弦波周波数ｆ_kの周囲の近傍に関連するＤＦＴインデックスに対して、プロトタイプフレームＤＦＴの位相を選択的にθ_k進ませる。

５．ステップ４で取得されたスペクトルの逆ＤＦＴを計算する。

（信号及びフレーム損失特性の分析及び検出）
上述した方法は、オーディオ信号の特性は、短時間の間では、過去に受信され再構成された信号フレーム及び損失フレームから大きく変化することはないという仮定に基づいている。この場合、過去に再構成されたフレームの振幅スペクトルを保持し、過去に再構成された信号において検出された正弦波主成分の位相を発展させる（evolve）ことは、非常に良い選択である。しかし、例えば急激なエネルギ変化や急激なスペクトル変化を伴う過渡状態が存在する場合には、この仮定は誤りとなりうる。

そのため、本発明に係る過渡検出器の第１の実施形態は、過去に再構成された信号のエネルギ変動に基づくことができる。図１１に示されるこの方法は、分析フレーム１１３の左側部分及び右側部分のエネルギを計算する。分析フレームは、前述した正弦波分析に使用されるフレームと同一でよい。分析フレームの一部（左側又は右側）は、その分析フレームの最初の半分の部分または最後の半分の部分であってもよいし、例えば分析フレーム１１０の最初の４分の１の部分または最後の４分の１の部分であってもよい。それぞれの部分のエネルギ計算は、それらの部分フレームにおけるサンプルの２乗を加算することにより実行される。

ただし、ｙ（ｎ）は分析フレームを示し、ｎ_left及びｎ_rightは共に、サイズＮ_partの部分フレームの開始インデックスを示す。

左右の部分フレームのエネルギは、信号不連続性の検出に使用される。これは、比

を計算することにより実行される。比Ｒ_l/rが閾値（例えば、10）を超えた場合、急激なエネルギ減少（立ち下がり）による不連続性を検出できる（１１５）。同様に、比Ｒ_l/rが他の閾値（例えば、0.1）を下回った場合、急激なエネルギ増加（立ち上がり）による不連続性を検出できる（１１７）。

前述したコンシールメント方法に関連して、上記定義したエネルギ比は多くの場合で感度の低すぎる指標であるかもしれないということが判明した。特に、実信号、とりわけ音楽信号の場合、ある周波数のトーンが急激に現れるのに対し、他の周波数の他のトーンが急激に消滅することがある。上記定義したエネルギ比を使用して信号フレームを分析すると、この指標は異なる周波数に対しては低い感度しか示さないので、いずれの場合にも、上記トーンのうちの少なくとも１つについて誤った検出結果を導く可能性がある。

この問題に対する解決方法を以下の実施形態で説明する。まず、過渡検出が時間-周波数平面で実行される。分析フレームは、同様に左側部分フレームと右側部分フレームとに分割される（１１０）。しかし、それら２つの部分フレームは、（例えば、ハミング窓による適切な窓掛け（１１１）の後に）例えばＮ_part点ＤＦＴによって周波数領域に変換される（１１２）。

及び、ｍ＝０…Ｎ_part−１の場合、

ここで、インデックスｍのＤＦＴビンごとに、過渡検出を周波数選択的に実行可能である。ＤＦＴインデックスｍごとに、左右の部分フレームの振幅スペクトルのパワを用いてエネルギ比を次のように計算できる（１１３）。

経験上、ＤＦＴビン分解能による周波数選択的過渡検出は、統計的変動（推定誤差）のために相対的に不正確であることがわかっている。周波数帯域に基づいて周波数選択的過渡検出を実行した場合、演算の品質が向上することが判明している。ｌ_k＝［ｍ_k-1＋１，…，ｍ_k］がｍ_k-1＋１からｍ_kまでのＤＦＴビンを含むｋ番目の区間（ｋ＝１…Ｋ）を指定するとすれば、それらの区間は、Ｋ個の周波数帯域を定義する。そこで、左側部分フレームと右側部分フレームの各帯域エネルギの帯域ごとの比に基づいて、周波数群選択的過渡検出を実行できる。

なお、区間ｌ_k＝［ｍ_k-1＋１，…，ｍ_k］は、周波数帯域

に対応し、ｆ_sはオーディオサンプリング周波数である。

最も低い下限周波数帯域境界ｍ₀を０に設定することは可能であるが、周波数が低くなるほど増加する推定誤差を軽減するために、それより高い周波数に対応するＤＦＴインデックスに境界が設定されてもよい。最も高い上限周波数帯域境界ｍ_kを

に設定することは可能であるが、これは、過渡状態が依然として聞こえの効果に重大な影響を及ぼす低い周波数に対応するように選択されるのが好ましい。

それらの周波数帯域のサイズ又は幅の適切な選択の１つは、それらを等しい大きさ、例えば数百Ｈｚの幅、にすることである。別の好適な方法は、周波数帯域の幅を人間の聴覚の臨界帯域のサイズに従うこと、すなわちそれらを聴覚系の周波数分解能に関連付けることである。これは、周波数帯域の幅を１ｋＨｚまでの周波数に対しては等しくし、約１ｋＨｚを超えた後は指数関数的に増加させることとほぼ同じである。指数関数的増加は、例えば帯域インデックスｋの増分に伴って周波数帯域幅を２倍にすることを意味する。

２つの部分フレームのエネルギ比に基づく過渡検出器の第１の実施形態で説明したように、２つの部分フレームの帯域エネルギ又はＤＦＴビンエネルギに関連する比が、閾値と比較される。（周波数選択的）立ち下がり検出１１５には上限閾値が用いられ、（周波数選択的）立ち上がり検出１１７には下限閾値が用いられる。

フレーム損失コンシールメント方法の適応化に適する更に別のオーディオ信号依存指標は、デコーダへ送信されるコーデックパラメータに基づくことができる。例えば、コーデックは、ＩＴＵ−ＴＧ．７１８のようなマルチモードコーデックであってもよい。そのようなコーデックは、信号の異なる種類に対して特定のコーデックモードを使用し、フレーム損失の直前のフレームにおけるコーデックモードの変更は、過渡の指標とみなされうる。

フレーム損失コンシールメントの適応化に有用な別の指標は、有声音特性及び送信信号に関連するコーデックパラメータである。有声音は、人間の声道の周期的な声門励振により生成される極めて周期的な音声に関連する。

更なる好適な指標は、信号コンテンツが音楽であるか音声であるかの推定の指標である。そのような指標は、通常はコーデックの一部でありうる信号分類器から取得できる。コーデックがそのような分類を実行し、デコーダに対する符号化パラメータとして利用可能な対応する分類がされた場合、このパラメータは、フレーム損失コンシールメント方法を適応化させるために使用される信号コンテンツ指標として使用されるのが好ましい。

フレーム損失コンシールメント方法の適応化に使用されるのが好ましい別の指標は、フレーム損失のバースト性である。フレーム損失のバースト性は、数回のフレーム損失が連続的に起こり、そのため、フレーム損失コンシールメント方法がその演算に最近復号された有効信号部分を使用するのが難しくなっていることを意味する。従来の技術による指標は、連続して観測されたフレーム損失の数ｎ_burstである。このカウンタは、フレーム損失が起こるたびに１増分され、有効フレームが受信されると０にリセットされる。この指標は、本発明の例示的な実施形態に関連して使用される。

（フレーム損失コンシールメント方法の適応化）
実行された上記のステップがフレーム損失コンシールメント演算の適応化を示唆する状態を示す場合、代替フレームのスペクトルの計算が修正される。

代替フレームスペクトルの当初の計算は、式Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^jθ _kに従って実行されるが、振幅及び位相の双方を修正する適応化が導入される。振幅は２つの係数α（ｍ）及びβ（ｍ）によるスケーリングによって修正され、位相は追加位相成分

によって修正される。これにより、代替フレームは次のように修正計算される。

なお、

である場合、当初の（非適応）フレーム損失コンシールメント方法が使用される。従って、それらの値はそれぞれデフォルト値である。

振幅適応化を導入することの一般的目的は、フレーム損失コンシールメント方法の音のアーチファクトを回避することである。そのような音のアーチファクトは、過渡音の反復から生じる音楽音、トーン音、あるいは異常音となりうる。そのような音のアーチファクトは品質の劣化につながると考えられるので、音のアーチファクトを回避することが、ここで説明する適応化の目的である。そのような適応化に適する方法は、代替フレームの振幅スペクトルを適切な程度に修正することである。

図１２は、コンシールメント方法修正の一実施形態を示す。バースト損失カウンタｎ_burstが閾値thr_burst（例えばthr_burst＝３）を超えた場合（１２１）、振幅適応化が実行されるのが好ましい（１２３）。その場合、減衰率として、１より小さい値（例えばα（ｍ）＝0.1）が使用される。

ただし、徐々に程度が増加する減衰を実行するのが有益であることがわかっている。これを実現する好適な一実施形態は、フレームごとの減衰量の対数増加att_per_frameを指定する対数パラメータを定義することである。そこで、バーストカウンタが閾値を超えた場合の、徐々に増加する減衰率は、次式により計算される。

ただし、定数ｃは、例えばデシベル（ｄＢ）単位でパラメータatt_per_frameを指定することを可能にする単なるスケーリング定数である。

追加的な好適な適応化は、信号が音楽であるか音声であるかの推定を示す指標に応じて実行されるものである。音楽コンテンツの場合、音声コンテンツと比較して閾値thr_burstを増加させ、フレームごとの減衰を減少させることが好ましい。これは、程度を下げながらフレーム損失コンシールメント方法の適応化を実行することに等しい。この種の適応化の背景にあるのは、一般に、音声と比較して音楽のほうが長い損失バーストの影響を受けやすいことである。従ってこの場合、少なくとも複数のフレーム損失が含まれる場合には、当初のフレーム損失コンシールメント方法、すなわち未修正のフレーム損失コンシールメント方法が依然として好適である。

指標Ｒ_l/r,band（ｋ）、あるいはＲ_l/r（ｍ）又はＲ_l/rが閾値を超えたことに基づいて過渡が検出された場合、振幅減衰率に関する更なるコンシールメント方法の適応化が実行されるのが好ましい（１２２）。その場合、適切な適応化動作（１２５）は、全減衰量が２つの係数の積α（ｍ）・β（ｍ）により制御されるように第２の振幅減衰率β（ｍ）を修正することである。

β（ｍ）は、過渡が示されたことに応じて設定される。立ち下がりが検出された場合、係数β（ｍ）は、その立ち下がりのエネルギ減少を反映するように選択されるのが好ましい。適切な選択肢は、β（ｍ）を検出されたゲイン変化に設定することである。すなわち、
ｍ∈Ｉ_k，ｋ＝１…Ｋとして、

立ち上がりが検出された場合、代替フレームにおけるエネルギ増加を制限するのが有利であることがわかっている。その場合、係数は、減衰も増幅もしないことを意味する固定値（例えば１）に設定することができる。

なお、上記の説明において、振幅減衰率は周波数選択的に、すなわち、周波数帯域ごとに、個別に計算された係数によって適用されるのが好ましい。帯域方式が使用されない場合、対応する振幅減衰率をアナログ的に取得することが可能である。ＤＦＴビンレベルで周波数選択的過渡検出が使用される場合、ＤＦＴビンごとに個別にβ（ｍ）を設定できる。あるいは、周波数選択的過渡指示がまったく使用されない場合、すべてのｍに対してβ（ｍ）を包括的に同一にすることができる。

振幅減衰率の更なる好適な適応化は、位相の修正と関連して追加位相成分

によって実行される（１２７）。所定のｍに対して、そのような位相修正が使用される場合、減衰率β（ｍ）は更に減少される。位相修正の程度まで考慮に入れられるのが好ましい。位相修正が適度に実行されるだけの場合、β（ｍ）はわずかにスケールダウンされるのみであるが、位相修正が強力である場合、β（ｍ）は更に大幅にスケールダウンされる。

位相適応化を導入することの一般的な目的は、生成される代替フレームのトーン性又は信号周期性が強すぎることによる品質劣化を招くようなことを回避することである。そのような適応化に適した方法は、位相を適切な程度にランダム化（randomize）又はディザリング（dithering）することである。

そのような位相ディザリングは、追加位相成分

が制御係数によってスケーリングされたランダム値

に設定されることにより実現される。

関数rand(・)により得られるランダム値は、例えば疑似乱数発生器により生成される。ここで、疑似乱数発生器は、区間［０，２π］の中で１つの乱数を出力すると想定する。

上式のスケーリング係数α（ｍ）は、当初の位相θ_kがディザリングされる程度を制御する。以下に示す実施形態は、このスケーリング係数を制御することによって位相適応化に対処する。スケーリング係数の制御は、先に説明した振幅修正係数の制御と同様に実行される。

第１の実施形態によれば、スケーリング係数α（ｍ）は、バースト損失カウンタに応じて適応化される。バースト損失カウンタｎ_burstが閾値thr_burst（例えば_burst＝３）を超えた場合、０より大きい数（例えば、α（ｍ）＝0.2）が使用される。

しかし、徐々に程度を増加させながらディザリングを実行するのが有益であることが分かっている。これを実現する好適な一実施形態は、フレームごとのディザリングの増加を指定するパラメータdith_increase_per_frameを定義することである。そこで、バーストカウンタが閾値を超えた場合、徐々に増加するディザリング制御係数は次式により計算される。

ただし、上式において、α（ｍ）は、全位相ディザリングが達成される最大値１に制限されなければならない。

なお、位相ディザリングを開始するために使用されるバースト損失閾値thr_burstは、振幅減衰に使用される閾値と同一の閾値であってもよい。しかし、それらの閾値を個別に最適値に設定することにより、より高い品質を得ることができ、これは、一般にそれらの閾値が異なっていてもよいことを意味する。

信号が音楽であるか音声であるかの推定を示す指標に応じて、好適な追加的な適応化が実行される。音楽コンテンツの場合、音声コンテンツと比較して閾値thr_burstを増加させるのが好ましい。これは、音声と比較して、音楽の場合の位相ディザリングは、連続する損失フレームの数が多い場合にのみ実行されることを意味する。これは、程度を下げながら音楽の場合のフレーム損失コンシールメント方法の適応化を実行することと同等である。この種の適応化の背景には、一般に音楽は、音声より長い損失バーストの影響を受けにくいということがある。従って、この場合、少なくとも多数の連続するフレーム損失に対しては、当初のフレーム損失コンシールメント方法、すなわち未修正のフレーム損失コンシールメント方法が依然として好ましい。

更なる好適な実施形態は、検出された過渡に応じて位相ディザリングを適応化することである。その場合、そのビン、対応する周波数帯域のＤＦＴビン、又はフレーム全体のＤＦＴビンに関して過渡が示されたＤＦＴビンｍに対して、より強力な程度の位相ディザリングを使用できる。

説明される方式の一部は、高調波信号、特に有声音の高調波信号に対してフレーム損失コンシールメント方法を最適化することに対処する。

前述したような改善型周波数推定を使用する方法が実現されない場合、有声音声信号に対して品質を最適化するフレーム損失コンシールメント方法の別の適応可能性は、音楽及び音声を含む一般的なオーディオ信号に関する方法ではなく、音声に特定して設計されかつ最適化された他のフレーム損失コンシールメント方法に切り替えることである。その場合、信号が有声音声信号を含むという指標が、前述した方式ではなく別の音声最適化フレーム損失コンシールメント方式を選択するために使用される。

実施形態は、図１３に示されるようなデコーダのコントローラに適用される。図１３は実施形態に係るデコーダの概略ブロック図である。デコーダ１３０は、符号化オーディオ信号を受信するように構成された入力ユニット１３２を備える。図は、論理フレーム損失コンシールメントユニット１３４によるフレーム損失コンシールメントを示し、これは、先述した実施形態に従ってデコーダが損失オーディオフレームのコンシールメントを実現するように構成されていることを示す。デコーダは、先述した実施形態を実現するコントローラ１３６を更に備える。コントローラ１３６は、受信され、再構成されたオーディオ信号の特性の中で又は観測されたフレーム損失の統計的特性において、先述した方法に従った損失フレームの代替が相対的に品質を低下させるような状態を検出するように構成される。そのような状態が検出された場合、コントローラ１３６は、位相又はスペクトル振幅を選択的に調整することにより、

に従って代替フレームスペクトルを計算するコンシールメント方法の要素を修正するように構成される。検出は、検出器ユニット１４６により実行可能であり、修正は、図１４に示されるような修正器ユニット１４８により実行可能である。

デコーダは、そこに含まれるユニットと共に、ハードウェアで実現可能である。デコーダのユニットの機能を実現するために使用可能であり、組み合わせ可能である回路素子には数多くの変形がありうる。そのような変形例は実施形態に含まれる。デコーダのハードウェア実現形態の特定の実施例は、共に汎用電子回路及び特定用途向け回路を含むデジタルシグナルプロセッサ（ＤＳＰ）ハードウェアと集積回路技術である。

あるいは、図１３に示されるような本明細書において説明される実施形態に係るオーディオフレーム損失コンシールメントの実行を含めて、オーディオ信号を再構成するために、本明細書において説明されるデコーダ１５０は、例えば図１５に示されるように、すなわち、プロセッサ１５４及び適切な記憶装置又はメモリ１５６を伴う適切なソフトウェア１５５のうち１つ以上により実現可能である。入力される符号化オーディオ信号は入力端子（ＩＮ）１５２により受信され、この入力端子（ＩＮ）１５２には、プロセッサ１５４及びメモリ１５６が接続される。ソフトウェアから取得された復号化、再構成化オーディオ信号は、出力端子（ＯＵＴ）１５８から出力される。

上述の技術は、例えば、移動体装置（例えば、移動電話、ラップトップ）又はパーソナルコンピュータなどの固定デバイスで使用可能な受信機において使用されうる。

相互に作用するユニット又はモジュールの選択、並びにそれらのユニットの名前は単なる例であり、開示される処理動作を実行可能にするために複数の代替方法で構成されうることは理解されよう。

なお、本明細書において説明されるユニット又はモジュールは、必ずしも個別の物理エンティティではなく、論理エンティティとしてみなされるべきものである。本明細書において開示される技術の範囲は、当業者には自明であると思われる他の実施形態をすべて含み、それに従って、本明細書の開示の範囲が限定されるべきではないことが理解されるだろう。

単数形の要素を説明する場合、明示して指示のない限り、それは「ただ１つの」要素を意味するのではなく、「１つ以上の」要素を表す。先に説明された実施形態の要素と同等の、当業者には知られているすべての構造及び機能は、そこで参照することにより本発明に明白に取り入れられており、本発明に含まれることが意図される。更に、装置又は方法は、本発明に含まれるために、本明細書において開示された技術により解決されようとしているありとあらゆる問題に対処する必要はない。

以上の説明の中で、開示される技術を完全に理解させるために、説明の便宜上、特定の構造、インタフェース、技術などの特定の詳細を述べたが、それは本発明を限定するものではない。しかし、それらの特定の詳細から逸脱した他の実施形態及び／又は実施形態の組み合わせにおいて、開示された技術が実施されてもよいことは当業者には明らかだろう。すなわち、本明細書には明示して説明又は図示されてはいないが、開示された技術の原理を具現化する種々の構成を当業者は考案できるだろう。場合によっては、不必要に詳細を述べることによって、開示される技術の説明をわかりにくくしないように、周知のデバイス、回路及び方法の詳細な説明を省略した。開示される技術の原理、態様及び実施形態、並びにその特定の実施例を説明した本明細書のすべての記述は、それらと同等な構造及び同等な機能を共に含むことを意図する。更に、そのような同等物は、現在知られている同等物に加えて、将来開発される同等物、例えば、構造に関わらず同一の機能を実行するように開発された何らかの要素をも含むことが意図される。

従って、例えば、添付の図は、技術の原理を具現化する例示的な回路又は他の機能ユニット、及び／又はコンピュータ読み取り可能な媒体で実質的に表現されてもよく、図には明示して示されてはいないが、コンピュータ又はプロセッサにより実行されうる種々の処理の概念図を表すことができることが当業者には理解されるだろう。

機能ブロックを含む種々の要素の機能は、回路ハードウェア及び／又はコンピュータ読み取り可能な媒体に記憶された符号化命令の形のソフトウェアを実行可能なハードウェアの使用によって提供されてもよい。従って、そのような機能及び図示される機能ブロックは、ハードウェアで実現されかつ／又はコンピュータで実現され、従って機械で実現されると理解されるべきである。

以上説明した実施形態は、本発明のいくつかの例示として理解されるべきである。本発明の範囲から逸脱することなく、それらの実施形態に対して種々の修正、組み合わせ及び変更が行われてもよいことは当業者には理解されよう。特に、異なる実施形態の異なる部分の方法は、技術的に可能であるならば、他の構成で組み合わせ可能である。

Claims

受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する方法であって、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出するステップ（１０１，１２２）と、
前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正するステップ（１０２，１２５）と、
観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第２の状態を更に検出するステップ（１０１，１２１）と、
前記第２の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正するステップ（１０２，１２３，１２７）と、
を有することを特徴とする方法。
前記当初のコンシールメント方法は、
過去に受信され再構成されたオーディオ信号から、プロトタイプフレームとして用いられるセグメントを抽出するステップと、
正弦波モデルを前記プロトタイプフレームに適用して前記正弦波モデルの正弦波周波数を取得するステップと、
得られた正弦波を時間発展させて前記代替フレームを生成するステップと、
を含むことを特徴とする請求項１に記載の方法。
前記時間発展は、前記得られた正弦波（ｋ）に関するスペクトル係数の位相をθ_kだけ進めることを含み、
前記代替フレームスペクトルの計算は、Ｙ（ｍ）を前記プロトタイプフレームの周波数領域表現とすると、式Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^jθ _kに従って実行されることを特徴とする請求項２に記載の方法。
前記過渡状態は、検出された立ち下がりを含むことを特徴とする請求項１乃至３のいずれか１項に記載の方法。
前記過渡状態の検出が周波数領域で実行されることを特徴とする請求項１乃至４のいずれか１項に記載の方法。
前記過渡状態の検出は、周波数帯域に基づいて周波数選択的に実行されることを特徴とする請求項５に記載の方法。
周波数帯域幅は人間の聴覚の臨界帯域の大きさに従うことを特徴とする請求項６に記載の方法。
前記代替フレームスペクトルの前記スペクトル振幅の選択的な調整は、前記周波数帯域において検出された前記過渡状態に応じて周波数帯域選択的に行われることを特徴とする請求項６又は７に記載の方法。
前記第２の状態は、数個の連続するフレーム損失が発生したことであることを特徴とする請求項１乃至８のいずれか１項に記載の方法。
前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、程度が徐々に増加する減衰を行うことにより調整されることを特徴とする請求項９に記載の方法。
前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、第１の減衰率を徐々に増加させることにより調整されることを特徴とする請求項９又は１０に記載の方法。
前記過渡状態が検出されたことに応じて第２の減衰率が設定され、前記第１の減衰率と前記第２の減衰率との積により全減衰量が制御されることを特徴とする請求項１１に記載の方法。
前記代替フレームスペクトルの前記位相の調整は、位相スペクトルのランダム化又はディザリングを含むことを特徴とする請求項１に記載の方法。
前記位相スペクトルは、前記ディザリングを、徐々に程度を増加させながら実行することにより調整されることを特徴とする請求項１３に記載の方法。
請求項１乃至１４のうちいずれか１項に記載の方法を実行する手段を備えることを特徴とする装置。
装置であって、
プロセッサ（１５４）と、
命令（１５５）を記憶するメモリ（１５６）と、
を備え、前記命令（１５５）は、前記プロセッサにより実行されたとき、前記装置に、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出させ、
前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正させ、
観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第２の状態を更に検出させ、
前記第２の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正させる
ことを特徴とする装置。
前記当初のコンシールメント方法を用いて前記代替フレームを生成するとき、前記装置は、
過去に受信され再構成されたオーディオ信号から、プロトタイプフレームとして用いられるセグメントを抽出し、
正弦波モデルを前記プロトタイプフレームに適用して前記正弦波モデルの正弦波周波数を取得し、
得られた正弦波を時間発展させて前記代替フレームを生成する、
ように動作することを特徴とする請求項１６に記載の装置。
前記時間発展は、前記得られた正弦波（ｋ）に関するスペクトル係数の位相をθ_kだけ進めることを含み、
前記代替フレームスペクトルの計算は、Ｙ（ｍ）を前記プロトタイプフレームの周波数領域表現とすると、式Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^jθ _kに従って実行されることを特徴とする請求項１７に記載の装置。
前記過渡状態の検出を行う過渡検出器を更に有することを特徴とする請求項１６乃至１８のいずれか１項に記載の装置。
前記過渡検出器は、周波数領域で前記過渡状態の検出を実行することを特徴とする請求項１９に記載の装置。
前記過渡検出器は、周波数帯域に基づく周波数選択的な前記過渡状態の検出を実行することを特徴とする請求項２０に記載の装置。
前記代替フレームスペクトルの前記スペクトル振幅の選択的な調整は、前記周波数帯域において検出された前記過渡状態に応じて周波数帯域選択的に行われることを特徴とする請求項２１に記載の装置。
前記第２の状態は、数個の連続するフレーム損失が発生したことであることを特徴とする請求項１６乃至２２のいずれか１項に記載の装置。
前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、程度が徐々に増加する減衰を行うことにより調整されることを特徴とする請求項２３に記載の装置。
前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、第１の減衰率を徐々に増加させることにより調整されることを特徴とする請求項２３又は２４に記載の装置。
前記過渡状態が検出されたことに応じて第２の減衰率が設定され、前記第１の減衰率と前記第２の減衰率との積により全減衰量が制御されることを特徴とする請求項２５に記載の装置。
前記代替フレームスペクトルの前記位相の調整は、位相スペクトルのランダム化又はディザリングを含むことを特徴とする請求項１６に記載の装置。
前記装置は移動体装置のデコーダであることを特徴とする請求項１５又は１６に記載の装置。
コンピュータ読み取り可能なコードユニットを含むコンピュータプログラム（１５５）であって、装置で実行されると、前記装置に、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出させ（１０１）、
前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正させ（１０２）、
観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第２の状態を更に検出させ、
前記第２の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正させる
ことを特徴とするコンピュータプログラム。
符号化オーディオ信号を受信する入力ユニット（１３２）と、
損失オーディオフレームのコンシールメントを行う論理フレーム損失コンシールメントユニット（１３４）と、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出し、前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正し、観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第２の状態を更に検出し、前記第２の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正するコントローラ（１３６）と、
を有することを特徴とするデコーダ（１３０）。
前記コントローラ（１３６）は、前記過去に受信され再構成されたオーディオ信号の特性又は前記観測されたフレーム損失の前記統計的特性における状態の前記検出を実行する検出器ユニット（１４６）と、前記コンシールメント方法の前記修正を実行する修正器ユニット（１４８）とを含むことを特徴とする請求項３０に記載のデコーダ。