JP6069526B2 - オーディオフレーム損失のコンシールメントを制御する方法及び装置 - Google Patents
オーディオフレーム損失のコンシールメントを制御する方法及び装置 Download PDFInfo
- Publication number
- JP6069526B2 JP6069526B2 JP2015555964A JP2015555964A JP6069526B2 JP 6069526 B2 JP6069526 B2 JP 6069526B2 JP 2015555964 A JP2015555964 A JP 2015555964A JP 2015555964 A JP2015555964 A JP 2015555964A JP 6069526 B2 JP6069526 B2 JP 6069526B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- spectrum
- frequency
- transient
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 122
- 238000001228 spectrum Methods 0.000 claims description 80
- 230000005236 sound signal Effects 0.000 claims description 33
- 230000001052 transient effect Effects 0.000 claims description 32
- 230000003595 spectral effect Effects 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 39
- 238000004458 analytical method Methods 0.000 description 35
- 230000006978 adaptation Effects 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 238000013213 extrapolation Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereophonic System (AREA)
- Time-Division Multiplex Systems (AREA)
- Auxiliary Devices For Music (AREA)
- Error Detection And Correction (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
新規な制御技術が適用されうるフレーム損失コンシールメント技術の第1のステップは、過去に受信された信号の一部の正弦波分析(sinusoidal analysis)を含む。この正弦波分析の目的は、その信号の主正弦波の周波数を特定することである。これは、限定された数の個別の正弦波から信号が構成されていること、すなわち信号が以下に示す種類のマルチ正弦波信号であることが、基本的な前提となっている。
であり、これは、真の正弦波周波数fkの近似であるとみなすことができる。真の正弦波周波数fkは、区間
の中にあると想定できる。
を通してパラボラフィッティングを行う。その結果、次式により定義される放物線の放物線係数bk(0)、bk(1)、bk(2)が得られる。
のメインローブを近似する関数P(q)を、ピークを取り囲むDFT振幅スペクトルのグリッドポイントを通してフィッティングし、関数最大値に属する各々の周波数を計算することである。関数P(q)は、窓関数の周波数シフト振幅スペクトル
と同一でありうる。しかし、数値的に単純にするために、これを関数最大値の容易な計算を可能にする多項式にすべきである。以下に詳細に説明される手順を適用できる。
のフィッティングを行う。従って、
|X(mk−1)|が|X(mk+1)|より大きい場合、ポイント
を通して
のフィッティングを行い、そうでない場合、ポイント
を通して
のフィッティングを行う。簡単にするため、P(q)を2次又は4次のいずれかの多項式として選択できる。これにより、ステップ2の近似は単純な線形回帰計算及び
の簡単な計算となる。区間(q1、q2)は、すべてのピークに対して一定かつ同一になるように選択でき、例えば(q1、q2)=(−1,1)であるか、又は適応的である。適応的方式の場合、関数
が関連するDFTグリッドポイント{P1;P2}の範囲内で窓関数スペクトルのメインローブのフィッティングを行うように、区間を選択できる。このフィッティング処理は図9に示される。
によって基本周波数と関連する信号の周期に対応する。
として定義されうる。対応する推定正弦波周波数
を有するピークが存在する場合、f^kをf^k=j・f0と置換する。
を置換することなく、高調波周波数の周囲の近傍に存在するDFTピークの数、すなわちf0,pの整数倍数をカウントしつつ、手順のステップ2を適用する。高調波周波数に又はその周囲に最大数のピークが取得される基本周波数f0,pmaxを特定する。このピークの最大数が所定の閾値を超えた場合、信号は高調波であると想定される。その場合、f0,pmaxは、ステップ2の実行に際して使用され、その結果、改善された正弦波周波数f^kをもたらす基本周波数であると想定できる。しかし、これに代わる更に好適な方法は、まず、高調波周波数と一致することがわかっているピーク周波数f^kに基づいて基本周波数f0を最適化することである。M個の高調波より成る集合、すなわち、周波数f^k(m), m = 1…MでM個のスペクトルピークの何らかの集合と一致することがわかっている何らかの基本周波数の整数倍数{n1…nM}を想定すると、基礎を成す(最適化)基本周波数f0,optは、高調波周波数とスペクトルピーク周波数との誤差を最小限にするように計算できる。最小にすべき誤差が平均2乗誤差
である場合、最適基本周波数は、
として計算される。候補値の初期集合{f0,1…f0,P}は、DFTピークの周波数又は推定正弦波周波数
から取得できる。
推定正弦波周波数
の正確度を改善する更なる可能性は、その時間発展(temporal evolution)を考慮することである。その目的のために、複数の分析フレームからの正弦波周波数の推定値を例えば平均化又は予測によって組み合わせることができる。平均化又は予測に先立って、各推定スペクトルピークを同一の基調となる各正弦波に結び付けるピーク追跡を適用することができる。
以下、フレーム損失コンシールメント演算を実行するための正弦波モデルの適用について説明する。
を示し、mmin,k及びmmax,kは、区間が互いに重なり合わないようにするという先に説明した制約に適合する。mmin,k及びmmax,kの適切な選択は、それらの値を小さな整数値δ、例えばδ=3に設定することである。しかし、2つの隣接する正弦波周波数fk及びfk+1に関連するDFTインデックスが2δより小さい場合、区間が重なり合わないことが保証されるように、δは、
に設定される。関数floor(・)は、それ以下である関数引数に最も近い整数である。
だけ進んでいることを意味する。従って、発展させた正弦波モデルのDFTスペクトルは次式により表される。
だけシフトされる間、振幅スペクトルは不変のままであることがわかる。従って、各正弦波の近傍のプロトタイプフレームの周波数スペクトル係数は、正弦波周波数fkと、損失オーディオフレームとプロトタイプフレームn-1との間の時間差とに比例してシフトされる。
に従った位相シフトは定義されない。本実施形態による適切な選択肢は、それらのインデックスに対して位相をランダム化することであり、その結果、Z(m)=Y(m)・ej2πrand(・)となる。ここで、関数rand(・)は何らかの乱数を返す。
上述した方法は、オーディオ信号の特性は、短時間の間では、過去に受信され再構成された信号フレーム及び損失フレームから大きく変化することはないという仮定に基づいている。この場合、過去に再構成されたフレームの振幅スペクトルを保持し、過去に再構成された信号において検出された正弦波主成分の位相を発展させる(evolve)ことは、非常に良い選択である。しかし、例えば急激なエネルギ変化や急激なスペクトル変化を伴う過渡状態が存在する場合には、この仮定は誤りとなりうる。
を計算することにより実行される。比Rl/rが閾値(例えば、10)を超えた場合、急激なエネルギ減少(立ち下がり)による不連続性を検出できる(115)。同様に、比Rl/rが他の閾値(例えば、0.1)を下回った場合、急激なエネルギ増加(立ち上がり)による不連続性を検出できる(117)。
に設定することは可能であるが、これは、過渡状態が依然として聞こえの効果に重大な影響を及ぼす低い周波数に対応するように選択されるのが好ましい。
実行された上記のステップがフレーム損失コンシールメント演算の適応化を示唆する状態を示す場合、代替フレームのスペクトルの計算が修正される。
によって修正される。これにより、代替フレームは次のように修正計算される。
m∈Ik,k=1…Kとして、
によって実行される(127)。所定のmに対して、そのような位相修正が使用される場合、減衰率β(m)は更に減少される。位相修正の程度まで考慮に入れられるのが好ましい。位相修正が適度に実行されるだけの場合、β(m)はわずかにスケールダウンされるのみであるが、位相修正が強力である場合、β(m)は更に大幅にスケールダウンされる。
に従って代替フレームスペクトルを計算するコンシールメント方法の要素を修正するように構成される。検出は、検出器ユニット146により実行可能であり、修正は、図14に示されるような修正器ユニット148により実行可能である。
Claims (31)
- 受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する方法であって、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出するステップ(101,122)と、
前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正するステップ(102,125)と、
観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出するステップ(101,121)と、
前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正するステップ(102,123,127)と、
を有することを特徴とする方法。 - 前記当初のコンシールメント方法は、
過去に受信され再構成されたオーディオ信号から、プロトタイプフレームとして用いられるセグメントを抽出するステップと、
正弦波モデルを前記プロトタイプフレームに適用して前記正弦波モデルの正弦波周波数を取得するステップと、
得られた正弦波を時間発展させて前記代替フレームを生成するステップと、
を含むことを特徴とする請求項1に記載の方法。 - 前記時間発展は、前記得られた正弦波(k)に関するスペクトル係数の位相をθkだけ進めることを含み、
前記代替フレームスペクトルの計算は、Y(m)を前記プロトタイプフレームの周波数領域表現とすると、式Z(m)=Y(m)・ejθ kに従って実行されることを特徴とする請求項2に記載の方法。 - 前記過渡状態は、検出された立ち下がりを含むことを特徴とする請求項1乃至3のいずれか1項に記載の方法。
- 前記過渡状態の検出が周波数領域で実行されることを特徴とする請求項1乃至4のいずれか1項に記載の方法。
- 前記過渡状態の検出は、周波数帯域に基づいて周波数選択的に実行されることを特徴とする請求項5に記載の方法。
- 周波数帯域幅は人間の聴覚の臨界帯域の大きさに従うことを特徴とする請求項6に記載の方法。
- 前記代替フレームスペクトルの前記スペクトル振幅の選択的な調整は、前記周波数帯域において検出された前記過渡状態に応じて周波数帯域選択的に行われることを特徴とする請求項6又は7に記載の方法。
- 前記第2の状態は、数個の連続するフレーム損失が発生したことであることを特徴とする請求項1乃至8のいずれか1項に記載の方法。
- 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、程度が徐々に増加する減衰を行うことにより調整されることを特徴とする請求項9に記載の方法。
- 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、第1の減衰率を徐々に増加させることにより調整されることを特徴とする請求項9又は10に記載の方法。
- 前記過渡状態が検出されたことに応じて第2の減衰率が設定され、前記第1の減衰率と前記第2の減衰率との積により全減衰量が制御されることを特徴とする請求項11に記載の方法。
- 前記代替フレームスペクトルの前記位相の調整は、位相スペクトルのランダム化又はディザリングを含むことを特徴とする請求項1に記載の方法。
- 前記位相スペクトルは、前記ディザリングを、徐々に程度を増加させながら実行することにより調整されることを特徴とする請求項13に記載の方法。
- 請求項1乃至14のうちいずれか1項に記載の方法を実行する手段を備えることを特徴とする装置。
- 装置であって、
プロセッサ(154)と、
命令(155)を記憶するメモリ(156)と、
を備え、前記命令(155)は、前記プロセッサにより実行されたとき、前記装置に、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出させ、
前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正させ、
観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出させ、
前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正させる
ことを特徴とする装置。 - 前記当初のコンシールメント方法を用いて前記代替フレームを生成するとき、前記装置は、
過去に受信され再構成されたオーディオ信号から、プロトタイプフレームとして用いられるセグメントを抽出し、
正弦波モデルを前記プロトタイプフレームに適用して前記正弦波モデルの正弦波周波数を取得し、
得られた正弦波を時間発展させて前記代替フレームを生成する、
ように動作することを特徴とする請求項16に記載の装置。 - 前記時間発展は、前記得られた正弦波(k)に関するスペクトル係数の位相をθkだけ進めることを含み、
前記代替フレームスペクトルの計算は、Y(m)を前記プロトタイプフレームの周波数領域表現とすると、式Z(m)=Y(m)・ejθ kに従って実行されることを特徴とする請求項17に記載の装置。 - 前記過渡状態の検出を行う過渡検出器を更に有することを特徴とする請求項16乃至18のいずれか1項に記載の装置。
- 前記過渡検出器は、周波数領域で前記過渡状態の検出を実行することを特徴とする請求項19に記載の装置。
- 前記過渡検出器は、周波数帯域に基づく周波数選択的な前記過渡状態の検出を実行することを特徴とする請求項20に記載の装置。
- 前記代替フレームスペクトルの前記スペクトル振幅の選択的な調整は、前記周波数帯域において検出された前記過渡状態に応じて周波数帯域選択的に行われることを特徴とする請求項21に記載の装置。
- 前記第2の状態は、数個の連続するフレーム損失が発生したことであることを特徴とする請求項16乃至22のいずれか1項に記載の装置。
- 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、程度が徐々に増加する減衰を行うことにより調整されることを特徴とする請求項23に記載の装置。
- 前記スペクトル振幅は、数個の連続するフレーム損失の検出に応じて、第1の減衰率を徐々に増加させることにより調整されることを特徴とする請求項23又は24に記載の装置。
- 前記過渡状態が検出されたことに応じて第2の減衰率が設定され、前記第1の減衰率と前記第2の減衰率との積により全減衰量が制御されることを特徴とする請求項25に記載の装置。
- 前記代替フレームスペクトルの前記位相の調整は、位相スペクトルのランダム化又はディザリングを含むことを特徴とする請求項16に記載の装置。
- 前記装置は移動体装置のデコーダであることを特徴とする請求項15又は16に記載の装置。
- コンピュータ読み取り可能なコードユニットを含むコンピュータプログラム(155)であって、装置で実行されると、前記装置に、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出させ(101)、
前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正させ(102)、
観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出させ、
前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正させる
ことを特徴とするコンピュータプログラム。 - 符号化オーディオ信号を受信する入力ユニット(132)と、
損失オーディオフレームのコンシールメントを行う論理フレーム損失コンシールメントユニット(134)と、
過去に受信され再構成されたオーディオ信号の特性における、代替フレームを生成するために当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた過渡状態を検出し、前記過渡状態が検出された場合、代替フレームスペクトルのスペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を修正し、観測されたフレーム損失の統計的特性における、前記代替フレームを生成するために前記当初のコンシールメント方法を使用した場合には再構成品質が不十分となりうるものとして予め定められた第2の状態を更に検出し、前記第2の状態が検出された場合、前記代替フレームスペクトルの位相及び前記スペクトル振幅を選択的に調整することにより前記当初のコンシールメント方法を更に修正するコントローラ(136)と、
を有することを特徴とするデコーダ(130)。 - 前記コントローラ(136)は、前記過去に受信され再構成されたオーディオ信号の特性又は前記観測されたフレーム損失の前記統計的特性における状態の前記検出を実行する検出器ユニット(146)と、前記コンシールメント方法の前記修正を実行する修正器ユニット(148)とを含むことを特徴とする請求項30に記載のデコーダ。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361761051P | 2013-02-05 | 2013-02-05 | |
US201361760814P | 2013-02-05 | 2013-02-05 | |
US201361760822P | 2013-02-05 | 2013-02-05 | |
US61/760,822 | 2013-02-05 | ||
US61/761,051 | 2013-02-05 | ||
US61/760,814 | 2013-02-05 | ||
PCT/SE2014/050068 WO2014123471A1 (en) | 2013-02-05 | 2014-01-22 | Method and apparatus for controlling audio frame loss concealment |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016251224A Division JP6440674B2 (ja) | 2013-02-05 | 2016-12-26 | オーディオフレーム損失のコンシールメントを制御する方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016510432A JP2016510432A (ja) | 2016-04-07 |
JP6069526B2 true JP6069526B2 (ja) | 2017-02-01 |
Family
ID=50114514
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015555964A Active JP6069526B2 (ja) | 2013-02-05 | 2014-01-22 | オーディオフレーム損失のコンシールメントを制御する方法及び装置 |
JP2016251224A Active JP6440674B2 (ja) | 2013-02-05 | 2016-12-26 | オーディオフレーム損失のコンシールメントを制御する方法及び装置 |
JP2018217479A Active JP6698792B2 (ja) | 2013-02-05 | 2018-11-20 | オーディオフレーム損失のコンシールメントを制御する方法及び装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016251224A Active JP6440674B2 (ja) | 2013-02-05 | 2016-12-26 | オーディオフレーム損失のコンシールメントを制御する方法及び装置 |
JP2018217479A Active JP6698792B2 (ja) | 2013-02-05 | 2018-11-20 | オーディオフレーム損失のコンシールメントを制御する方法及び装置 |
Country Status (21)
Country | Link |
---|---|
US (6) | US9293144B2 (ja) |
EP (5) | EP4322159A3 (ja) |
JP (3) | JP6069526B2 (ja) |
KR (4) | KR102349025B1 (ja) |
CN (3) | CN108831490B (ja) |
AU (5) | AU2014215734B2 (ja) |
BR (1) | BR112015018316B1 (ja) |
CA (2) | CA2978416C (ja) |
DK (2) | DK3125239T3 (ja) |
ES (4) | ES2603827T3 (ja) |
HK (2) | HK1210315A1 (ja) |
MX (3) | MX2020001307A (ja) |
MY (1) | MY170368A (ja) |
NZ (2) | NZ739387A (ja) |
PH (3) | PH12015501507B1 (ja) |
PL (2) | PL3561808T3 (ja) |
PT (2) | PT2954518T (ja) |
RU (3) | RU2728832C2 (ja) |
SG (3) | SG11201505231VA (ja) |
WO (1) | WO2014123471A1 (ja) |
ZA (1) | ZA201504881B (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3576087T3 (pl) | 2013-02-05 | 2021-10-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Ukrywanie klatki utraconej sygnału audio |
US9478221B2 (en) | 2013-02-05 | 2016-10-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced audio frame loss concealment |
NO2780522T3 (ja) * | 2014-05-15 | 2018-06-09 | ||
EP3664086B1 (en) | 2014-06-13 | 2021-08-11 | Telefonaktiebolaget LM Ericsson (publ) | Burst frame error handling |
US10373608B2 (en) | 2015-10-22 | 2019-08-06 | Texas Instruments Incorporated | Time-based frequency tuning of analog-to-information feature extraction |
ES2870959T3 (es) * | 2016-03-07 | 2021-10-28 | Fraunhofer Ges Forschung | Unidad de ocultación de error, decodificador de audio y método relacionado y programa informático que usa características de una representación decodificada de una trama de audio decodificada apropiadamente |
CN109313905B (zh) * | 2016-03-07 | 2023-05-23 | 弗劳恩霍夫应用研究促进协会 | 隐藏音频帧丢失的错误隐藏单元、音频解码器及相关方法 |
BR112018067944B1 (pt) * | 2016-03-07 | 2024-03-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema |
CN108922551B (zh) * | 2017-05-16 | 2021-02-05 | 博通集成电路(上海)股份有限公司 | 用于补偿丢失帧的电路及方法 |
US20190074805A1 (en) * | 2017-09-07 | 2019-03-07 | Cirrus Logic International Semiconductor Ltd. | Transient Detection for Speaker Distortion Reduction |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483878A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2020126120A1 (en) | 2018-12-20 | 2020-06-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for controlling multichannel audio frame loss concealment |
CN111402904B (zh) * | 2018-12-28 | 2023-12-01 | 南京中感微电子有限公司 | 音频数据恢复方法、装置及蓝牙设备 |
CN109887515B (zh) * | 2019-01-29 | 2021-07-09 | 北京市商汤科技开发有限公司 | 音频处理方法及装置、电子设备和存储介质 |
CN113454713B (zh) * | 2019-02-21 | 2024-06-25 | 瑞典爱立信有限公司 | 相位ecu f0插值分割方法及相关控制器 |
AU2019437394A1 (en) * | 2019-03-25 | 2021-10-21 | Razer (Asia-Pacific) Pte. Ltd. | Method and apparatus for using incremental search sequence in audio error concealment |
WO2020249380A1 (en) * | 2019-06-13 | 2020-12-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Time reversed audio subframe error concealment |
CN111883173B (zh) * | 2020-03-20 | 2023-09-12 | 珠海市杰理科技股份有限公司 | 基于神经网络的音频丢包修复方法、设备和系统 |
EP4252227A1 (en) | 2020-11-26 | 2023-10-04 | Telefonaktiebolaget LM Ericsson (publ) | Noise suppression logic in error concealment unit using noise-to-signal ratio |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06130999A (ja) * | 1992-10-22 | 1994-05-13 | Oki Electric Ind Co Ltd | コード励振線形予測復号化装置 |
JP3617503B2 (ja) * | 1996-10-18 | 2005-02-09 | 三菱電機株式会社 | 音声復号化方法 |
EP0907258B1 (en) * | 1997-10-03 | 2007-01-03 | Matsushita Electric Industrial Co., Ltd. | Audio signal compression, speech signal compression and speech recognition |
JP3567750B2 (ja) * | 1998-08-10 | 2004-09-22 | 株式会社日立製作所 | 圧縮音声再生方法及び圧縮音声再生装置 |
US6975655B2 (en) * | 2000-04-07 | 2005-12-13 | Broadcom Corporation | Method of controlling data sampling clocking of asynchronous network nodes in a frame-based communications network |
US6996521B2 (en) * | 2000-10-04 | 2006-02-07 | The University Of Miami | Auxiliary channel masking in an audio signal |
JP2002229593A (ja) * | 2001-02-06 | 2002-08-16 | Matsushita Electric Ind Co Ltd | 音声信号復号化処理方法 |
KR100591350B1 (ko) * | 2001-03-06 | 2006-06-19 | 가부시키가이샤 엔.티.티.도코모 | 오디오 데이터 보간장치 및 방법, 오디오 데이터관련 정보작성장치 및 방법, 오디오 데이터 보간 정보 송신장치 및방법, 및 그 프로그램 및 기록 매체 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
JP4215448B2 (ja) * | 2002-04-19 | 2009-01-28 | 日本電気株式会社 | 音声復号装置及び音声復号方法 |
US20040122680A1 (en) * | 2002-12-18 | 2004-06-24 | Mcgowan James William | Method and apparatus for providing coder independent packet replacement |
US6985856B2 (en) | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
WO2004068098A1 (ja) * | 2003-01-30 | 2004-08-12 | Fujitsu Limited | 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
GB2416467B (en) * | 2003-05-14 | 2006-08-30 | Oki Electric Ind Co Ltd | Apparatus and method for concealing erased periodic signal data |
ATE486348T1 (de) * | 2003-06-30 | 2010-11-15 | Koninkl Philips Electronics Nv | Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch |
US7596488B2 (en) * | 2003-09-15 | 2009-09-29 | Microsoft Corporation | System and method for real-time jitter control and packet-loss concealment in an audio signal |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US7324937B2 (en) * | 2003-10-24 | 2008-01-29 | Broadcom Corporation | Method for packet loss and/or frame erasure concealment in a voice communication system |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
EP1722359B1 (en) * | 2004-03-05 | 2011-09-07 | Panasonic Corporation | Error conceal device and error conceal method |
WO2006009074A1 (ja) * | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
US7930184B2 (en) | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
US7734381B2 (en) * | 2004-12-13 | 2010-06-08 | Innovive, Inc. | Controller for regulating airflow in rodent containment system |
KR101203348B1 (ko) * | 2005-01-31 | 2012-11-20 | 스카이프 | 가중 오버랩 애드 방법 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
US7457746B2 (en) * | 2006-03-20 | 2008-11-25 | Mindspeed Technologies, Inc. | Pitch prediction for packet loss concealment |
US8358704B2 (en) * | 2006-04-04 | 2013-01-22 | Qualcomm Incorporated | Frame level multimedia decoding with frame information table |
WO2008022200A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Re-phasing of decoder states after packet loss |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
FR2907586A1 (fr) | 2006-10-20 | 2008-04-25 | France Telecom | Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch. |
KR100957711B1 (ko) | 2006-10-25 | 2010-05-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 서브밴드 값을 생성하는 장치 및 방법과 시간 영역 오디오 샘플을 생성하는 장치 및 방법 |
US7991612B2 (en) * | 2006-11-09 | 2011-08-02 | Sony Computer Entertainment Inc. | Low complexity no delay reconstruction of missing packets for LPC decoder |
BRPI0721490A2 (pt) | 2006-11-10 | 2014-07-01 | Panasonic Corp | Dispositivo de decodificação de parâmetro, dispositivo de codificação de parâmetro e método de decodificação de parâmetro. |
RU2459283C2 (ru) * | 2007-03-02 | 2012-08-20 | Панасоник Корпорэйшн | Кодирующее устройство, декодирующее устройство и способ |
US20090198500A1 (en) * | 2007-08-24 | 2009-08-06 | Qualcomm Incorporated | Temporal masking in audio coding based on spectral dynamics in frequency sub-bands |
CN100550712C (zh) * | 2007-11-05 | 2009-10-14 | 华为技术有限公司 | 一种信号处理方法和处理装置 |
CN101207665B (zh) * | 2007-11-05 | 2010-12-08 | 华为技术有限公司 | 一种衰减因子的获取方法 |
CN101261833B (zh) * | 2008-01-24 | 2011-04-27 | 清华大学 | 一种使用正弦模型进行音频错误隐藏处理的方法 |
CN101308660B (zh) * | 2008-07-07 | 2011-07-20 | 浙江大学 | 一种音频压缩流的解码端错误恢复方法 |
CN102222505B (zh) | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
WO2012158159A1 (en) | 2011-05-16 | 2012-11-22 | Google Inc. | Packet loss concealment for audio codec |
-
2014
- 2014-01-22 PT PT147049357T patent/PT2954518T/pt unknown
- 2014-01-22 RU RU2017124644A patent/RU2728832C2/ru active
- 2014-01-22 EP EP23202489.3A patent/EP4322159A3/en active Pending
- 2014-01-22 SG SG11201505231VA patent/SG11201505231VA/en unknown
- 2014-01-22 US US14/422,249 patent/US9293144B2/en not_active Expired - Fee Related
- 2014-01-22 EP EP16183917.0A patent/EP3125239B1/en active Active
- 2014-01-22 RU RU2015137708A patent/RU2628144C2/ru active
- 2014-01-22 CN CN201810694625.0A patent/CN108831490B/zh active Active
- 2014-01-22 CA CA2978416A patent/CA2978416C/en active Active
- 2014-01-22 CN CN201810694623.1A patent/CN108899038B/zh active Active
- 2014-01-22 ES ES14704935.7T patent/ES2603827T3/es active Active
- 2014-01-22 ES ES21162222T patent/ES2964807T3/es active Active
- 2014-01-22 CN CN201480007552.3A patent/CN104969290B/zh active Active
- 2014-01-22 MX MX2020001307A patent/MX2020001307A/es unknown
- 2014-01-22 WO PCT/SE2014/050068 patent/WO2014123471A1/en active Application Filing
- 2014-01-22 KR KR1020217009851A patent/KR102349025B1/ko active IP Right Grant
- 2014-01-22 MY MYPI2015702413A patent/MY170368A/en unknown
- 2014-01-22 KR KR1020207013012A patent/KR102238376B1/ko active IP Right Grant
- 2014-01-22 DK DK16183917.0T patent/DK3125239T3/da active
- 2014-01-22 PL PL19178384T patent/PL3561808T3/pl unknown
- 2014-01-22 BR BR112015018316-6A patent/BR112015018316B1/pt active IP Right Grant
- 2014-01-22 EP EP14704935.7A patent/EP2954518B1/en active Active
- 2014-01-22 MX MX2021000353A patent/MX2021000353A/es unknown
- 2014-01-22 SG SG10201700846UA patent/SG10201700846UA/en unknown
- 2014-01-22 EP EP21162222.0A patent/EP3855430B1/en active Active
- 2014-01-22 NZ NZ739387A patent/NZ739387A/en unknown
- 2014-01-22 JP JP2015555964A patent/JP6069526B2/ja active Active
- 2014-01-22 EP EP19178384.4A patent/EP3561808B1/en active Active
- 2014-01-22 SG SG10202106262SA patent/SG10202106262SA/en unknown
- 2014-01-22 DK DK19178384.4T patent/DK3561808T3/da active
- 2014-01-22 KR KR1020167009636A patent/KR102110212B1/ko active IP Right Grant
- 2014-01-22 PL PL16183917T patent/PL3125239T3/pl unknown
- 2014-01-22 CA CA2900354A patent/CA2900354C/en active Active
- 2014-01-22 PT PT16183917T patent/PT3125239T/pt unknown
- 2014-01-22 ES ES19178384T patent/ES2881510T3/es active Active
- 2014-01-22 ES ES16183917T patent/ES2750783T3/es active Active
- 2014-01-22 NZ NZ710308A patent/NZ710308A/en unknown
- 2014-01-22 MX MX2015009210A patent/MX344550B/es active IP Right Grant
- 2014-01-22 AU AU2014215734A patent/AU2014215734B2/en active Active
- 2014-01-22 KR KR1020157024184A patent/KR20150108937A/ko not_active Application Discontinuation
-
2015
- 2015-07-02 PH PH12015501507A patent/PH12015501507B1/en unknown
- 2015-07-07 ZA ZA2015/04881A patent/ZA201504881B/en unknown
- 2015-11-03 HK HK15110858.3A patent/HK1210315A1/xx unknown
-
2016
- 2016-02-03 US US15/014,563 patent/US9721574B2/en active Active
- 2016-09-07 AU AU2016225836A patent/AU2016225836B2/en active Active
- 2016-12-26 JP JP2016251224A patent/JP6440674B2/ja active Active
-
2017
- 2017-06-23 US US15/630,994 patent/US10332528B2/en active Active
-
2018
- 2018-01-09 PH PH12018500083A patent/PH12018500083B1/en unknown
- 2018-03-20 PH PH12018500600A patent/PH12018500600B1/en unknown
- 2018-05-16 AU AU2018203449A patent/AU2018203449B2/en active Active
- 2018-11-20 JP JP2018217479A patent/JP6698792B2/ja active Active
-
2019
- 2019-01-11 HK HK19100479.9A patent/HK1258094A1/zh unknown
- 2019-05-09 US US16/407,307 patent/US10559314B2/en active Active
- 2019-12-19 US US16/721,206 patent/US11437047B2/en active Active
-
2020
- 2020-01-28 AU AU2020200577A patent/AU2020200577B2/en active Active
- 2020-07-09 RU RU2020122689A patent/RU2020122689A/ru unknown
-
2021
- 2021-08-04 AU AU2021212049A patent/AU2021212049B2/en active Active
-
2022
- 2022-07-29 US US17/876,848 patent/US20220375480A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6440674B2 (ja) | オーディオフレーム損失のコンシールメントを制御する方法及び装置 | |
US20210350811A1 (en) | Burst frame error handling | |
JP2023166423A (ja) | Mdct係数からのスペクトル形状予測 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6069526 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |