KR101592968B1 - 수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법 - Google Patents
수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법 Download PDFInfo
- Publication number
- KR101592968B1 KR101592968B1 KR1020117002983A KR20117002983A KR101592968B1 KR 101592968 B1 KR101592968 B1 KR 101592968B1 KR 1020117002983 A KR1020117002983 A KR 1020117002983A KR 20117002983 A KR20117002983 A KR 20117002983A KR 101592968 B1 KR101592968 B1 KR 101592968B1
- Authority
- KR
- South Korea
- Prior art keywords
- filter
- quantization
- quantized
- lpc
- frame
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 238000013139 quantization Methods 0.000 claims abstract description 447
- 101000959200 Lytechinus pictus Actin, cytoskeletal 2 Proteins 0.000 claims description 143
- 101000797296 Lytechinus pictus Actin, cytoskeletal 3 Proteins 0.000 claims description 58
- 102100040006 Annexin A1 Human genes 0.000 claims description 56
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 claims description 56
- 101000929342 Lytechinus pictus Actin, cytoskeletal 1 Proteins 0.000 claims description 56
- 230000008569 process Effects 0.000 claims description 14
- 101000799321 Lytechinus pictus Actin, cytoskeletal 4 Proteins 0.000 claims 72
- 239000013598 vector Substances 0.000 description 146
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000005284 excitation Effects 0.000 description 6
- 238000013213 extrapolation Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 장치 및 방법이 개시된다. 상기 LPC 필터 양자화 장치 및 방법은, 절대 양자화를 이용하여 상기 LPC 필터들 중 하나를 처음으로 양자화하기 위한 수단; 및 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 다른 LPC 필터들을 양자화하기 위한 수단을 포함한다. 역 양자화를 위하여, 적어도 상기 처음으로 양자화된 LPC 필터가 수신되고, 역 양자화기는 절대 역 양자화를 이용하여 상기 처음으로 양자화된 LPC 필터를 역 양자화한다. 만약 상기 처음으로 양자화된 LPC 필터가 아닌 임의의 양자화된 LPC 필터가 수신되면, 역 양자화기는 적어도 하나의 이전에 수신된 양자화된 LPC 필터와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 이 양자화된 LPC 필터를 역 양자화한다.
Description
본 발명은, 예를 들면 오디오 신호(audio signal)와 같은, 음향 신호(sound signal)의 코딩 및 디코딩에 관한 것이다. 보다 구체적으로, 본 발명은 예를 들면 수퍼-프레임의 LPC(Linear Predication Coefficients) 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법에 관한 것이다.
화상 회의, 멀티미디어 및 무선 통신과 같은 다양한 응용 분야에서, 주관적 품질과 비트 레이트(bit rate) 간의 적절한 트레이드 오프(trade-off)를 갖는 효율적인 디지털 음성 및 오디오(digital speech and audio) 코딩 기법에 대한 요구가 증가하고 있다.
음성 코더는 음성 신호를 통신 채널을 통해 전송되거나 저장 매체에 저장되는 디지털 비트 스트림으로 변환한다. 코딩되는 음성 신호는 디지털화되는데, 다시 말해서, 예를 들면 샘플링되고 샘플당 16 비트를 이용하여 양자화된다. 음성 코더의 도전 과제는 적절한 주관적 음성 품질을 유지하면서도 보다 적은 수의 비트를 이용하여 디지털 샘플들을 표현하는 것이다. 음성 디코더 또는 합성기는 전송된 또는 저장된 비트 스트림을 음향 신호로 변환한다.
CELP(Code-Excited Linear Prediction) 코딩은 주관적 품질과 비트 레이트 간의 적절한 타협을 이루기 위한 가장 뛰어난 기법들 중 하나이다. CELP 코딩 기법은 무선 및 유선 응용 양쪽에서 여러 음성 코딩 표준들에 대한 기준이다. CELP 코딩에서, 음성 신호는 샘플화되고, 보통 프레임(frames)으로 불리는 L개 샘플들의 연속적인 블록들에서 처리되는데, 여기서 L은 일반적으로 10-30 ms의 음성에 대응하는 샘플들의 미리 결정된 숫자이다. LP(Linear Prediction) 필터는 매 프레임마다 계산되고 전송된다. LP 필터는 또한 LPC(Linear Prediction Coefficients) 필터로도 알려져 있다. LPC 필터의 계산은 일반적으로 룩어헤드(lookahead), 예를 들면 후속 프레임으로부터의 5-15 ms의 음성 세그먼트를 이용한다. L-샘플 프레임은 서브프레임(subframes)으로 불리는 보다 작은 블록들로 나누어진다. 각 서브프레임에서, 보통 두 개의 컴포넌트, 즉 이전 여기(past excitation) 및 획기적인, 고정 코드북 여기(fixed-codebook excitation)로부터 여기 신호(excitation signal)가 획득된다. 이전 여기는 종종 적응적 코드북(adaptive-codebook) 또는 피치 코드북(picth-codebook) 여기로서 참조된다. 여기 신호를 특징화하는 파라메터들은 코딩되고 디코더로 전송되는데, 디코더에서 여기 신호는 재생되고(reconstructed) LPC 필터의 입력으로 이용된다.
멀티미디어 스트리밍 및 방송과 같은 응용에서, 음성, 음악 및 혼합 컨텐트를 낮은 비트 레이트로 인코딩할 것이 요구될 수 있다. 그러한 목적을 위하여, 음성 신호들에 대하여 최적화된 CELP 코딩을 오디오 신호들에 대하여 최적화된 변환 코딩과 결합한 인코딩 모델들이 개발되어 왔다. 그러한 모델들의 예가 AMR-WB+ [1]인데, AMR-WB+은 CELP와 TCX(Transform Coded eXcitation) 사이에서 전환된다. 음악 및 혼합 컨텐트의 품질을 개선하기 위하여, 롱 딜레이(long delay)가 사용되어 변환 영역(transform domain)에서 높은 품질의 주파수 해상도를 가능하게 한다. AMR-WB+에서는, 4개의 CELP 프레임(일반적으로 80 ms)으로 구성되는 소위 수퍼-프레임(super-frame)이 사용된다.
AMR-WB+에서 CELP 코딩 파라메터들은 매 4 프레임마다 한 번씩 전송되지만, LPC 필터의 양자화는 각 프레임마다 별도로 수행된다. 또한, LPC 필터는 CELP 프레임의 경우에 프레임당 고정된 수의 비트로 양자화된다.
[1] 3GPP Technical Specification TS 26.290, "Audio Codec Processing Functions; Extended Adaptive Multi-Rate - Wideband (AMR- WB+) Codec; Transcoding Functions," June 2005.
[2] J. Skoglund, J. Linden, "Predictive VQ for Noisy Channel Spectrum Coding: AR Or MA?," IEEE 1997 International Conference on Acoustics, Speech, and Signal Processing (ICASSP'97), pp. 1351-1354, Munich, Germany, April 21-24, 1997.
[3] H. Zarrinkoub, P. Mermelstein, "Switched Prediction and Quantization of LSP Frequencies," IEEE 1996 International Conference on Acoustics, Speech, and Signal Processing (ICASSP'96), Vol. 2, pp.757-760, 7-10 May 1996.
[4] A. V. McCree, "Method for Switched-Predictive Quantization," US Patent No. 6,122,608.
[5] R. Laroia, N. Phamdo, and N. Farvardin, "Robust and Efficient Quantization of Speech LSP Parameters Using Structured Vector Quantizers," IEEE Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP' 1991), pp. 641-644, Washington, DC, April 14-17, 1991.
[6] M. Xie and J. -P. Adoul, "Embedded Algebraic Vector Quantization (EAVQ) with Application to Wideband Audio Coding," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Atlanta, GA, U.S.A, Vol. 1, pp. 240-243, 1996.
[7] P. Rault, C. Guillemot, "Indexing Algorithm for Zn, An, Dn and Dn++ Lattice Vector Quantizers, IEEE Transactions on Multimedia, Vol. 3, No. 4, December 2001.
[8] J.H. Conway and N.J.A. Sloane, "A Fast Encoding Method for Lattice Codes and Quantizers," IEEE Trans. Inform. Theory, Vol. IT-29, No. 6, pp. 820-824, Nov. 1983.
전술한 문제점을 극복하기 위하여, LPC 필터들의 양자화에 관련되는 비트들의 숫자를 줄이기 위해 수퍼-프레임 구조를 활용하는 LPC 필터들의 가변 비트 레이트 양자화를 이용하는 기법이 필요하다. 또한, 그러한 기법은 MPEG에서 개발되고 있는 USAC 및 AMR-WB+[1]와 같은 멀티-모드 구조 및 수퍼-프레임 양쪽을 사용하는 음성 또는 오디오 코딩 모델들과도 관련될 것이다.
본 발명의 제1측면에 따르면, 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 방법이 제공되며, 상기 LPC 필터 양자화 방법은 절대 양자화를 이용하여 상기 LPC 필터들 중 하나를 처음으로 양자화하는 단계; 및 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 다른 LPC 필터들을 양자화하는 단계를 포함한다.
본 발명의 제2측면에 따르면, 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 장치가 제공되며, 상기 LPC 필터 양자화 장치는 절대 양자화를 이용하여 상기 LPC 필터들 중 하나를 처음으로 양자화하기 위한 수단; 및 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 다른 LPC 필터들을 양자화하기 위한 수단을 포함한다.
본 발명의 제3측면에 따르면, 각각 LPC 필터와 관련되는 프레임들의 시퀀스를 포함하는 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하기 위한 방법이 제공되며, 상기 LPC 필터들 중 하나는 절대 양자화를 이용하여 양자화되고 다른 LPC 필터들은 그 후 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 프로세스를 이용하여 양자화되고, 상기 적어도 하나의 LPC 필터를 역 양자화하는 방법은 적어도 상기 처음으로 양자화된 LPC 필터를 수신하는 단계; 절대 역 양자화를 이용하여 상기 처음으로 양자화된 LPC 필터를 역 양자화하는 단계; 및 만약 상기 처음으로 양자화된 LPC 필터가 아닌 임의의 양자화된 LPC 필터가 수신되면, 적어도 하나의 이전에 수신된 양자화된 LPC 필터와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 양자화된 LPC 필터를 역 양자화하는 단계를 포함한다.
본 발명의 제4측면에 따르면, 각각 LPC 필터와 관련되는 프레임들의 시퀀스를 포함하는 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하기 위한 장치가 제공되며, 상기 LPC 필터들 중 하나는 절대 양자화를 이용하여 양자화되고 다른 LPC 필터들은 그 후 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 프로세스를 이용하여 양자화되고, 상기 적어도 하나의 LPC 필터를 역 양자화하는 장치는 적어도 상기 처음으로 양자화된 LPC 필터를 수신하기 위한 수단; 절대 역 양자화를 이용하여 상기 처음으로 양자화된 LPC 필터를 역 양자화하기 위한 수단; 및 만약 상기 처음으로 양자화된 LPC 필터가 아닌 임의의 양자화된 LPC 필터가 수신되면, 적어도 하나의 이전에 수신된 양자화된 LPC 필터와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 양자화된 LPC 필터를 역 양자화하기 위한 수단을 포함한다.
본 발명의 전술한, 그리고 다른 목적들, 장점들 및 특성들은, 오직 수반하는 도면들에 대한 참조를 이용한 예시의 방법에 의해 주어지는, 그것의 예시적인 실시예들의 비한정적인 이하의 기술에 대한 이해에 의해 보다 분명해 질 것이다.
본 발명에 의하면, LPC 필터들의 양자화에 관련되는 비트들의 숫자를 줄이기 위한 LPC 필터들의 가변 비트 레이트 양자화를 이용하는 기법이 제공되는 장점이 있다.
도 1은 절대 및 멀티-레퍼런스 차분 LPC 필터 양자화기 및 양자화 방법을 도시하는 블록도.
도 2는 개방 루프 양자화 방법을 도시한 도면.
도 3은 4개의 LPC 필터들이 이용되고 수퍼-프레임에서 전송되는 구성에서 전송될 LPC 필터들을 결정하기 위한 장치 및 방법을 도시하는 흐름도.
도 4a는 LPC 기반 코덱에서 프레임(또는 수퍼-프레임) 당 하나의 LPC 필터가 추정될 때의 일반적인 LPC 분석 윈도우 및 일반적인 LPC 분석 중앙 위치를 나타낸 도면으로서, 여기서 LPC0은 이전 프레임(또는 수퍼-프레임) 동안에 계산된 마지막 LPC 필터에 대응함.
도 4b는 LPC 기반 코덱에서 프레임(또는 수퍼-프레임) 당 4개의 LPC 필터가 C추정될 때의 일반적인 LPC 분석 윈도우를 나타낸 도면으로서, 여기서 LPC 분석 윈도우는 프레임 종단의 중앙에 위치함.
도 5는 아웃-오브-더-루프(out-of-the-loop) 양자화 방법의 예시를 도시하는 흐름도.
도 6은 가중 대수(weighted algebraic) LPC 양자화기 및 양자화 방법의 도식적 블록도.
도 7은 가중 대수 LPC 역 양자화기 및 역 양자화 방법의 도식적 블록도.
도 8은 양자화기 및 양자화 방법의 도식적 블록도.
도 9는 디코더 및 디코딩 방법의 도식적 블록도.
도 2는 개방 루프 양자화 방법을 도시한 도면.
도 3은 4개의 LPC 필터들이 이용되고 수퍼-프레임에서 전송되는 구성에서 전송될 LPC 필터들을 결정하기 위한 장치 및 방법을 도시하는 흐름도.
도 4a는 LPC 기반 코덱에서 프레임(또는 수퍼-프레임) 당 하나의 LPC 필터가 추정될 때의 일반적인 LPC 분석 윈도우 및 일반적인 LPC 분석 중앙 위치를 나타낸 도면으로서, 여기서 LPC0은 이전 프레임(또는 수퍼-프레임) 동안에 계산된 마지막 LPC 필터에 대응함.
도 4b는 LPC 기반 코덱에서 프레임(또는 수퍼-프레임) 당 4개의 LPC 필터가 C추정될 때의 일반적인 LPC 분석 윈도우를 나타낸 도면으로서, 여기서 LPC 분석 윈도우는 프레임 종단의 중앙에 위치함.
도 5는 아웃-오브-더-루프(out-of-the-loop) 양자화 방법의 예시를 도시하는 흐름도.
도 6은 가중 대수(weighted algebraic) LPC 양자화기 및 양자화 방법의 도식적 블록도.
도 7은 가중 대수 LPC 역 양자화기 및 역 양자화 방법의 도식적 블록도.
도 8은 양자화기 및 양자화 방법의 도식적 블록도.
도 9는 디코더 및 디코딩 방법의 도식적 블록도.
가능한
레퍼런스들의
선택을 이용하는
차분
양자화
여러 개의 가능한 레퍼런스들 중의 선택을 이용하는 차분 양자화가 이용된다. 보다 구체적으로, LPC 필터는 여러 개의 가능한 레퍼런스들과 관련되어 차분적으로 양자화된다.
연속적인 LPC 필터들은 특정 수준의 상관관계(correlation)를 나타내는 것으로 알려져 있다. 이 상관관계를 이용하기 위해서, LPC 양자화기들은 일반적으로 예측을 이용한다. LPC 필터를 직접적으로 나타내는 선형 예측 계수들(Linear Prediction Coefficients)의 벡터(LPC 벡터)를 양자화하는 대신에, 차분(또는 예측) 양자화기가 이 LPC 벡터의 예측된 값을 먼저 계산하고, 그 후, 원본 LPC 벡터와 예측된 LPC 벡터 간의 차분(보통 예측 잔여(prediction residual)로 불림)을 양자화한다.
예측은 보통 LPC 필터의 이전 값들에 기반한다. 두 가지 타입의 예측기들, 즉 이동 평균(moving average: MA)과 자기 회귀(auto-regressive: AR) 예측기가 흔히 이용된다. 양자화될 데이터의 L2-놈(L2-norm)(평균 제곱)을 감소시키는 데 있어서 보통 AR 예측기들이 MA 예측기들보다 효율적이지만, 전송 에러가 발생할 경우에 에러 전파가 덜 일어나기 때문에 때로는 후자가 유용하다[2].
예측 잔여의 L2-놈이 평균적으로 원본 LPC 벡터의 L2-놈(LPC 필터의 예측 가능성 수준에 의존하는 두 벡터 간의 비율)보다 낮기 때문에, 차분(또는 예측) 양자화기는 절대 양자화기와 같은 수준의 성능을 보다 낮은 비트 레이트로 이룰 수 있다.
평균적으로, 양자화될 데이터의 L2-놈을 감소시키는데 있어서 예측이 확실히 효율적이다. 그러나 이러한 행태는 일정하지 않으며, 변이적인 세그먼트들 동안 보다는 신호의 안정적인 세그먼트들 동안에 예측은 보다 더 효율적이다. LPC 필터들의 변화가 빠를 때, 예측은 심지어 증가된 L2-놈 값들로 이어질 수 있다. 두 개의 서로 다른 예측기들을 고려함으로써 약간의 성능 개선이 이루어질 수 있는데, 하나는 고도의 예측 세그먼트들을 위한 것이고 다른 하나는 그보다 낮은 예측 세그먼트들을 위한 것이다[3, 4]. 전술한 바와 같이, 이러한 기법은 오직 LPC 필터의 이전 값들만을 이용한다.
이러한 문제를 극복하기 위하여, 복수의 가능한 레퍼런스들 중에서 선택된 레퍼런스, 예를 들면 레퍼런스 필터와 관련된 LPC 필터를 차분적으로 양자화하는 방법이 제안된다. 가능한 레퍼런스 필터들은 이미 양자화된 이전의 또는 미래의 LPC 필터들(따라서 인코더에서처럼 디코더에서도 이용가능함), 또는 이미 양자화된 이전의 또는 미래의 LPC 필터들에 적용되는 다양한 외삽(extraploation) 또는 내삽(interpolation) 연산들의 결과들이다. 주어진 레이트에서 보다 낮은 왜곡을 제공하거나, 주어진 타겟 왜곡 레벨에 대하여 보다 낮은 비트 레이트를 제공하는 레퍼런스 필터가 선택된다.
도 1은 멀티-레퍼런스 LPC 필터 양자화 장치 및 방법을 도시하는 블록도이다. 선형 예측 계수들의 벡터에 의해 표현되는 주어진 LPC 필터(101)는 멀티-레퍼런스 LPC 필터 양자화 장치 및 방법에 입력된다. 입력 LPC 필터(101)는 복수의 가능한 레퍼런스들 1, 2, ..., n 중에서 선택된 레퍼런스에 대하여 차분적으로 양자화된다. 가능한 레퍼런스들은 다음을 포함한다.
- 이전 또는 미래에 양자화되는 LPC 필터들;
- 이전 또는 미래에 양자화되는 LPC 필터들에 적용되는 외삽 또는 내삽 연산들의 결과; 또는
- 인코더 및 디코더 양쪽에서 이용 가능한 임의의 양자화된 값
비한정적인 예시로서, 입력 LPC 필터(101)는 이전에 양자화된 LPC 필터, 그 다음에 양자화되는 LPC 필터, 또는 이전의 그리고 그 다음에 양자화되는 두 LPC 필터들의 평균값에 대하여 차분적으로 양자화될 수 있다. 레퍼런스는 또한 절대 양자화기를 이용하여 양자화되는 LPC 필터이거나, 이미 양자화된 LPC 필터들에 적용되는 내삽, 외삽 또는 예측(AR 또는 MA) 중 어떤 것의 결과일 수 있다.
연산들(102 및 1031, 1032, ... , 103n): 계속해서 도 1을 참조하면, 입력 LPC 필터(101)는 절대 양자화기(동작(102)) 및 차분 양자화기들(동작(1031, 1032, ... , 103n))에 공급된다. 절대 양자화기(동작(102))는 입력 LPC 필터(101)의 절대값(차분이 아님)을 양자화한다. 차분 양자화기들(동작(1031, 1032, ... , 103n))은 각각의 레퍼런스들 1, 2, ..., n에 대하여 입력 LPC 필터(101)를 차분적으로 양자화하도록 지정된다.
동작(104): 도 1의 멀티-레퍼런스 LPC 필터 양자화 장치 및 방법은 주어진 레이트에서 가장 낮은 왜곡 레벨을 제공하거나, 주어진 타겟 왜곡 레벨에 대하여 가장 낮은 비트 레이트를 제공하는 레퍼런스를 레퍼런스들 1, 2, ..., n 중에서 선택하기 위한 선택기를 포함한다. 보다 구체적으로, 선택기(동작(104))는 왜곡의 특정 타겟 레벨을 달성하기 위하여 비트 레이트를 최소화하거나, 주어진 비트 레이트에서 생성되는 왜곡의 레벨을 최소화하는 선택 기준을 이용한다.
동작(104)에서, 레퍼런스들 1, 2, ..., n 중 차분 양자화 프로세스에서 이용될 레퍼런스를 선택하는 것은 폐쇄 루프 또는 개방 루프에서 수행될 수 있다.
폐쇄 루프에서는, 모든 가능한 레퍼런스들이 시험(try)되고, 비트 레이트 또는 왜곡의 특정 기준을 최적화시키는 레퍼런스가 선택된다. 예를 들면, 폐쇄 루프 선택은 각각의 레퍼런스에 대응하는 양자화된 LPC 벡터 및 입력 LPC 벡터 간의 가중 평균 제곱(weighted mean-squared) 오차의 최소화에 기반할 수 있다. 또한, 입력 LPC 벡터 및 양자화된 LPC 벡터 간의 스펙트럼 왜곡이 이용될 수 있다. 대안적으로, 가능한 레퍼런스들을 이용한 양자화가 특정 임계값 아래의 왜곡을 유지하는 동안에 수행될 수 있고, 이러한 기준을 만족시키면서 보다 작은 수의 비트들을 이용하는 레퍼런스가 선택된다. 이하의 기술에서 설명되는 바와 같이, 스케일링된 잔여 벡터의 에너지에 기반하여 특정 비트 버짓(budget)을 이용하는 스케일링된 잔여 벡터(입력 LPC 벡터와 레퍼런스 간의 차분)를 양자화하기 위하여 가변 비트 레이트 대수적 벡터 양자화기가 사용될 수 있다. 이러한 경우, 보다 작은 수의 비트들을 생성하는 레퍼런스가 선택된다.
개방 루프에서, 동작(104)의 선택기는 양자화될 입력 LPC 필터의 선형 예측 상수들의 값 및 이용 가능한 레퍼런스 LPC 필터들의 선형 예측 계수들의 값에 기반하여 레퍼런스를 미리 결정한다. 예를 들면, 잔여 벡터의 L2-놈이 모든 레퍼런스들에 대하여 계산되고, 보다 작은 값을 생성하는 레퍼런스가 선택된다.
동작(105): 동작(104)에 의해 레퍼런스들 1, 2, ..., n 중 하나가 선택된 후, 송신기(동작(105))는 양자화된 LPC 필터(미도시) 및 양자화 모드(서브-동작(1051)), 예를 들면 절대 혹은 차분 양자화를 나타내는 인덱스를 디코더(미도시)에 전달하거나 보낸다. 또한, 차분 양자화가 사용될 때, 송신기(동작(105))는 선택된 레퍼런스 및 그에 관련된 동작(1031, 1032, ... , 103n)(서브-동작(1052))의 차분 양자화기를 나타내는 인덱스들을 디코더에 전달하거나 보낸다.
복수의 서로 다른 가능한 레퍼런스들을 이용하면, 예측 잔여의 L2-놈의 감소 면에서, 통상적인 예측에서 처럼 이전 값들로만 제한하여 비교할 때, 차분 양자화가 보다 효율적이다. 또한, 왜곡의 주어진 타겟 레벨에 대하여, 이러한 기법은 평균 비트 레이트 면에서 보다 효율적이다.
스위칭형(Switched) 절대 또는 차분 양자화
제2측면에 따르면, 스위칭형 절대/차분(또는 예측) 양자화가 사용된다. 도 1은 하나의 절대 양자화기(동작(102)) 및 각각의 서로 다른 레퍼런스들 1, 2, ..., n을 이용하는 n개의 차분 양자화기(동작(1031, 1032, ... , 103n)) 중 하나를 선택하는 절대/차분 방법의 예시를 도시한다. 다시 말해서, 양자화기의 선택은 동작(104)의 선택기에 의한 절대 및 차분 양자화기(동작(102) 및 동작(1031, 1032, ... , 103n)) 중의 선택에 의해 이루어질 수 있다. 여기서 선택된 양자화기는, 선택 기준에 따라서, 주어진 비트 레이트에서 생성된 왜곡의 레벨을 최소화하거나, 왜곡의 타겟 레벨을 이루기 위한 비트레이트를 최소화할 것이다.
몇몇 LPC 필터들은 절대 양자화기(동작(102)를 이용하여 코딩될 수 있다. 다른 LPC 필터들은 차분 양자화기들(동작(1031, 1032, ... , 103n))내의 하나 또는 여러 레퍼런스 LPC 필터들에 대하여 차분적으로 코딩된다.
절대 양자화기(동작(102))는 그 외에 차분적으로 양자화된 LPC필터들에 대한 안전책(safety-net solution)으로써 사용될 수 있는데, 예를 들면 LPC 편차가 큰 경우 또는 비트 레이트 면에서 절대 양자화기(동작(102))가 차분 양자화기들(동작(1031, 1032, ... , 103n))보다 효율적인 경우에 사용될 수 있다. 레퍼런스 LPC 필터(들)은 송신 오차(패킷 손실 또는 프레임 삭제)의 경우에 통상적으로 문제를 일으키는 수퍼-프레임 간의 의존성이 도입되지 않도록 모두 동일한 수퍼-프레임 내에 존재할 수 있다.
전술한 바와 같이, LPC 양자화의 예측을 이용하는 것은 양자화될 데이터의 L2-놈의 감소로 이어지며 결과적으로 특정 레벨의 성능을 이루기 위한 평균 비트 레이트의 감소로 이어진다. 하지만 예측이 언제나 똑같이 효율적인 것은 아니다. 스위칭형 LPC [3, 4]에서는, LPC 필터의 선 분류(pre-classification)가 수행되며, 양자화될 LPC 필터의 예측력에 의존하여 서로 다른 예측기들이 사용된다. 그러나 이러한 기법은 고정된 비트 레이트의 맥락에서 발전되어 왔으며, 두 개의 차분 양자화기들은 LPC 필터를 코딩하기 위하여 동일한 수의 비트를 요구한다.
또한, 하나 또는 여러 개의 절대 양자화기들(동작(102))이 제공될 수 있다. 더욱이, 하나 또는 여러 개의 차분(예측) 양자화기들(동작(1031, 1032, ... , 103n))이 제공될 수 있다. 여러 개의 차분 양자화기들(동작(1031, 1032, ... , 103n))은 1, 2, ..., n과 같은 여러 개의 가능한 레퍼런스들 및/또는 여러 개의 차분 양자화기 크기들 및/또는 구조들을 포함한다.
전술한 바와 같이, 여러 개의 차분 양자화기들(동작(1031, 1032, ... , 103n))이 사용될 때, 사용될 실제 차분 양자화기의 선택은 개방 루프 또는 폐쇄 루프 선택 프로세스에서 수행될 수 있다.
차분 양자화가 왜곡의 타겟 레벨을 달성하는 데 실패하는 경우나, 왜곡의 레벨을 달성하는데 절대 양자화가 차분 양자화보다 작은 수의 비트를 요구하는 경우, 절대 양자화는 안전책으로써 사용된다. 가능한 절대 및 차분 양자화기들의 수에 의존하여, 하나 또는 여러 개의 비트가 송신기(동작(105))를 통해 송신되어 사용되는 실제 양자화기를 디코더(미도시)에 알린다.
절대/차분 양자화는 예측 양자화의 장점(양자화될 데이터의 L2-놈의 감소와 관련된 비트 레이트의 감소)과, (차분(또는 예측) 양자화가 왜곡의 타겟 레벨, 예를 들면 눈에 띄지 않는 레벨을 달성하지 못하는 경우에 안전책으로써 사용되는)절대 양자화기의 일반성을 결합한다.
여러 개의 차분 양자화기들(동작(1031, 1032, ... , 103n))이 포함될 때, 이 차분 양자화기들은 동일한 예측기 또는 서로 다른 예측기 중 하나를 이용할 수 있다. 특별히, 하지만 배타적이지는 않게, 이 여러 개의 차분 양자화기들은 동일한 예측 계수들 또는 서로 다른 예측 계수들을 이용할 수 있다.
디코더는 비트 스트림을 수신하고 이 비트 스트림으로부터 (a) 양자회된 LPC 필터 및 (b) 다음 두 가지, 즉
- LPC 필터가 절대 양자화 또는 차분 양자화를 이용하여 양자화되었는지를 결정하기 위한 양자화 모드; 및
- LPC 필터를 양자화하기 위하여 사용된 복수의 가능한 레퍼런스들 중의 레퍼런스
에 관한 인덱스(인덱스들) 또는 정보를 추출하기 위한 수단, 예를 들면 디멀티플렉서(demultiplexer)를 포함한다.
만약 양자화 모드에 관한 정보가, LPC 필터가 절대 양자화를 이용하여 양자화되었음을 나타낸다면, 양자화된 LPC 필터를 역 양자화하기 위하여 절대 역 양자화기(미도시)가 제공된다. 만약 양자화 모드에 관한 정보가, LPC 필터가 차분 양자화를 이용하여 양자화되었음을 나타낸다면, 차분 역 양자화기(미도시)는 추출된 레퍼런스 정보에 대응하는 레퍼런스를 이용하여 차분적으로 양자화된 멀티-레퍼런스 LPC 필터를 차분적으로 역 양자화한다.
아웃-
오브
-더-루프(
out
-
of
-
the
-
loop
) 양자화 방법
AMR-WB+ 코덱은 ACELP 코딩 방법에 기반한 시간 영역 코딩 모델과, TCX로 불리는 변환 영역 코딩 모델간에 스위칭되는 하이브리드 코덱이다. AMR-WB+ 코덱은 다음과 같이 진행된다[1].
- 입력 신호가 4개 프레임의 수퍼-프레임으로 나누어진다.
- 각 수퍼-프레임은 4개의 가능한 코딩 모델들의 조합을 이용하여 인코딩되는데, 각 코딩 모델은 다음과 같이 서로 다른 지속기간(duration)을 커버한다.
- ACELP (1개 프레임의 지속기간을 커버함)
- TCX256 (1개 프레임의 지속기간을 커버함)
- TCX512 (2개 프레임의 지속기간을 커버함); 및
- TCX1024 (4개 프레임의 지속기간을 커버함);
따라서 각 수퍼-프레임을 코딩하기 위해 26개의 가능한 모드 조합들이 존재한다.
주어진 수퍼-프레임에 대하여, 총 가중 오차(total weighted error)를 최소화하는 모드들의 조합이 "폐쇄 루프" 모드 선택 절차에 의해 결정된다. 보다 구체적으로, 26개의 조합을 테스트하는 대신에, 11개의 서로 다른 시험들(트리 서치, 표 1 참조)을 통해 모드의 선택이 수행된다. AMR-WB+ 코덱에서, 폐쇄 루프 선택은 가중 영역의 입력 및 코덱 신호 간의 평균 제곱 오차의 최소화(또는 신호 대 양자화 노이즈 비율의 최대화)에 기반한다. 표 1은 AMR-WB+에서 폐쇄 루프 모드 선택을 위한 11개의 시험들을 나타낸다.
LPC 필터들은 AMR-WB+ 코덱에 의해 전송되는 다양한 파라메터들 중 하나이다. 이하는 이 LPC 필터들의 양자화 및 전송에 관한 몇몇 핵심 요소들이다.
비록 서로 다른 코딩 모드들이 동일한 수의 프레임들을 커버하지는 않지만, 디코더로 전송되는 LPC 필터들의 수는 모든 코딩 모드들에 대하여 1로 동일하다. 오직 커버되는 세그먼트의 종단에 대응하는 LPC 필터만이 전송된다. 보다 구체적으로, TCX1024의 경우, 1개의 LPC 필터가 4개 프레임 지속기간 동안 계산되고 전송된다. TCX512의 경우, 1개의 LPC 필터가 2개 프레임 지속기간 동안 계산되고 전송된다. TCX256 또는 ACELP의 경우, 1개의 LPC 필터가 1개 프레임 지속기간 동안 계산되고 전송된다.
AMR-WB+ 코덱은 (1차 이동 평균(first order moving-average)) 예측 LPC 양자화기를 사용한다. 후자의 양자화기의 연산은 이전에 전송된 LPC 필터에 의존하며, 결과적으로는 이전에 선택된 코딩 모드에 의존한다. 따라서, 전체 수퍼-프레임이 코딩될 때까지는 모드들의 정확한 조합을 알 수 없기 때문에, 모드들의 마지막 조합이 결정되기 전에 몇몇 LPC 필터들이 여러 번 인코딩된다.
예를 들어, 프레임 3의 종단에 위치한 LPC 필터는 세 번째 프레임이 ACELP 또는 TCX256으로 인코딩될 때에만 디코더로 전송된다. 프레임 3 및 4가 TCX512를 이용하여 함께 인코딩될 때 그것은 전송되지 않는다. 프레임 2의 종단에 위치한 LPC 필터와 관련하여, 그것은 TCX1024를 제외한 모드들의 모든 조합에서 전송된다. 따라서, 수퍼-프레임의 마지막 LPC 필터를 양자화할 때 수행되는 예측은 전체 수퍼-프레임에 대한 모드들의 조합에 의존한다.
개시된 기법의 원리에서는, 폐쇄 루프 결정이 종료되면, 다른 필터들이 전송되고 디코더에서 디코딩되는 방법에 영향을 미치지 않으면서 불필요한 LPC 필터들에 대응하는 양자화 정보가 전송에서 제외될 수 있도록 LPC 필터들이 양자화되는 순서가 선택된다. 전술한 차분 양자화 전략을 이용하여 양자화되는 각각의 LPC 필터마다, 이것은 가능한 레퍼런스 LPC 필터들에 대해 약간의 제약을 부과한다.
도 2를 참조하여 다음의 예시가 주어진다.
도 2의 동작(1): 임의의 수퍼-프레임 간 의존성을 방지하기 위하여, 적어도 하나의 LPC 필터가 절대 LPC 양자화기를 이용하여 양자화된다. 폐쇄 루프 선택 절차에 의해 결정된 코딩 모드 조합이 무엇이든 간에 수퍼-프레임의 프레임 4의 필터 LPC4는 항상 전송되기 때문에, 절대 양자화기를 이용하여 그 필터 LPC4를 양자화하는 것이 편리하다.
도 2의 동작(2): 양자화될 다음 LPC 필터는 TCX1024를 제외한 모드들의 모든 조합들에 대하여 전송되는 수퍼-프레임의 프레임 2의 필터 LPC2이다. 예를 들면 필터 LPC2와 필터 LPC4의 절대 양자화된 버전간의 차분을 코딩하기 위하여 차분 양자화기가 사용될 수 있다. 예를 들어 LPC 편차가 큰 경우 또는 비트 레이트 및/또는 왜곡 레벨 면에서 절대 LPC 양자화기가 차분 양자화기보다 효율적인 경우, 필터 LPC4를 코딩할 때 사용된 동일한 절대 양자화기가 또한 안전책으로써 사용될 수 있다.
도 2의 동작(3): 나머지 2개의 LPC 필터들(수퍼-프레임의 프레임 1의 필터 LPC1 및 수퍼-프레임의 프레임 3의 필터 LPC3) 또한 동일한 차분/절대 양자화 전략을 이용하여 양자화된다. 두 LPC 필터들은 필터 LPC2의 양자화된 버전과 관련하여 양자화될 수 있다. 몇몇 대안적인 전략들이 아래에 주어진다.
도 5는 아웃-오브-더-루프 양자화 방법의 예시를 보다 상세히 도시하는 흐름도이다.
동작(501): 절대 양자화기가 필터 LPC4를 양자화한다.
동작(502): 동작(512)은 선택적이며, 비 LPC 기반 코딩 프레임 이후의 첫 번째 LPC 기반 코딩 프레임에서 사용된다. 절대 양자화기가 필터 LPC0을 양자화하거나, 양자화된 필터 LPC4와 관련하여 필터 LPC0을 차분 양자화기가 차분적으로 양자화한다. 필터 LPC0은 이전의 수퍼-프레임으로부터의 마지막 LPC 필터(LPC4)이며, 필터 LPC1 내지 LPC4를 양자화하기 위한 가능한 레퍼런스로서 사용될 수 있다.
동작(503): 절대 양자화기가 필터 LPC2를 양자화하거나, 레퍼런스로서 사용되는 양자화된 필터 LPC4와 관련하여 필터 LPC2를 차분 양자화기가 차분적으로 양자화한다.
동작(504): 절대 양자화기가 필터 LPC1을 양자화하거나, 레퍼런스로서 사용되는 양자화된 필터 LPC2와 관련하여 필터 LPC1을 차분 양자화기가 차분적으로 양자화하거나, 레퍼런스로서 사용되는 (양자화된 필터 LPC2+양자화된 필터 LPC0)/2와 관련하여 필터 LPC1을 차분 양자화기가 차분적으로 양자화한다.
동작(505): 절대 양자화기가 필터 LPC3을 양자화하거나, 레퍼런스로서 사용되는 양자화된 필터 LPC2와 관련하여 필터 LPC3을 차분 양자화기가 차분적으로 양자화하거나, 레퍼런스로서 사용되는 양자화된 필터 LPC4와 관련하여 필터 LPC3을 차분 양자화기가 차분적으로 양자화하거나, 레퍼런스로서 사용되는 (양자화된 필터 LPC2+양자화된 필터 LPC4)/2와 관련하여 필터 LPC3을 차분 양자화기가 차분적으로 양자화한다.
도 3은 4개의 LPC 필터들이 하나의 수퍼-프레임에서 계산되고 전송될 수 있는 구성에서 전송될 수 있는 LPC 필터들의 결정을 도시하는 흐름도이다.
수퍼-프레임의 처음 절반에 대하여 ACELP 및/또는 TCX256이 선택된 경우에만 양자화된 필터 LPC1이 전송된다는 점을 무엇보다도 유념해야 한다. 유사하게, 수퍼-프레임의 나머지 절반에 대하여 ACELP 및/또는 TCX256이 사용되는 경우에만 필터 LPC3이 전송된다.
동작(301): 수퍼-프레임의 프레임 1의 필터 LPC1, 수퍼-프레임의 프레임 2의 필터 LPC2, 수퍼-프레임의 프레임 3의 필터 LPC3 및 수퍼-프레임의 프레임 4의 필터 LPC4는 예를 들면 도 2 및 5와 관련하여 도시되고 기술된 양자화 전략을 이용하여 양자화될 수 있다. 물론, 다른 양자화 전략들도 가능하다.
동작(302): 전술한 바와 같은 코딩 모델들의 폐쇄 루프 선택이 수행된다.
동작(303): 양자화된 필터 LPC4는 예를 들면 도 1의 전송기(105)를 통해 디코더로 전송된다. 디코더는 다음을 포함한다.
- 비트 스트림을 수신하고 수신된 비트 스트림으로부터 양자화된 필터 LPC4를 추출하기 위한 수단, 예를 들면 디멀티플렉서; 및
- 양자화된 필터 LPC4의 역 양자화를 위하여 양자화된 필터 LPC4를 공급받는 절대 역 양자화기.
동작(304): 만약 수퍼-프레임이 모드 TCX1024를 이용하여 코딩된다면, 더 이상의 전송이 요구되지 않는다.
동작(305): 만약 수퍼-프레임의 첫 번째, 두 번째, 세 번째 및 네 번째 프레임이 모드 TCX1024를 이용하여 코딩되지 않는다면, 절대 양자화 모드와 차분 양자화 모드 중 하나를 나타내는 인덱스 및 양자화된 필터 LPC2는 예를 들면 도 1의 송신기(105)를 통해 디코더로 전송된다. 디코더는 다음을 포함한다.
- 비트 스트림을 수신하고 수신된 비트 스트림으로부터 절대 양자화 모드와 차분 양자화 모드 중 하나를 나타내는 인덱스 및 양자화된 필터 LPC2를 추출하기 위한 수단, 예를 들면 디멀티플렉서; 및
- 양자화된 필터 LPC2의 역 양자화를 위하여 절대 양자화 모드를 나타내는 인덱스 및 양자화된 필터 LPC2를 공급받는 절대 역 양자화기, 또는 양자화된 필터 LPC2의 역 양자화를 위하여 차분 양자화 모드를 나타내는 인덱스 및 양자화된 필터 LPC2를 공급받는 차분 역 양자화기.
동작(306): 만약 수퍼-프레임의 프레임 1 및 2가 TCX512를 이용하여 코딩된다면, 양자화된 필터 LPC1은 디코더로 전송되지 않는다.
동작(307): 만약 수퍼-프레임의 프레임 1 및 2가 TCX512를 이용하여 코딩되지 않는다면, 즉, 수퍼-프레임의 프레임 1 및 2가 ACELP 또는 TCX256을 이용하여 코딩된다면, 절대 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC2와 관련된 차분 양자화 모드 및 레퍼런스로서 사용된 (양자화된 필터 LPC2+양자화된 필터 LPC0)/2와 관련된 차분 양자화 모드 중 하나를 나타내는 인덱스와, 양자화된 필터 LPC1이 예를 들면 도 1의 송신기(105)를 통해 디코더로 전송된다. 디코더는 다음을 포함한다.
- 비트 스트림을 수신하고 수신된 비트 스트림으로부터 절대 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC2와 관련된 차분 양자화 모드 및 레퍼런스로서 사용된 (양자화된 필터 LPC2+양자화된 필터 LPC0)/2와 관련된 차분 양자화 모드 중 하나를 나타내는 인덱스와, 양자화된 필터 LPC1을 추출하기 위한 수단, 예를 들면 디멀티플렉서; 및
- 양자화된 필터 LPC1의 역 양자화를 위하여 절대 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC2와 관련된 차분 양자화 모드 및 레퍼런스로서 사용된 (양자화된 필터 LPC2+양자화된 필터 LPC0)/2와 관련된 차분 양자화 모드 중 하나를 나타내는 인덱스와, 양자화된 필터 LPC1을 공급받는 절대 역 양자화기.
동작(308): 만약 수퍼-프레임의 프레임 3 및 4가 TCX512를 이용하여 코딩된다면, 양자화된 필터 LPC3은 디코더로 전송되지 않는다.
동작(309): 만약 수퍼-프레임의 프레임 3 및 4가 TCX512를 이용하여 코딩되지 않는다면, 즉, 수퍼-프레임의 프레임 3 및 4가 ACELP 또는 TCX256을 이용하여 코딩된다면, 절대 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC2와 관련된 차분 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC4와 관련된 차분 양자화 모드 및 레퍼런스로서 사용된 (양자화된 필터 LPC2+양자화된 필터 LPC4)/2와 관련된 차분 양자화 모드 중 하나를 나타내는 인덱스와, 양자화된 필터 LPC3이 예를 들면 도 1의 송신기(105)를 통해 디코더로 전송된다. 디코더는 다음을 포함한다.
- 비트 스트림을 수신하고 수신된 비트 스트림으로부터 절대 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC2와 관련된 차분 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC4와 관련된 차분 양자화 모드 및 레퍼런스로서 사용된 (양자화된 필터 LPC2+양자화된 필터 LPC4)/2와 관련된 차분 양자화 모드 중 하나를 나타내는 인덱스와, 양자화된 필터 LPC3을 추출하기 위한 수단, 예를 들면 디멀티플렉서; 및
- 양자화된 필터 LPC1의 역 양자화를 위하여 절대 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC2와 관련된 차분 양자화 모드, 레퍼런스로서 사용된 양자화된 필터 LPC4와 관련된 차분 양자화 모드 및 레퍼런스로서 사용된 (양자화된 필터 LPC2+양자화된 필터 LPC4)/2와 관련된 차분 양자화 모드 중 하나를 나타내는 인덱스와, 양자화된 필터 LPC3을 공급받는 절대 역 양자화기.
전술한 솔루션의 몇몇 장점은 다음을 포함한다.
- 코딩 모드들의 폐쇄 루프 선택 이전에 LPC 필터의 전체 세트를 양자화하면, 복잡함이 줄어든다.
- 전반적인 양자화 방법에서 차분 양자화기를 이용하면, 예를 들면 원래 AWR-WB+ 양자화 방법의 예측 양자화기에 의해 획득되었던 약간의 비트 레이트를 보존한다.
차분 양자화기들(1031, 1032, ... , 103n과 같은 연산들)에서 사용되는 레퍼런스 LPC 필터들을 구축하기 위해 다음의 변형들(variants)이 사용될 수 있다.
- 만약 수퍼-프레임간 의존성이 이슈가 아니라면, 이전 수퍼-프레임(LPC0)으로부터의 마지막 LPC 필터(LPC4)가 필터 LPC1 내지 LPC4의 인코딩을 위한 가능한 레퍼런스로서 사용될 수 있다.
- 예를 들면 필터 LPC2를 코딩할 때 필터 LPC0 및 LPC4와 같이, 서로 다른 레퍼런스 LPC 필터들이 이용 가능할 때, 레퍼런스들 중 어떤 것이 실제로 사용되었는지를 나타내기 위하여 특정 비트 패턴이 디코더로 전송될 수 있다. 예를 들면, 레퍼런스의 선택이 도 1을 참조하여 전술한 바와 같이, 예를 들면 거리 또는 비트 레이트 측정에 기반하여 수행될 수 있다.
- 서로 다른 레퍼런스 LPC 필터들이 이용 가능할 때, 다양한 외삽 또는 내삽 방법들을 이미 이용 가능한 레퍼런스 LPC 필터들에 적용함으로써 추가적인 2차 레퍼런스 LPC 필터들이 획득될 수 있다. 코더에 의해 선택된 실제 내삽 또는 외삽 전략을 나타내기 위하여 특정 비트 패턴이 전송될 수 있다. 예를 들면, 필터 LPC3은 필터 LPC2 또는 LPC4 중 하나의 양자화된 버전과 관련하여 차분적으로 양자화될 수 있으며, 또는 두 양자화된 필터 LPC2 및 LPC 4 간의 내삽된 값(예를 들면, 평균)과 관련하여 차분적으로 양자화될 수 있다(도 5의 동작(505)참조).
전술한 "아웃-오브-더-루프" 양자화 방법은 4개 이상의 LPC 필터들의 코딩, 예를 들면 수퍼-프레임과 함께 필터 LPC0을 양자화하고 전송하는 것으로 확장될 수 있다. 그러한 경우, 이전의 수퍼-프레임이, 비제한적인 예시로서, 필터 LPC4와 관련하여 양자화될 수 있는 동안, 마지막 LPC 필터(LPC4)에 대응하는 필터 LPC0이 계산될 수 있는데, 이는 필터 LPC4가 언제나 레퍼런스로서 이용 가능하기 때문이다. 양자화된 필터 LPC0은 절대 양자화 모드 및 차분 양자화 모드 중 하나를 나타내는 인덱스와 함께 디코더로 전송된다. 디코더는 다음을 포함한다.
- 비트 스트림을 수신하고 수신된 비트 스트림으로부터 절대 양자화 모드와 차분 양자화 모드 중 하나를 나타내는 인덱스 및 양자화된 필터 LPC0을 추출하기 위한 수단, 예를 들면 디멀티플렉서; 및
- 양자화된 필터 LPC0의 역 양자화를 위하여 절대 양자화 모드를 나타내는 인덱스 및 양자화된 필터 LPC0을 공급받는 절대 역 양자화기, 또는 양자화된 필터 LPC0의 역 양자화를 위하여 차분 양자화 모드를 나타내는 인덱스 및 양자화된 필터 LPC0을 공급받는 차분 역 양자화기
필터 LPC0을 디코더에 전송하는 것은 비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로 스위칭하는 경우에 LPC 기반 코덱을 초기화하는 데 유용하다. 비 LPC 기반 코딩 모드의 예시로는 PCM(Pluse Code Modulation) 및, 예를 들면 MP3에 의해 그리고 AAC(Advanced Audio Codec)에 의해 사용되는 변환 코딩을 들 수 있다. LPC 기반 코딩 모드의 예시로는 AMR-WB+ 코덱[1]에 의해 사용되는 CELP(Code Excited Linear Prediction) 및 Algebraic CELP(ACELP)를 들 수 있다.
LPC 기반 코덱에서, 프레임당(또는 수퍼-프레임당) 하나 또는 여러 개의 LPC 필터들이 추정되며 디코더로 전송된다. 프레임당 하나의 단일 LPC 필터가 추정되고 전송될 때, 이 LPC 필터는 도 4a에 나타난 바와 같이 프레임의 종단 중심에 위치한 LPC 분석 윈도우를 이용하여 가장 자주 추정된다. 프레임당(또는 AMR-WB+ 코덱에서와 같이 수퍼-프레임당) 여러 개의 LPC 필터들이 추정될 때, 그 필터들은 도 4b에 나타난 바와 같이 프레임의 길이에 걸쳐 규칙적으로 간격을 둔 위치에서 가장 자주 추정된다. 도 4a 및 4b의 필터 LPC0는 실제로는 양자화되고 디코더로 전송되는 이전 프레임(또는 수퍼-프레임)의 마지막 LPC 필터이다.
일반적인 LPC 기반 코덱들은 보통 LPC 필터들에 대하여 내삽된 값을 사용한다. 도 4a의 예시에서, 예를 들면, LPC 기반 코덱은 일반적으로 프레임을 4개의 서브-프레임으로 나누고, 각 서브-프레임에 대하여 서로 다른 내삽된 LPC 필터를 사용하는데, 첫 번째 서브-프레임의 LPC 필터는 필터 LPC0에 보다 가깝고, 네 번째 서브-프레임의 LPC 필터는 필터 LPC1에 보다 가깝다.
비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로 스위칭하는 코덱에서는, 비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로의 스위칭 이후의 첫 번째 프레임에 LPC 기반 코덱을 동작시키기 위해 사용되는 필터 LPC0이 일반적으로 이용 가능하지 않다.
그러한 맥락에서, 비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로의 스위칭 이후의 첫 번째 프레임을 코딩 및 디코딩할 때 코더 및 디코더 양쪽에서 이용 가능한 필터 LPC0를 위한 값을 제공할 것이 제안된다. 보다 구체적으로, 필터 LPC0의 값은 디코더에서, 코더로부터 전송된 파라메터들로부터 획득된다.
첫 번째 솔루션에 따르면, 필터 LPC0는 (당업자에게 널리 알려진 LPC 분석을 이용하여) 코더에서 결정되고, 양자화되며, 비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로의 스위칭이 결정된 이후 디코더로 전송된다. 디코더는 전송된 양자화된 값 및 필터 LPC0을 사용한다. 필터 LPC0을 효율적으로 양자화하기 위하여, 전술한, 4개 초과의 LPC 필터들로 확장되는 아웃-오브-더-루프 양자화 방법이 사용될 수 있다.
다음은 디코더에서, 전송된 파라메터들로부터 필터 LPC0을 추정하기 위한 두 번째 및 세 번째 솔루션들을 기술한다.
- 예를 들면, 외삽을 이용하여, 다른 전송된 LPC 필터들로부터 필터 LPC0을 추정함; 및
- 다른 전송된 파라메터들로부터 필터 LPC0을 추정함. 예를 들면 종래의 LPC 분석 절차를 이전의 디코딩된 신호에 적용함으로써, 보다 구체적으로는 비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로의 스위칭 이전에 스위치된 디코더의 출력에 의해 필터 LPC0이 추정될 수 있다.
균일한 대수적 벡터 양자화기를 사용하는 양자화
스토케스틱(stochastic) 벡터 양자화의 원리는 양자화될 벡터의 가장 가까운(일반적으로 유클리드 거리(Euclidian distance) 또는 가중 유클리드 거리 면에서) 이웃에 대한 벡터들의 코드북을 탐색하는 것이다. LSF(Line Spectral Frequency) 또는 ISF(Immitance Spectral Frequency) 영역에서 LPC 필터들을 양자화할 때, 가중 유클리드 거리가 일반적으로 사용되며, 벡터의 각 컴포넌트는 그의 값 및 다른 컴포넌트들의 값에 의존하여 서로 다르게 가중된다[5]. 그러한 가중의 목적은 유클리드 거리의 최소화가 스펙트럼 왜곡의 최소화와 가능한 가깝게 행해지도록 하는 데 있다. 스토캐스틱 양자화기와 다르게, 균일한 대수적 벡터 양자화기는 코드북에 대한 완전한 탐색을 수행하지 않는다. 따라서 그것은 거리 계산에 있어서 가중 함수를 도입하기 어렵다.
여기에서 제안되는 솔루션에서는, LPC 필터들이, 비제한적인 예시로서, LSF 영역에서 양자화된다. 따라서, 입력 LSF 벡터를 형성하기 위하여 LPC 필터를 LSF 양자화 영역에서 변환하기 위한 적절한 수단이 제공된다. 보다 구체적으로, LSF 잔여 벡터, 즉 입력 LSF 벡터 및 이 입력 LSF 벡터의 1단계 근사(first stage approximation) 간의 차분은 1단계 근사로부터 계산된 가중 함수를 이용하여 워프되는데(warped), 여기서 1단계 근사는 입력 LSF 벡터의 스토캐스틱 절대 양자화기, 입력 LSF 벡터의 차분 양자화기, 입력 LSF 벡터의 내삽기(interpolator), 또는 양자화될 입력 LSF 벡터의 추정을 제공하는 다른 요소를 이용한다. 워핑(Warping)은 LSF 잔여 벡터의 컴포넌트들에 서로 다른 가중치들(weights)이 적용된다는 뜻이다. 1단계 근사가 또한 디코더에서 이용 가능하기 때문에, 디코더에서 역 가중치들이 계산될 수 있으며, 양자화된 LSF 잔여 벡터에 역 워핑이 적용될 수 있다. 스펙트럼 왜곡을 최소화하는 모델에 따라 LSF 잔여 벡터를 워핑하는 것은 양자화기가 균일할 때 유용하다. 디코더에서 수신되는 양자화된 LSF들은, 디코더에서 역 워프된, 예를 들면 AVQ(Algebraic Vector Quantization)와 같은, 가변 비트 레이트 양자화 개선(refinement)과 1단계 근사의 조합이다.
제안된 솔루션의 몇몇 장점은 다음과 같다.
- 적절한 가중 함수로, 균일한 양자화기는 상대적으로 균일한 스펙트럼 왜곡을 제공할 수 있다.
- SVA(Stochastic Vector Quantizaion)보다 나은, 가변 비트 레이트 벡터 양자화, 예를 들면 AVQ(Algebraic Vector Quantization)의 장점들은 보다 작은 수의 테이블들(메모리), 보다 적은 복잡성 및 보다 큰 비트 레이트 입도(granularity)이다.
- 예를 들면 AVQ(Algebraic Vector Quantization)와 같은 가변 비트 레이트 벡터 양자화에 유리한 또 다른 장점은 그것의 무제한적인 코드북 크기이다. 이는 어떠한 타입의 신호에 대해서도 동일한 스펙트럼 왜곡을 보장한다.
주어진 LPC 필터의 양자화에 대한 일반적인 원리가 도 6에 주어진다. 이 비제한적인 예시에서, LPC 필터는 LSF 영역에서 양자화된다.
동작(601): 계산기는 입력 LSF 벡터(607)의 1단계 근사(608)를 계산한다.
동작(602): 뺄셈기는 입력 LSF 벡터(607)로부터 동작(601)의 1단계 근사(608)를 뺌으로써 잔여 LSF 벡터(609)를 생성한다.
동작(603): 계산기는 동작(601)의 1단계 근사(608)로부터 LSF 가중 함수(610)를 유도한다.
동작(604): 곱셈기, 즉 워퍼(warper)는 동작(603)의 LSF 가중 함수(610)를 동작(602)의 잔여 LSF 벡터(609)에 적용한다.
동작(605): 예를 들면 AVQ(Algebraic Vector Quantization)와 같은 가변 비트 레이트 벡터 양자화기는 생성된 가중 잔여 LSF 벡터(611)을 양자화하여 양자화된 가중 잔여 LSF 벡터(612)를 공급한다.
동작(606): 멀티플렉서는 동작(601)의 1단계 근사(608) 및 동작(605)의 양자화된 가중 잔여 LSF 벡터(612)에 응답하여, 대응하는 코딩된 인덱스들(613)을 다중화하고 전송한다.
1단계 근사(동작(601))는 다른 방법으로 계산될 수 있다. 비제한적인 예시로써, 1단계 근사(608)의 계산기는 작은 수의 비트를 갖는 입력 LSF 벡터(607)의 절대 스토캐스틱 벡터 양자화기일 수 있으며, 또는 위에서 설명된 바와 같은 레퍼런스(여기서, 1단계 근사는 레퍼런스 그 자체임)를 이용하는 입력 LSF 벡터(607)의 차분 양자화기일 수 있다. 예를 들면, 도 5에서와 같은 벡터 LPC1을 양자화할 때, 1단계 근사(608)의 계산기인 동작(504)은 8비트를 갖는 절대 양자화기, 또는 양자화된 필터 LPC2, 또는 (양자화된 필터 LPC2+양자화된 필터 LPC0)/2일 수 있다.
가중 함수(동작(603))의 계산 및 목적은 이하에서 기술된다.
대응하는 역 양자화기가 도 7에 도시된다.
동작(701): 코더로부터 코딩된 인덱스들(707)은 디멀티플렉서에 의해 역다중화된다.
동작(702): 역다중화된 코딩된 인덱스들은 1단계 근사(708)를 포함한다.
동작(703): 1단계 근사가 코더(동작(702))에서와 같이 디코더에서 이용 가능하기 때문에, 역 LSF 가중 함수(709)를 계산하는데 계산기가 사용될 수 있다.
동작(704): 양자화된 가중 잔여 LSF 벡터를 나타내는 디코딩된 인덱스들(710)은 예를 들면 대수적 역 벡터 양자화기(inverse AVQ)와 같은 가변 비트 레이트 역 벡터 양자화기에 공급되어 가중 잔여 LSF 벡터(711)를 복구한다.
동작(705): 곱셈기는 동작(740)의 가중 잔여 LSF 벡터(711)를 동작(703)의 역 LSF 가중 함수(709)에 곱하여 잔여 LSF 벡터(712)를 복구한다.
동작(706): 덧셈기는 동작(702)의 1단계 근사(708)를 동작(705)의 잔여 LSF 벡터(712)에 더하여 디코딩된 LSF 벡터(713)를 형성한다. 디코딩된 LSF 벡터(713)는 동작(702)의 1단계 근사와 디코더에서 역 가중되는(동작(705)) 가변 비트 레이트 역 양자화 개선(동작(704))의 조합이다.
1단계 근사
전술한 바와 같이 주어진 LPC 필터는 여러 레퍼런스들을 이용하는 차분 양자화 및 절대 양자화를 포함하는 여러 양자화 모드들을 이용하여 양자화될 수 있다. 1단계 근사는 양자화 모드에 의존한다. 절대 양자화의 경우, 1단계 근사는 작은 수의 비트(예를 들면 8비트)를 갖는 벡터 양자화기를 이용할 수 있다. 차분 양자화의 경우, 1단계 근사는 레퍼런스 그 자체를 구성한다. 예를 들어, 도 5(동작(505))에서 도시되는 바와 같이 벡터 LPC3을 양자화할 때, 1단계 근사는 다음 중 하나일 수 있다.
- 8비트 VQ (절대 양자화);
- 양자화된 필터 LPC2 (레퍼런스로서 양자화된 필터 LPC2를 이용하는 차분 양자화);
- 양자화된 필터 LPC4 (레퍼런스로서 양자화된 필터 LPC4를 이용하는 차분 양자화);
- 양자화된 필터 LPC2와 LPC4의 평균 (레퍼런스로서 (양자화된 필터 LPC2+양자화된 필터 LPC4)/2를 이용하는 차분 양자화);
비제한적인 예시로서, LSF 파라메터들과 함께 표현되는 p차(p-th order) LPC 필터의 경우, 절대 양자화 모드에서, 1단계 근사는 입력 LSF 벡터에 적용되는 p-차원의 8비트 스토캐스틱 벡터 양자화기를 이용하여 계산된다. 코드북 탐색은 입력 LSF 벡터 및 코드북 엔트리 간의 제곱 차분의 각 컴포넌트가 가중치 wt(i)와 곱해지는 가중 유클리드 거리를 이용한다. 예를 들어, 가중치 wt(i)는 다음 수식에 의해 주어질 수 있다.
이고,
여기서 f(i), i=0, ..., p-1 은 양자화될 입력 LSF 벡터이고, p는 LP 분석의 차수이며, SF는 LPC 기반 코덱의 내부 샘플링 주파수(Hz 단위)이다.
차분 양자화 모드들에서, 1단계 근사는 이미 양자화된 LPC 필터들에 기반한다.
도 5를 참조하여 설명되는 바와 같이, LPC 필터들의 집합은 LPC, LPC2, LPC1 및 LPC3의 순서에 따라 양자화된다. 필요할 때에는 선택적인 필터 LPC0이 필터 LPC4 이후에 양자화된다. 따라서 필터 LPC2의 차분 양자화는 오직 LPC4에 대해서만 완료될 수 있고, 필터 LPC3의 차분 양자화는 LPC2, LPC4 또는 LPC2 및 LPC4의 조합에 대해서 완료될 수 있다. LPC1은 LPC3과 인접해 있지 않기 때문에 좋은 선택으로 고려되지 않는다.
각각의 1단계 근사 f1st(i)에 대하여, 잔여 LSF 벡터는 다음과 같이 계산된다.
도 6에 나타난 바와 같이, 워프된 잔여 LSF 벡터(611)(동작(604))를 획득하기 위하여, 동작(602)로부터의 잔여 LSF 벡터(609)는 1단계 근사 f1st(i)에 기반하여 계산된 동작(603)으로부터의 가중 함수(610)로 가중된다(동작(604)). 워프된 잔여 LSF 벡터(611)은 그 후 가변 비트 레이트 양자화기, 예를 들면 대수적 벡터 양자화기(동작(605))를 이용하여 양자화된다.
예를 들어, p차 잔여 LSF 벡터의 컴포넌트들에 적용되는 가중들은 다음 관계식에 의해 주어질 수 있다.
이고,
여기서 f1st(i)는 1단계 근사이고, SF는 LPC 기반 코덱의 내부 샘플링 주파수(Hz 단위)이며, W는 양자화 모드에 의존하는 스케일링 인자(scaling factor)이다. 워프된 잔여 LSF 벡터가 가변 비트 레이트 양자화기로 양자화되면, 특정 타겟 스펙트럼 왜곡 및/또는 특정 타겟 평균 비트 레이트를 획득하기 위하여 W의 값이 선택된다. 비제한적인 예시로서, 가변 비트 레이트 벡터 양자화기는 그것의 평균 에너지에 기반하여 특정 벡터에 대한 비트 레이트를 선택한다.
구체적인 예시에서, 선택적인 LPC0 필터뿐만 아니라 수퍼-프레임 내의 4개의 LPC 필터들은 도 5에 따라 양자화된다. 표 2는 각 양자화 모드에 대하여 사용되는 스케일링 인자와, 이 예시에서 사용되는 모드 인덱스의 인코딩을 나타낸다. 양자화 모드는 절대 또는 차분 양자화 중 어느 것이 사용되었는지를 특정하며, 차분 양자화가 사용되는 경우 그것은 사용된 레퍼런스 필터를 특정한다는 점을 유의해야 한다. 전술한 바와 같이 차분 양자화에서 사용되는 레퍼런스 필터는 가변 비트 레이터 양자화에 대한 실제 1단계 근사이다. 표 2는 가능한 절대 및 상대 양자화 모드들 및 대응하는 비트 스트림 시그널링, 그리고 스케일링 인자 및 가중 함수를 나타낸다.
도 8은 전술한 바와 같은 양자화 절차를 설명하는 도식적 블록도이다.
동작(801, 8011, 8012, ... , 801n): 예를 들어 입력 LSF 벡터(800)의 8비트 절대 벡터 양자화를 수행하기 위하여, 입력 LSF 벡터(800)는 절대 양자화기(동작(801))에 공급된다. 입력 LSF 벡터는 또한 입력 LSF 벡터(800)의 차분 양자화를 수행하기 위하여 차분 양자화기들(동작(8011, 8012, ... , 801n))에 공급된다. 차분 양자화기들은 도 1을 참조한 이전의 기술에서 설명된 바와 같이 각각의, 서로 다른 레퍼런스들을 사용한다. 동작(801)의 8비트 VQ 및 동작(8011, 8012, ... , 801n)의 레퍼런스들은 1단계 근사를 나타낸다.
동작(8021, 8022, ... , 802n)에서, 계산기는 동작(8011, 8012, ... , 801n)의 1단계 근사 벡터로부터 잔여 LSF 벡터를 각각 계산한다. 잔여 벡터는 입력 벡터 및 1단계 근사 간의 차분으로써 계산된다. 이것은 도 6의 동작(601) 및 동작(602)에 대응한다.
동작(8031, 8032, ... , 803n)에서, 계산기는 동작(8021, 8022, ... , 802n)의 잔여 LSF 벡터를 워프하기 위하여 가중 함수를 각각 계산한다. 이것은 도 6의 동작(601) 및 동작(603)에 대응한다.
동작(8041, 8042, ... , 804n)에서, 워퍼(warper)는 동작(8021, 8022, ... , 802n)의 잔여 LSF 벡터를 각각 동작(8031, 8032, ... , 803n)의 가중 함수와 곱한다.
동작(8051, 8052, ... , 805n)에서, 가변 비트 레이트 양자화기, 예를 들면 대수적 벡터 양자화기(algebraic vector quantizer: AVQ)는 동작(8041, 8042, ... , 804n)의 결과인 가중된 잔여 LSF 벡터를 각각 양자화하여, 양자화된 가중된 잔여 LSF 벡터를 공급한다.
동작(806)에서, 절대 양자화(동작(801)) 및 레퍼런스들 1, 2, ... , n(동작(801, 8011, 8012, ... , 801n) 중 하나를 사용하는 차분 양자화 중에서의 양자화 모드의 선택이 선택기에 의해 수행된다. 예를 들면, 동작(806)은 주어진 비트 레이트에 대해 보다 낮은 왜곡을 생성하거나 왜곡의 타겟 레벨에 대해 보다 낮은 비트 레이트를 생성하는 양자화 모드(동작(801, 8011, 8012, ... , 801n))를 선택할 수 있다. 8비트 VQ 및 레퍼런스들 1, 2, ... , n 중에서의 선택과 관련하여, 그 선택은 폐쇄 루프 또는 개방 루프에서 수행될 수 있다. 폐쇄 루프에서, 모든 가능한 레퍼런스들이 시험되고, 왜곡 또는 비트 레이트의 특정 기준, 예를 들면 주어진 비트 레이트에 대한 보다 낮은 왜곡 또는 왜곡의 타겟 레벨에 대한 보다 낮은 비트 레이트를 최적화하는 레퍼런스가 선택된다. 개방 루프에서, 동작(806)은 양자화될 LPC 필터의 선형 예측 계수들의 값 및 이용 가능한 레퍼런스 LPC 필터들의 선형 예측 계수들의 값에 기반하여 레퍼런스를 미리 결정한다.
동작(807): 동작(806)의 선택에 이어서, 송신기(동작(807))는
- 양자화 모드(서브-동작(8071)), 예를 들면 절대 또는 차분 양자화; 및
- 차분 양자화의 경우, 선택된 레퍼런스 및 동작(801, 8011, 8012, ... , 801n)(서브-동작(8072))의 관련된 차분 양자화기
를 나타내는 인덱스를 디코더(미도시)에 전달하거나 보낸다.
그러한 시그널링을 위하여 몇몇 특정 비트들이 디코더에 전송된다.
대수적 벡터 양자화기(
Algebraic
vector
quantizer
)
예를 들어 도 6의 동작(605) 및 도 8의 동작 (8051, 8052, ... , 805n)에서 사용되는 가능한 대수적 벡터 양자화기(AVQ)는 AMR-WB+[1]의 TCX 모드들에서 스펙트럼을 양자화하기 위하여 사용되는 8차원의 RE8 격자 벡터 양자화기에 기반한다.
16차의 LPC에 대하여, 각각의 가중된 잔여 LSF 벡터는 두 개의 8차원 서브-벡터들 B1 및 B2로 나누어진다. 이 두 서브-벡터들 각각은 이하에서 기술되는 3-연산 접근법(three-operation approach)을 사용하여 양자화된다.
LSF 벡터들은 모두 양자화 오차에 대한 동일한 민감도를 갖지 않는데, 하나의 LSF 벡터에 적용되는 특정 양자화 오차는 다른 LSF 벡터에 적용되는 동일한 양자화 오차보다 더 많은 영향을 스펙트럼 왜곡에 끼칠 수 있다. 가중 동작은 모든 가중된 LSF 벡터들에 동일한 상대적 민감도를 부여할 수 있다. AVQ는 가중된 LSF 벡터들에 동일한 레벨의 양자화 오차(균일한 양자화 오차)를 유발하는 특수성을 갖는다. 역 양자화를 수행할 때, 역 양자화된 가중된 LSF 벡터들에 적용되는 역 가중 또한 확실하게 양자화 오차에 적용된다. 따라서, 원래의 균일한 양자화 오차는 양자화된 LSF 벡터들, 보다 작은 양자화 오차를 얻는 보다 더 민감한 LSF 벡터들 및 보다 큰 양자화 오차를 얻는 보다 덜 민감한 LSF 벡터들간에 분산된다. 결과적으로, 스펙트럼 왜곡에 대한 양자화 오차의 영향은 최소화된다.
참조문헌 [1]에서 설명되는 바와 같이, RE8 양자화기는 고정된, 그리고 미리 결정된 양자화를 사용한다. 결과적으로, 서브 벡터를 인코딩하는데 요구되는 비트 레이트는 이 서브 벡터의 진폭에 따라 증가한다.
스케일링 인자 W는 가중된 LSF 벡터들의 진폭을 조절한다. 따라서, 스케일링 인자 W는 또한 LSF 벡터를 양자화하는데 필요한 비트 레이트 및 평균 스펙트럼 왜곡 모두를 조절한다.
제1연산: 격자
RE
8
에서 가장 가까운 이웃 찾기
이 제1연산에서, 8차원 서브-벡터 Bk는 그것의 양자화된 버전인 를 생성하기 위하여, 격자 RE8의 포인트로서 반올림된다. 양자화 절차를 살펴보기 전에, 이 격자의 속성들을 살펴볼 필요가 있다. 격자 RE8은 다음과 같이 정의된다.
이는 격자 2D8 및 격자 2D8가 벡터 (1, 1, 1, 1, 1, 1, 1, 1)에 의해 쉬프트된 버전의 합집합이다. 따라서, 격자 RE8에서 가장 가까운 이웃에 대한 탐색은, 격자 2D8에서의 가장 가까운 이웃에 대한 탐색, 그 후 격자 2D8+(1, 1, 1, 1, 1, 1, 1, 1)에서의 가장 가까운 이웃에 대한 탐색, 그리고 마지막으로 이 두 격자 포인트 중 가장 최선을 선택하는 것과 동일하다. 격자 2D8은 인자 2에 의해 스케일링된 격자 D8인데, 격자 D8은 다음과 같이 정의된다.
즉, 격자 D8의 모든 포인트들은 모든 컴포넌트들의 합이 짝수라는 제약조건을 갖는 정수들(integers)이다. 이는 또한 격자 2D8의 포인트의 컴포넌트들의 합이 4의 정수배임을 의미한다.
이러한 격자 RE8의 정의로부터, 격자 RE8의 모든 격자 포인트들 중에서 8차원 서브-벡터 Bk의 가장 가까운 이웃을 탐색하기 위한 빠른 알고리즘을 전개하는 것은 간단하다. 이는 다음의 연산들을 적용함으로써 이루어질 수 있다. 서브-벡터 Bk의 컴포넌트들은 부동 소수점 값들이며, 양자화의 결과인 는 정수들의 벡터가 될 것이다.
5. 만약 S가 4의 정수배가 아니라면(음수도 가능), 그것의 컴포넌트들 중 하나를 다음과 같이 수정함
10. 만약 S가 4의 정수배가 아니라면(음수도 가능), 그것의 컴포넌트들 중 하나를 다음과 같이 수정함
제2연산: 인덱스들의 계산
제1연산에서, 각각의 8차원 서브-벡터 Bk는 격자 RE8의 포인트로 반올림되었다. 그 결과는 , 즉 Bk의 양자화된 버전이다. 본 제2연산에서, 디코더로의 전송을 위해 인덱스가 각각의 ck에 대하여 계산된다. 이 인덱스의 계산은 다음과 같이 수행된다.
격자 RE8에서 주어진 포인트에 대한 인덱스의 계산은 두 개의 기본 원리에 기반한다.
1. 격자 RE8의 모든 포인트들은 m=0, 1, 2, 3, ...인 반지름 의 동심구(concentric spheres)에 위치하며, 주어진 구 상의 각 격자 포인트는 리더(leaders)로 불리는 레퍼런스 포인트들의 좌표들을 치환함으로써 생성될 수 있다. 구 상에 위치하는 격자 포인트들의 전체 수에 비해, 구 상에는 매우 적은 수의 리더들이 존재한다. 주어진 수 m까지의 구들만을 포함함으로써, 서로 다른 비트 레이트의 코드북들이 구성될 수 있다. 보다 자세한 내용은 참고문헌 [6]을 보면 되는데, 여기에서는 0, 4, 8, 12, 16 및 20비트들로 코드북 Q0, Q1, Q2, Q3, Q4 및 Q5가 각각 구성된다. 따라서, 코드북 Qn은 해당 코드북에서 임의의 포인트를 나타내기 위하여 4n비트를 필요로 한다.
2. 기본 코드북 C(즉, 수 m까지의 구들의 주어진 집합으로부터의 모든 격자 포인트들을 포함하는 코드북)로부터, 기본 코드북 C의 요소들에 인자 M을 곱하고, 보로노이 확장(Voronoi extecsion)으로 불리는 제2단계 코드북을 더함으로써 확장된 코드북이 생성될 수 있다. 이러한 구성은 에 의해 주어지는데, 여기서 M은 스케일 요소이고, z는 기본 코드북의 포인트이며, 는 보로노이 확장이다. 그 확장은 임의의 포인트 가 또한 격자 RE8의 포인트가 되는 방법으로 계산된다. 확장된 코드북은 기본 코드북보다도 원점으로부터 보다 더 확장하는 격자 포인트들을 포함한다.
이러한 경우에서, LPC 양자화기의 기본 코드북 C는 참고문헌 [6]의 코드북 Q0, Q2, Q3 또는 Q4 중 하나일 수 있다. 주어진 격자 포인트 ck가 이 기본 코드북들에 포함되지 않을 때, 이 때 오직 Q3 또는 Q4를 사용하여, 보로노이 확장이 적용된다. 여기서, 이지만 임을 유념한다.
그리고 나서, 제1연산에서 획득된, 각 격자 포인트 ck에 대한 인덱스의 계산이 다음 연산들을 따라 수행된다.
c k 가 기본 코드북 C에 있는지 확인한다. 이는 ck가 참고문헌 [6]의 코드북 Q0, Q2, Q3 또는 Q4의 요소인지 확인함을 의미한다.
- 만약 ck가 기본 코드북 C의 요소이면, ck를 인코딩하기 위해 사용되는 인덱스는 그에 따라 코드북 넘버 nk에 코드북 Qnk의 코드벡터 ck의 인덱스 Ik를 더한 값이 된다. 코드북 넘버 nk는 제3연산에서 기술되는 바와 같이 인코딩된다. 인덱스 Ik는 코드벡터 ck의 순위, 다시 말하면 ck를 획득하기 위한 특정 리더에 적용되는 치환(참고문헌 [7] 참조)을 나타낸다. 만약 nk=0 이면, Ik는 아무 비트도 사용하지 않는다. 그렇지 않으면, 인덱스 Ik는 4nk비트를 사용한다.
- 만약 ck가 기본 코드북 C에 없으면, 이 때 오직 Q3 또는 Q4를 기본 코드북으로 사용하여, 다음의 서브-연산들을 통해 보로노이 확장이 적용된다.
V0 확장 차수 r=1로, 스케일 인자 M=2r=2로 설정한다.
V1 격자 포인트 ck의 보로노이 인덱스 k를 계산한다. 보로노이 인덱스 k는 확장 차수 r 및 스케일 요소 M에 의존한다. 보로노이 인덱스는 모듈로(modulo) 연산들을 통해 계산되는데, 그로 인해 k는 스케일링되고 치환된 보로노이 영역에서 ck의 상대적인 위치에 의존한다.
여기서 G는 생성 매트릭스(generator matrix)이고, 는 컴포넌트별(component-wise) 모듈로-M 연산이다. 따라서, 보로노이 인덱스 k는 0 부터 M-1 사이에 포함되는 각 컴포넌트를 갖는 정수의 벡터이다.
V3 차분 벡터 를 계산한다. 이 차분 벡터 w는 언제나 스케일링된 격자 mΛ에 속하는데, 여기서 Λ는 격자 RE8이다. 를 계산하는데, 다시 말해서 차분 벡터 w에 대하여 역 스케일링을 적용한다. w는 MΛ에 속하므로 코드벡터 z는 격자 Λ에 속한다.
V4 z가 기본 코드북 C에(즉, Q3 또는 Q4에) 있는지 확인한다.
만약 z가 기본 코드북 C에 없다면, 확장 차수 r을 1 증가시키고, 스케일 인자 M에 2를 곱하며, 서브-연산 V1으로 돌아간다. 그렇지 않고, z가 기본 코드북 C에 있다면, ck의 인덱스를 인코딩할만큼 충분히 큰 확장 차수 r 및 스케일링 인자 M=2r가 구해진다. 그 인덱스는 1) 이하에서 정의되는 1진 코드로서의 코드북 넘버 nk; 2) 대응하는 기본 코드북(Q3 또는 Q4중 하나)의 z의 순위 Ik; 및 3) 서브-연산 V1에서 계산된 보로노이 인덱스 벡터 k의 8개 인덱스들―여기서, 각 인덱스들은 정확히 r비트를 필요로 함(r은 서브-연산 V0에서 설정되는 보로노이 확장 차수)―의 세 부분으로 형성된다. 코드북 넘버 nk는 제3연산에서 기술되는 바와 같이 인코딩된다.
격자 포인트 ck는 다음과 같이 기술된다.
제3연산: 코드북 넘버들의 가변 길이 코딩
코드북 넘버들 nk는 표 3에 나타난 바와 같이, LPC 필터들의 위치 및 양자화 모드에 의존하는 가변-길이 코드를 사용하여 인코딩된다. 표 3은 코드북 넘버들 nk에 대한 코딩 모드들을 나타낸다.
nk 모드 0 및 3:
코드북 넘버 nk는 다음과 같이 가변 길이 코드로 인코딩된다.
Q2 → nk에 대한 코드는 00
Q3 → nk에 대한 코드는 01
Q4 → nk에 대한 코드는 10
다른 경우: nk에 대한 코드는 11이고,
Q5 → 0
Q6 → 10
Q0 → 110
Q7 → 1110
Q8 → 11110
등이다.
nk 모드 1:
코드북 넘버 nk는 다음과 같이 1진 코드로 인코딩된다.
Q0 → nk에 대한 1진 코드는 0
Q2 → nk에 대한 1진 코드는 10
Q3 → nk에 대한 1진 코드는 110
Q4 → nk에 대한 1진 코드는 1110
nk 모드 2:
코드북 넘버 nk는 다음과 같이 가변 길이 코드로 인코딩된다.
Q2 → nk에 대한 코드는 00
Q3 → nk에 대한 코드는 01
Q4 → nk에 대한 코드는 10
다른 경우: nk에 대한 코드는 11이고,
Q0 → 0
Q5 → 10
Q6 → 110
등이다.
양자화
모드
결정
각 LSF 벡터에 대하여, 표 2에 기술된 바와 같이 모든 가능한 절대 및 차분 양자화 모드들이 각각 시험되고, 예를 들어, 최소의 비트 수를 필요로하는 양자화 모드가 선택된다. 인코딩된 양자화 모드 및 대응하는 양자화 인덱스들의 집합은 디코더로 전송된다.
이전의 기술에서 언급된 바와 같이, 코더에서 디코더로 전송되는 양자화된 LPC 필터들의 실제 수는 고정된 것이 아니며, 코더에서 행해지는 ACELP/TCX 결정에 의존한다. 예를 들어, 긴 TCX(TCX1024)는 단지 양자화된 필터 LPC4의 전송만을 필요로 하는 반면에, ACELP 또는 짧은 TCX(TCX256)와 관련된 임의의 조합은 LPC1 부터 LPC4까지 4개의 모든 양자화된 LPC 필터들의 전송을 필요로 한다. ACELP/TCX 모드 구성에 의해 요구되는 양자화된 LPC 필터들만이 실제로 전송된다.
대수적 벡터 양자화기의 디코딩 프로세스
전술한 바와 같이, 비트 스트림 내에서 코딩된 양자화된 LPC 필터들의 실제 수는 수퍼-프레임의 ACELP/TCX 모드 조합에 의존한다. ACELP/TCX 모드 조합은 비트 스트림으로부터 추출되고, 수퍼-프레임을 구성하는 4개 프레임들 각각의 코딩 모드들을 mod[k] (k=0 에서 3)로 결정한다. 모드 값은 ACELP에 대하여 0, TCX256에 대하여 1, TCX512에 대하여 2, TCX1024에 대하여 3이다.
수퍼-프레임의 1에서 4개의 양자화된 LPC 필터들에 더하여, 전술한 바와 같이, 선형-예측 기반 코덱을 이용하여 코딩된 각 세그먼트의 첫 번째 수퍼-프레임에 대하여 선택적인 양자화된 필터 LPC0이 전송된다.
비트 스트림에서 양자화된 LPC 필터들이 일반적으로 발견되는 순서는 LPC4, 선택적인 LPC0, LPC2, LPC1 및 LPC3 순이다.
비트 스트림 내에서 주어진 LPC 필터의 존재에 대한 조건은 표 4에 요약되어 있다. 표 4는 비트 스트림 내에서 주어진 LPC 필터의 존재에 대한 조건을 나타낸다.
도 9는 디코딩 프로세스를 요약하는 도식적 블록도이다.
동작(901) 및 동작(902): 디코더는 비트 스트림을 수신하고 수신된 비트 스트림으로부터 ACELP/TCX 모드 조합에 의해 요구되는 양자화된 LPC 필터들 각각에 대응하는 양자화 인덱스들을 추출하기 위한 수단, 예를 들면 디멀티플렉서를 포함한다. 주어진 양자화된 LPC 필터에 대하여, 양자화 모드의 결정기는 코더로부터 수신된 비트 스트림으로부터 양자화 모드와 관련된 인덱스 또는 정보를 추출하며, 표 2에 나타난 바와 같이 양자화 모드가 절대 또는 차분 양자화 모드인지 결정한다.
동작(903) 및 동작(905): 동작(901) 및 동작(902)이 양자화 모드가 절대 양자화 모드인 것으로 결정하면, 추출기는 비트 스트림으로부터 스토캐스틱 VQ-양자화된 1단계 근사에 대응하는 인덱스 또는 인덱스들을 추출한다(동작(903)). 계산기는 그 후 역 양자화(동작(905))를 통해 1단계 근사를 계산한다.
동작(904) 및 동작(905): 동작(901) 및 동작(902)이 양자화 모드가 차분 양자화 모드인 것(절대 양자화 모드가 아님)으로 결정하면, 추출기는 비트 스트림으로부터 복수의 가능한 레퍼런스들 중에서의 레퍼런스, 예를 들면 레퍼런스 LPV 벡터를 나타내는 인덱스들 또는 정보를 추출한다(동작(904)). 계산기는 그 후 이 정보로부터 표 2를 참조하여 기술된 바와 같이 1단계 근사를 계산한다(동작(905)).
동작(906)에서, VQ 정보의 추출기는 코더로부터 수신된 비트 스트림으로부터 가변 비트 레이트 VQ 정보, 예를 들면 AVQ 정보를 추출한다. 보다 구체적으로, 비제한적인 예시로서, 두 개의 잔여 LSF 서브-벡터들 에 대한 AVQ 정보가 비트 스트림으로부터 추출된다. AVQ 정보는 일반적으로 두 개의 인코딩된 코드북 넘버들 및 대응하는 AVQ 인덱스들을 포함한다. 단지 예외는 필터 LPC1이 (양자화된 필터 LPC0+양자화된 필터 LPC2)/2에 관하여 차분적으로 양자화될 때인데, 이는 이러한 경우 비트 스트림에 AVQ 정보가 존재하지 않기 때문이다. 후자의 예외의 경우, 양자화된 LSF 벡터(909)가 동작(905)의 1단계 근사으로서 출력된다.
동작(907): 역 양자화, 또는 역 가중 및 AVQ 기여(contribution)의 복구를 수행하기 위해, 역 대수적 벡터 양자화기는 동작(906)으로부터 추출된 AVQ 정보를 수신한다.
AVQ
인덱스들의 디코딩
LPC 필터들의 디코딩은 추출된 AVQ 정보, 예를 들면 가중된 잔여 LSF 벡터의 양자화된 서브-벡터 각각을 기술하는 AVQ 파라메터들의 디코딩을 수반한다. 전술한 예시에서, 각 서브-벡터 Bk는 8차원을 갖는다. 각 서브-벡터 Bk에 대한 AVQ 파라메터들은 전술한 대수적 벡터 양자화의 제2연산에서 기술된다. 각각의 양자화된 서브-벡터 에 대하여, 2진 인덱스들의 세 집합이 코더에 의해 디코더로 송신된다.
a) 전술한 대수적 벡터 양자화의 제3연산에서 기술된 바와 같이 엔트로피 코드를 이용하여 전송되는, 코드북 넘버 nk;
b) 격자 포인트 z를 획득하기 위해 특정 리더(전술한 대수적 벡터 양자화의 제2연산 참조)에 적용되어야 하는 치환이 무엇인지 나타내는, 기본 코드북에서 선택된 격자 포인트 z의 순위 Ik; 및
c) 만약 양자화된 서브-벡터 (격자 RE8의 격자 포인트)가 기본 코드북에 없다면, 전술한 대수적 벡터 양자화의 제2연산의 서브-연산 V1에서 계산된, 보로노이 확장 인덱스 벡터 k의 8개 인덱스들. 보로노이 확장 인덱스들로부터, 확장 벡터 는 참고문헌 [8]에 의해 교시되는 바와 같이 계산될 수 있다. 인덱스 벡터 k의 각 컴포넌트의 비트 수는, 인덱스 nk의 코드 값으로부터 획득될 수 있는 확장 차수 r에 의해 주어진다. 보로노이 확장의 스케일링 인자 M은 M=2r에 의해 주어진다.
그리고 나서, 스케일링 인자 M, 보로노이 확장 벡터 (격자 RE8의 격자 포인트) 및 기본 코드북의 격자 포인트 z(격자 RE8의 격자 포인트)로부터, 각각의 양자화된 스케일링된 서브-벡터 가 다음 관계식을 이용하여 계산될 수 있다.
보로노이 확장이 없을 때(즉, nk<5, M=1 이고 z=0), 기본 코드북은 참고문헌 [6]의 코드북 Q0, Q2, Q3 또는 Q4 중 하나이다. 그러면 벡터 k를 전송하기 위해 비트가 요구되지 않는다. 그렇지 않다면, 가 충분히 크기 때문에 보로노이 확장이 사용되며, 참고문헌 [6]의 Q3 또는 Q4가 기본 코드북으로서 사용된다. Q3 또는 Q4 중의 선택은 전술한 대수적 벡터 양자화의 제2연산에서 기술된 바와 같이, 코드북 넘버 값 nk를 포함한다.
동작(908): 양자화된 LSF 벡터(909)를 재구성하고 복구하기 위하여, 덧셈기는 동작(905)의 1단계 근사를 동작(907)의 역 가중된 AVQ 기여에 합산한다.
비록 본 발명이 앞선 기술에서 그것의 예시적인 실시예들에 의하여 정의되고 있지만, 이러한 실시예들은 첨부되는 청구항들의 범위 내에서, 본 발명의 의도와 본질을 벗어나지 않으면서, 자유롭게 변형될 수 있다.
Claims (34)
- 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 방법에 있어서,
절대 양자화를 이용하여 상기 LPC 필터들 중 하나를 먼저 양자화하는 단계; 및
상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하여 상기 다른 LPC 필터들을 양자화하는 단계를
포함하는 LPC 필터 양자화 방법.
- 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 방법에 있어서,
항상 디코더로 전송되는 LPC 필터들 중 하나를 절대 양자화를 이용하여 먼저 양자화하는 단계; 및
상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하여 상기 다른 LPC 필터들을 양자화하는 단계를
포함하는 LPC 필터 양자화 방법.
- 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 방법에 있어서,
상기 시퀀스의 마지막 프레임 동안에 계산되는 필터 LPC마지막를 포함하는 상기 시퀀스의 각 프레임 동안에 상기 LPC 필터들 중 하나가 계산되고,
절대 양자화를 이용하여 상기 필터 LPC마지막를 먼저 양자화하는 단계; 및
상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하여 상기 다른 LPC 필터들을 양자화하는 단계를
포함하는 LPC 필터 양자화 방법.
- 수퍼-프레임에서 LPC 필터들을 양자화하기 위한 방법에 있어서,
제1프레임―여기서, 상기 제1프레임 동안 필터 LPC1이 계산됨―, 제2프레임―여기서, 상기 제2프레임 동안 필터 LPC2가 계산됨―, 제3프레임―여기서, 상기 제3프레임 동안 필터 LPC3이 계산됨―, 및 제4프레임―여기서, 상기 제4프레임 동안 필터 LPC4가 계산됨―의 시퀀스를 포함하고,
상기 LPC 필터 양자화 방법은,
절대 양자화를 이용하여 상기 필터 LPC4를 양자화하는 단계;
상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 상기 필터 LPC2를 양자화하는 단계;
상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 상기 필터 LPC1을 양자화하는 단계; 및
상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 상기 필터 LPC3을 양자화하는 단계를
포함하는 LPC 필터 양자화 방법.
- 제4항에 있어서,
1개 프레임의 지속기간(duration)을 커버하는(covering) 적어도 하나의 제1 코딩 모드, 2개 프레임의 지속기간을 커버하는 제2 코딩 모드, 및 4개 프레임의 지속기간을 커버하는 제3 코딩 모드를 포함하는, 상기 수퍼-프레임을 코딩하기 위한 코딩 모드들의 집합을 이용하는 단계를
포함하는 LPC 필터 양자화 방법.
- 제5항에 있어서,
상기 적어도 하나의 제1 코딩 모드는 ACELP 및 TCX256을 포함하고,
상기 제2 코딩 모드는 TCX512이고,
상기 제3 코딩 모드는 TCX1024인
LPC 필터 양자화 방법.
- 제5항에 있어서,
상기 양자화되는 필터 LPC4를 디코더로 전송하는 단계;
만약 상기 수퍼-프레임의 상기 제1, 제2, 제3 및 제4 프레임들이 상기 제3 코딩 모드를 이용하여 코딩되지 않는다면, 상기 양자화되는 필터 LPC2를 상기 디코더로 전송하는 단계;
만약 상기 수퍼-프레임의 상기 제1 및 제2 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 양자화되는 필터 LPC1을 상기 디코더로 전송하는 단계; 및
만약 상기 수퍼-프레임의 상기 제3 및 제4 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 양자화되는 필터 LPC3을 상기 디코더로 전송하는 단계를
포함하는 LPC 필터 양자화 방법.
- 제4항에 있어서,
상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화를 이용하여 상기 필터 LPC3을 양자화하는 단계는
(양자화되는 필터 LPC2 + 양자화되는 필터 LPC4)/2와 관련된 상기 필터 LPC3을 차분적으로 양자화하는 단계를
포함하는 LPC 필터 양자화 방법.
- 수퍼-프레임에서 LPC 필터들을 양자화하기 위한 방법에 있어서,
제1프레임―여기서, 상기 제1프레임 동안 필터 LPC1이 계산됨―, 제2프레임―여기서, 상기 제2프레임 동안 필터 LPC2가 계산됨―, 제3프레임―여기서, 상기 제3프레임 동안 필터 LPC3이 계산됨―, 및 제4프레임―여기서, 상기 제4프레임 동안 필터 LPC4가 계산됨―의 시퀀스를 포함하고,
상기 LPC 필터 양자화 방법은,
절대 양자화를 이용하여 상기 필터 LPC4를 양자화하는 단계;
상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 상기 필터 LPC2를 양자화하는 단계;
상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 상기 필터 LPC1을 양자화하는 단계; 및
상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 상기 필터 LPC3을 양자화하는 단계를 포함하되,
이전의 수퍼-프레임 동안 계산되는 마지막 LPC 필터에 대응하는 필터 LPC0를 양자화하는 단계를 더 포함하고,
상기 필터 LPC1을 양자화하는 단계는
상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC0 및 LPC2 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 단계를
포함하는 LPC 필터 양자화 방법.
- 제5항에 있어서,
모든 필터들 LPC1, LPC2, LPC3 및 LPC4가 양자화된 이후, 상기 수퍼-프레임의 제1, 제2, 제3 및 제4 프레임들을 코딩하기 위한 상기 적어도 하나의 제1 코딩 모드, 상기 제2 코딩 모드 및 상기 제3 코딩 모드 중에서 적어도 하나의 코딩 모드를 선택하는 단계를
포함하는 LPC 필터 양자화 방법.
- 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 장치에 있어서,
절대 양자화를 이용하여 상기 LPC 필터들 중 하나를 먼저 양자화하기 위한 절대 양자화기; 및
상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하는 상기 다른 LPC 필터들의 적어도 하나의 양자화기를
포함하는 LPC 필터 양자화 장치.
- 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 장치에 있어서,
항상 디코더로 전송되는 상기 LPC 필터들 중 하나를 절대 양자화를 이용하여 먼저 양자화하는 절대 양자화기; 및
상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하는 상기 다른 LPC 필터들의 양자화기를
포함하는 LPC 필터 양자화 장치.
- 프레임들의 시퀀스를 포함하는 수퍼-프레임에서, 상기 시퀀스의 상기 프레임들 동안에 계산되는 LPC 필터들을 양자화하기 위한 장치에 있어서,
상기 시퀀스의 마지막 프레임 동안에 계산되는 필터 LPC마지막를 포함하는 상기 시퀀스의 각 프레임 동안에 상기 LPC 필터들 중 하나가 계산되고,
상기 LPC 필터 양자화 장치는,
절대 양자화를 이용하여 상기 필터 LPC마지막를 먼저 양자화하는 절대 양자화기; 및
상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하는 상기 다른 LPC 필터들의 양자화기를
포함하는 LPC 필터 양자화 장치.
- 수퍼-프레임에서 LPC 필터들을 양자화하기 위한 장치에 있어서,
제1프레임―여기서, 상기 제1프레임 동안 필터 LPC1이 계산됨―, 제2프레임―여기서, 상기 제2프레임 동안 필터 LPC2가 계산됨―, 제3프레임―여기서, 상기 제3프레임 동안 필터 LPC3이 계산됨―, 및 제4프레임―여기서, 상기 제4프레임 동안 필터 LPC4가 계산됨―의 시퀀스를 포함하고,
상기 LPC 필터 양자화 장치는,
절대 양자화를 이용하는 상기 필터 LPC4의 양자화기;
상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 상기 필터 LPC2의 양자화기;
상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 상기 필터 LPC1의 양자화기; 및
상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 상기 필터 LPC3의 양자화기를
포함하는 LPC 필터 양자화 장치.
- 제14항에 있어서,
1개 프레임의 지속기간(duration)을 커버하는(covering) 적어도 하나의 제1 코딩 모드, 2개 프레임의 지속기간을 커버하는 제2 코딩 모드, 및 4개 프레임의 지속기간을 커버하는 제3 코딩 모드를 포함하는 코딩 모드들의 집합을
포함하는 LPC 필터 양자화 장치.
- 제15항에 있어서,
상기 적어도 하나의 제1 코딩 모드는 ACELP 및 TCX256을 포함하고,
상기 제2 코딩 모드는 TCX512이고,
상기 제3 코딩 모드는 TCX1024인
LPC 필터 양자화 장치.
- 제15항에 있어서,
디코더로의 상기 양자화되는 필터 LPC4의 전송기를 포함하되,
만약 상기 수퍼-프레임의 상기 제1, 제2, 제3 및 제4 프레임들이 상기 제3 코딩 모드를 이용하여 코딩되지 않는다면, 상기 전송기는 상기 양자화되는 필터 LPC2를 상기 디코더로 전송하고;
만약 상기 수퍼-프레임의 상기 제1 및 제2 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 전송기는 상기 양자화되는 필터 LPC1를 상기 디코더로 전송하고; 및
만약 상기 수퍼-프레임의 상기 제3 및 제4 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 전송기는 상기 양자화되는 필터 LPC3를 상기 디코더로 전송하는
LPC 필터 양자화 장치.
- 제14항에 있어서,
상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화를 이용하는 상기 필터 LPC3의 상기 양자화기는
(양자화되는 필터 LPC2 + 양자화되는 필터 LPC4)/2와 관련된 상기 필터 LPC3을 차분적으로 양자화하는
LPC 필터 양자화 장치.
- 수퍼-프레임에서 LPC 필터들을 양자화하기 위한 장치에 있어서,
제1프레임―여기서, 상기 제1프레임 동안 필터 LPC1이 계산됨―, 제2프레임―여기서, 상기 제2프레임 동안 필터 LPC2가 계산됨―, 제3프레임―여기서, 상기 제3프레임 동안 필터 LPC3이 계산됨―, 및 제4프레임―여기서, 상기 제4프레임 동안 필터 LPC4가 계산됨―의 시퀀스를 포함하고,
상기 LPC 필터 양자화 장치는,
절대 양자화를 이용하는 상기 필터 LPC4의 양자화기;
상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 상기 필터 LPC2의 양자화기;
상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 상기 필터 LPC1의 양자화기; 및
상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는 상기 필터 LPC3의 양자화기를 포함하되,
이전의 수퍼-프레임 동안 계산되는 마지막 LPC 필터에 대응하는 필터 LPC0의 양자화기를 더 포함하고,
상기 필터 LPC1의 상기 양자화기는
상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC0 및 LPC2 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하는
LPC 필터 양자화 장치.
- 제15항에 있어서,
모든 필터들 LPC1, LPC2, LPC3 및 LPC4가 양자화된 이후, 상기 수퍼-프레임의 제1, 제2, 제3 및 제4 프레임들을 코딩하기 위한 상기 적어도 하나의 제1 코딩 모드, 상기 제2 코딩 모드 및 상기 제3 코딩 모드 중에서 적어도 하나의 코딩 모드의 선택기를
포함하는 LPC 필터 양자화 장치.
- 각각 LPC 필터와 관련되는 프레임들의 시퀀스를 포함하는 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하기 위한 방법에 있어서,
상기 LPC 필터들 중 하나는 절대 양자화를 이용하여 먼저 양자화되고 다른 LPC 필터들은 그 후 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 상기 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하여 양자화되고,
상기 적어도 하나의 LPC 필터를 역 양자화하는 방법은
적어도 상기 먼저 양자화된 LPC 필터를 수신하는 단계;
절대 역 양자화를 이용하여 상기 먼저 양자화된 LPC 필터를 역 양자화하는 단계; 및
만약 상기 먼저 양자화된 LPC 필터가 아닌 임의의 양자화된 LPC 필터가 수신되면, 적어도 하나의 이전에 수신된 양자화된 LPC 필터와 관련된 차분 역 양자화 및 절대 역 양자화 중에서의 선택에 따라 상기 양자화된 LPC 필터를 역 양자화하는 단계를
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 제21항에 있어서,
상기 수퍼-프레임은
필터 LPC1과 관련되는 제1프레임, 필터 LPC2와 관련되는 제2프레임, 필터 LPC3과 관련되는 제3프레임, 및 필터 LPC4와 관련되는 제4프레임의 시퀀스를 포함하고,
상기 필터 LPC4는 절대 양자화를 이용하여 먼저 양자화되는 LPC 필터이고, 상기 필터 LPC2는 상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC1은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC3은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되는
적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하는 방법에 있어서,
필터 LPC1과 관련되는 제1프레임, 필터 LPC2와 관련되는 제2프레임, 필터 LPC3과 관련되는 제3프레임, 및 필터 LPC4와 관련되는 제4프레임의 시퀀스를 포함하고,
상기 필터 LPC4는 절대 양자화를 이용하여 먼저 양자화되는 LPC 필터이고, 상기 필터 LPC2는 상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC1은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC3은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고,
상기 수퍼-프레임은
1개 프레임의 지속기간(duration)을 커버하는(covering) 적어도 하나의 제1 코딩 모드, 2개 프레임의 지속기간을 커버하는 제2 코딩 모드, 및 4개 프레임의 지속기간을 커버하는 제3 코딩 모드를 포함하는 코딩 모드들의 집합을 이용하여 코딩되고,
상기 적어도 하나의 LPC 필터를 역 양자화하는 방법은
먼저 양자화되는 필터 LPC4를 수신하는 단계;
만약 상기 수퍼-프레임의 상기 제1, 제2, 제3 및 제4 프레임들이 상기 제3 코딩 모드를 이용하여 코딩되지 않는다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제1인덱스 및 상기 양자화되는 필터 LPC2를 수신하는 단계;
만약 상기 수퍼-프레임의 상기 제1 및 제2 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제2인덱스 및 상기 양자화되는 필터 LPC1을 수신하는 단계;
만약 상기 수퍼-프레임의 상기 제3 및 제4 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제3인덱스 및 상기 양자화되는 필터 LPC3을 수신하는 단계;
절대 역 양자화를 이용하여 먼저 양자화되는 LPC 필터를 역 양자화하는 단계;
만약 상기 양자화되는 필터 LPC2가 수신되면, 상기 제1인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC2를 역 양자화하는 단계;
만약 상기 양자화되는 필터 LPC1이 수신되면, 상기 제2인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC1을 역 양자화하는 단계; 및
만약 상기 양자화되는 필터 LPC3이 수신되면, 상기 제3인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC3을 역 양자화하는 단계를
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 제23항에 있어서,
1개 프레임의 지속기간을 커버하는 상기 적어도 하나의 제1 코딩 모드는 ACELP 및 TCX256을 포함하고,
2개 프레임의 지속기간을 커버하는 상기 제2 코딩 모드는 TCX512이고,
4개 프레임의 지속기간을 커버하는 상기 제3 코딩 모드는 TCX1024인
적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 제23항에 있어서,
상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 역 양자화를 이용하여 상기 필터 LPC3을 역 양자화하는 단계는
(양자화되는 필터 LPC2 + 양자화되는 필터 LPC4)/2와 관련된 상기 필터 LPC3을 역 양자화하는 단계를
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하는 방법에 있어서,
필터 LPC1과 관련되는 제1프레임, 필터 LPC2와 관련되는 제2프레임, 필터 LPC3과 관련되는 제3프레임, 및 필터 LPC4와 관련되는 제4프레임의 시퀀스를 포함하고,
상기 필터 LPC4는 절대 양자화를 이용하여 먼저 양자화되는 LPC 필터이고, 상기 필터 LPC2는 상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC1은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC3은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고,
상기 수퍼-프레임은
1개 프레임의 지속기간(duration)을 커버하는(covering) 적어도 하나의 제1 코딩 모드, 2개 프레임의 지속기간을 커버하는 제2 코딩 모드, 및 4개 프레임의 지속기간을 커버하는 제3 코딩 모드를 포함하는 코딩 모드들의 집합을 이용하여 코딩되고,
상기 적어도 하나의 LPC 필터를 역 양자화하는 방법은
먼저 양자화되는 필터 LPC4를 수신하는 단계;
만약 상기 수퍼-프레임의 상기 제1, 제2, 제3 및 제4 프레임들이 상기 제3 코딩 모드를 이용하여 코딩되지 않는다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제1인덱스 및 상기 양자화되는 필터 LPC2를 수신하는 단계;
만약 상기 수퍼-프레임의 상기 제1 및 제2 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제2인덱스 및 상기 양자화되는 필터 LPC1을 수신하는 단계;
만약 상기 수퍼-프레임의 상기 제3 및 제4 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제3인덱스 및 상기 양자화되는 필터 LPC3을 수신하는 단계;
절대 역 양자화를 이용하여 먼저 양자화되는 LPC 필터를 역 양자화하는 단계;
만약 상기 양자화되는 필터 LPC2가 수신되면, 상기 제1인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC2를 역 양자화하는 단계;
만약 상기 양자화되는 필터 LPC1이 수신되면, 상기 제2인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC1을 역 양자화하는 단계; 및
만약 상기 양자화되는 필터 LPC3dl 수신되면, 상기 제3인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC3을 역 양자화하는 단계를 포함하되,
이전의 수퍼-프레임 동안 계산되는 마지막 LPC 필터에 대응하는 양자화되는 필터 LPC0를 수신하는 단계를 더 포함하고,
상기 필터 LPC1을 역 양자화하는 단계는
상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC0 및 LPC2 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하는 단계를 포함하는
적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 제26항에 있어서,
상기 필터 LPC1을 역 양자화하는 단계는
상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC2 및 LPC0 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하는 단계를 포함하고,
비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로 스위칭될 때 상기 양자화되는 필터 LPC0을 디코더에서 추정하는 단계를
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 방법.
- 각각 LPC 필터와 관련되는 프레임들의 시퀀스를 포함하는 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하기 위한 장치에 있어서,
상기 LPC 필터들 중 하나는 절대 양자화를 이용하여 먼저 양자화되고 다른 LPC 필터들은 그 후 상기 LPC 필터들 중 적어도 하나의 이전에 양자화된 필터와 관련된 차분 양자화 및 절대 양자화 중에서 선택하여, 상기 다른 LPC 필터들마다, 제공하는 양자화 프로세스를 이용하여 양자화되고,
상기 적어도 하나의 LPC 필터를 역 양자화하는 장치는
적어도 상기 먼저 양자화된 LPC 필터를 수신하기 위한 수단;
절대 역 양자화를 이용하는 상기 먼저 양자화된 LPC 필터의 역 양자화기; 및
만약 상기 먼저 양자화된 LPC 필터가 아닌 임의의 양자화된 LPC 필터가 수신되면, 적어도 하나의 이전에 수신된 양자화된 LPC 필터와 관련된 차분 역 양자화 및 절대 역 양자화 중에서의 선택에 따르는 상기 양자화된 LPC 필터의 역 양자화기를
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 장치.
- 제28항에 있어서,
상기 수퍼-프레임은
필터 LPC1과 관련되는 제1프레임, 필터 LPC2와 관련되는 제2프레임, 필터 LPC3과 관련되는 제3프레임, 및 필터 LPC4와 관련되는 제4프레임의 시퀀스를 포함하고,
상기 필터 LPC4는 절대 양자화를 이용하여 먼저 양자화되는 LPC 필터이고, 상기 필터 LPC2는 상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC1은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC3은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되는
적어도 하나의 LPC 필터를 역 양자화하는 장치.
- 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하는 장치에 있어서,
필터 LPC1과 관련되는 제1프레임, 필터 LPC2와 관련되는 제2프레임, 필터 LPC3과 관련되는 제3프레임, 및 필터 LPC4와 관련되는 제4프레임의 시퀀스를 포함하고,
상기 필터 LPC4는 절대 양자화를 이용하여 먼저 양자화되는 LPC 필터이고, 상기 필터 LPC2는 상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC1은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC3은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고,
상기 수퍼-프레임은
1개 프레임의 지속기간(duration)을 커버하는(covering) 적어도 하나의 제1 코딩 모드, 2개 프레임의 지속기간을 커버하는 제2 코딩 모드, 및 4개 프레임의 지속기간을 커버하는 제3 코딩 모드를 포함하는 코딩 모드들의 집합을 이용하여 코딩되고,
상기 적어도 하나의 LPC 필터를 역 양자화하는 장치는,
먼저 양자화되는 필터 LPC4를 수신하는 수단;
만약 상기 수퍼-프레임의 상기 제1, 제2, 제3 및 제4 프레임들이 상기 제3 코딩 모드를 이용하여 코딩되지 않는다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제1인덱스 및 상기 양자화되는 필터 LPC2를 수신하기 위한 수단;
만약 상기 수퍼-프레임의 상기 제1 및 제2 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제2인덱스 및 상기 양자화되는 필터 LPC1을 수신하기 위한 수단;
만약 상기 수퍼-프레임의 상기 제3 및 제4 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제3인덱스 및 상기 양자화되는 필터 LPC3을 수신하기 위한 수단;
절대 역 양자화를 이용하는 먼저 양자화되는 LPC 필터의 역 양자화기;
만약 상기 양자화되는 필터 LPC2가 수신되면, 상기 제1인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC2를 역 양자화하기 위한 수단;
만약 상기 양자화되는 필터 LPC1이 수신되면, 상기 제2인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC1을 역 양자화하기 위한 수단; 및
만약 상기 양자화되는 필터 LPC3이 수신되면, 상기 제3인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC3을 역 양자화하기 위한 수단을
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 장치.
- 제30항에 있어서,
1개 프레임의 지속기간을 커버하는 상기 적어도 하나의 제1 코딩 모드는 ACELP 및 TCX256을 포함하고,
2개 프레임의 지속기간을 커버하는 상기 제2 코딩 모드는 TCX512이고,
4개 프레임의 지속기간을 커버하는 상기 제3 코딩 모드는 TCX1024인
적어도 하나의 LPC 필터를 역 양자화하는 장치.
- 제30항에 있어서,
상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 역 양자화를 이용하여 상기 필터 LPC3을 역 양자화하기 위한 수단은
(양자화되는 필터 LPC2 + 양자화되는 필터 LPC4)/2와 관련된 상기 필터 LPC3을 역 양자화하기 위한 수단을
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 장치.
- 수퍼-프레임에서 적어도 하나의 LPC 필터를 역 양자화하는 장치에 있어서,
필터 LPC1과 관련되는 제1프레임, 필터 LPC2와 관련되는 제2프레임, 필터 LPC3과 관련되는 제3프레임, 및 필터 LPC4와 관련되는 제4프레임의 시퀀스를 포함하고,
상기 필터 LPC4는 절대 양자화를 이용하여 먼저 양자화되는 LPC 필터이고, 상기 필터 LPC2는 상기 양자화되는 필터 LPC4와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC1은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고, 상기 필터 LPC3은 상기 양자화되는 필터 LPC2와 관련된 차분 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 양자화 및 절대 양자화로 구성되는 그룹으로부터 선택되는 양자화 모드를 이용하여 양자화되고,
상기 수퍼-프레임은
1개 프레임의 지속기간(duration)을 커버하는(covering) 적어도 하나의 제1 코딩 모드, 2개 프레임의 지속기간을 커버하는 제2 코딩 모드, 및 4개 프레임의 지속기간을 커버하는 제3 코딩 모드를 포함하는 코딩 모드들의 집합을 이용하여 코딩되고,
상기 적어도 하나의 LPC 필터를 역 양자화하는 장치는,
먼저 양자화되는 필터 LPC4를 수신하는 수단;
만약 상기 수퍼-프레임의 상기 제1, 제2, 제3 및 제4 프레임들이 상기 제3 코딩 모드를 이용하여 코딩되지 않는다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제1인덱스 및 상기 양자화되는 필터 LPC2를 수신하기 위한 수단;
만약 상기 수퍼-프레임의 상기 제1 및 제2 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제2인덱스 및 상기 양자화되는 필터 LPC1을 수신하기 위한 수단;
만약 상기 수퍼-프레임의 상기 제3 및 제4 프레임들이 상기 적어도 하나의 제1 코딩 모드를 이용하여 코딩된다면, 상기 절대 양자화 모드 및 상기 차분 양자화 모드 중 하나를 나타내는 제3인덱스 및 상기 양자화되는 필터 LPC3을 수신하기 위한 수단;
절대 역 양자화를 이용하는 먼저 양자화되는 LPC 필터의 역 양자화기;
만약 상기 양자화되는 필터 LPC2가 수신되면, 상기 제1인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC2를 역 양자화하기 위한 수단;
만약 상기 양자화되는 필터 LPC1이 수신되면, 상기 제2인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC1을 역 양자화하기 위한 수단; 및
만약 상기 양자화되는 필터 LPC3이 수신되면, 상기 제3인덱스가 나타내는 바와 같이, 상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터 LPC4와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC2 및 LPC4 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하여 상기 필터 LPC3을 역 양자화하기 위한 수단을 포함하되,
이전의 수퍼-프레임 동안 계산되는 마지막 LPC 필터에 대응하는 양자화되는 필터 LPC0를 수신하는 수단을 더 포함하고,
상기 필터 LPC1의 역 양자화기는
상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC0 및 LPC2 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하는
적어도 하나의 LPC 필터를 역 양자화하는 장치.
- 제33항에 있어서,
상기 필터 LPC1의 역 양자화기는
상기 양자화되는 필터 LPC2와 관련된 차분 역 양자화, 상기 양자화되는 필터들 LPC2 및 LPC0 모두와 관련된 차분 역 양자화 및 절대 역 양자화 중 하나를 이용하고,
비 LPC 기반 코딩 모드에서 LPC 기반 코딩 모드로 스위칭될 때 디코더에서의 상기 양자화되는 필터 LPC0의 추정기를
포함하는 적어도 하나의 LPC 필터를 역 양자화하는 장치.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12966908P | 2008-07-10 | 2008-07-10 | |
US61/129,669 | 2008-07-10 | ||
US20207509P | 2009-01-27 | 2009-01-27 | |
US61/202,075 | 2009-01-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110042303A KR20110042303A (ko) | 2011-04-26 |
KR101592968B1 true KR101592968B1 (ko) | 2016-02-11 |
Family
ID=41506638
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117002977A KR101604774B1 (ko) | 2008-07-10 | 2009-07-10 | 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법 |
KR1020117002983A KR101592968B1 (ko) | 2008-07-10 | 2009-07-10 | 수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117002977A KR101604774B1 (ko) | 2008-07-10 | 2009-07-10 | 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법 |
Country Status (17)
Country | Link |
---|---|
US (4) | US9245532B2 (ko) |
EP (3) | EP2301021B1 (ko) |
JP (2) | JP5710476B2 (ko) |
KR (2) | KR101604774B1 (ko) |
CN (2) | CN102119414B (ko) |
BR (1) | BRPI0915450B1 (ko) |
CA (5) | CA2972812C (ko) |
CY (3) | CY1119501T1 (ko) |
DK (3) | DK2301022T3 (ko) |
ES (3) | ES2645375T3 (ko) |
HK (2) | HK1153840A1 (ko) |
MX (1) | MX2011000363A (ko) |
NO (1) | NO2313887T3 (ko) |
PL (1) | PL2313887T3 (ko) |
PT (3) | PT2313887T (ko) |
RU (2) | RU2011104813A (ko) |
WO (3) | WO2010003254A1 (ko) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008107027A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications network |
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
US20110158189A1 (en) * | 2009-12-29 | 2011-06-30 | Industrial Technology Research Institute | Methods and Apparatus for Multi-Transmitter Collaborative Communications Systems |
KR101660843B1 (ko) | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
WO2011158485A2 (ja) * | 2010-06-14 | 2011-12-22 | パナソニック株式会社 | オーディオハイブリッド符号化装置およびオーディオハイブリッド復号装置 |
PL3079152T3 (pl) | 2010-07-02 | 2018-10-31 | Dolby International Ab | Dekodowanie audio z selektywnym późniejszym filtrowaniem |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
EP2761616A4 (en) * | 2011-10-18 | 2015-06-24 | Ericsson Telefon Ab L M | IMPROVED METHOD AND DEVICE FOR AN ADAPTIVE MULTIRATE CODEC |
US9208775B2 (en) * | 2013-02-21 | 2015-12-08 | Qualcomm Incorporated | Systems and methods for determining pitch pulse period signal boundaries |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
US9940942B2 (en) * | 2013-04-05 | 2018-04-10 | Dolby International Ab | Advanced quantizer |
JP6105159B2 (ja) | 2013-05-24 | 2017-03-29 | ドルビー・インターナショナル・アーベー | オーディオ・エンコーダおよびデコーダ |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104299614B (zh) * | 2013-07-16 | 2017-12-29 | 华为技术有限公司 | 解码方法和解码装置 |
US10970967B2 (en) * | 2014-09-24 | 2021-04-06 | Jcm American Corporation | Electronic voucher ticket system |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
WO2017162260A1 (en) * | 2016-03-21 | 2017-09-28 | Huawei Technologies Co., Ltd. | Adaptive quantization of weighted matrix coefficients |
US10366698B2 (en) | 2016-08-30 | 2019-07-30 | Dts, Inc. | Variable length coding of indices and bit scheduling in a pyramid vector quantizer |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
KR102697685B1 (ko) | 2017-12-19 | 2024-08-23 | 돌비 인터네셔널 에이비 | 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템 |
EP3729298A1 (en) * | 2017-12-19 | 2020-10-28 | Dolby International AB | Methods and apparatus systems for unified speech and audio decoding improvements |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003510644A (ja) * | 1999-09-22 | 2003-03-18 | マイクロソフト コーポレイション | スーパーフレーム構造のlpcハーモニックボコーダ |
Family Cites Families (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0443548B1 (en) * | 1990-02-22 | 2003-07-23 | Nec Corporation | Speech coder |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US5255339A (en) * | 1991-07-19 | 1993-10-19 | Motorola, Inc. | Low bit rate vocoder means and method |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
FI90477C (fi) * | 1992-03-23 | 1994-02-10 | Nokia Mobile Phones Ltd | Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään |
DE69328450T2 (de) * | 1992-06-29 | 2001-01-18 | Nippon Telegraph And Telephone Corp., Tokio/Tokyo | Verfahren und Vorrichtung zur Sprachkodierung |
JP3255189B2 (ja) | 1992-12-01 | 2002-02-12 | 日本電信電話株式会社 | 音声パラメータの符号化方法および復号方法 |
WO1994023426A1 (en) * | 1993-03-26 | 1994-10-13 | Motorola Inc. | Vector quantizer method and apparatus |
AU7960994A (en) * | 1993-10-08 | 1995-05-04 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
FI98163C (fi) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
JP3013698B2 (ja) | 1994-04-20 | 2000-02-28 | 松下電器産業株式会社 | ベクトル量子化符号化装置と復号化装置 |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
JP3235703B2 (ja) * | 1995-03-10 | 2001-12-04 | 日本電信電話株式会社 | ディジタルフィルタのフィルタ係数決定方法 |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5649051A (en) | 1995-06-01 | 1997-07-15 | Rothweiler; Joseph Harvey | Constant data rate speech encoder for limited bandwidth path |
JP3537008B2 (ja) | 1995-07-17 | 2004-06-14 | 株式会社日立国際電気 | 音声符号化通信方式とその送受信装置 |
TW321810B (ko) | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3094908B2 (ja) * | 1996-04-17 | 2000-10-03 | 日本電気株式会社 | 音声符号化装置 |
US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JP3707154B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | 音声符号化方法及び装置 |
US6154499A (en) * | 1996-10-21 | 2000-11-28 | Comsat Corporation | Communication systems using nested coder and compatible channel coding |
US6167375A (en) | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
TW408298B (en) | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
EP0907258B1 (en) * | 1997-10-03 | 2007-01-03 | Matsushita Electric Industrial Co., Ltd. | Audio signal compression, speech signal compression and speech recognition |
JP3842432B2 (ja) * | 1998-04-20 | 2006-11-08 | 株式会社東芝 | ベクトル量子化方法 |
US6507814B1 (en) * | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6823303B1 (en) * | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
FR2784218B1 (fr) * | 1998-10-06 | 2000-12-08 | Thomson Csf | Procede de codage de la parole a bas debit |
JP3343082B2 (ja) * | 1998-10-27 | 2002-11-11 | 松下電器産業株式会社 | Celp型音声符号化装置 |
US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
AU7486200A (en) | 1999-09-22 | 2001-04-24 | Conexant Systems, Inc. | Multimode speech encoder |
US6792405B2 (en) * | 1999-12-10 | 2004-09-14 | At&T Corp. | Bitstream-based feature extraction method for a front-end speech recognizer |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
JP2002055700A (ja) | 2000-08-11 | 2002-02-20 | Hitachi Kokusai Electric Inc | 音声信号符号復号化システム |
US7392179B2 (en) * | 2000-11-30 | 2008-06-24 | Matsushita Electric Industrial Co., Ltd. | LPC vector quantization apparatus |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
KR20020075592A (ko) * | 2001-03-26 | 2002-10-05 | 한국전자통신연구원 | 광대역 음성 부호화기용 lsf 양자화기 |
US7003454B2 (en) | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
US6584437B2 (en) | 2001-06-11 | 2003-06-24 | Nokia Mobile Phones Ltd. | Method and apparatus for coding successive pitch periods in speech signal |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6711027B2 (en) | 2001-07-23 | 2004-03-23 | Intel Corporation | Modules having paths of different impedances |
US7647223B2 (en) * | 2001-08-16 | 2010-01-12 | Broadcom Corporation | Robust composite quantization with sub-quantizers and inverse sub-quantizers using illegal space |
US7386447B2 (en) * | 2001-11-02 | 2008-06-10 | Texas Instruments Incorporated | Speech coder and method |
SE521600C2 (sv) * | 2001-12-04 | 2003-11-18 | Global Ip Sound Ab | Lågbittaktskodek |
JP4263412B2 (ja) * | 2002-01-29 | 2009-05-13 | 富士通株式会社 | 音声符号変換方法 |
US20040002856A1 (en) | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
JP4649208B2 (ja) * | 2002-07-16 | 2011-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオコーディング |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
CA2511516C (en) | 2002-12-24 | 2009-03-03 | Nokia Corporation | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100486732B1 (ko) | 2003-02-19 | 2005-05-03 | 삼성전자주식회사 | 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치 |
WO2004090864A2 (en) | 2003-03-12 | 2004-10-21 | The Indian Institute Of Technology, Bombay | Method and apparatus for the encoding and decoding of speech |
EP1618557B1 (en) | 2003-05-01 | 2007-07-25 | Nokia Corporation | Method and device for gain quantization in variable bit rate wideband speech coding |
FR2867649A1 (fr) | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FR2869151B1 (fr) * | 2004-04-19 | 2007-01-26 | Thales Sa | Procede de quantification d'un codeur de parole a tres bas debit |
JP4546464B2 (ja) * | 2004-04-27 | 2010-09-15 | パナソニック株式会社 | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
JP4871501B2 (ja) * | 2004-11-04 | 2012-02-08 | パナソニック株式会社 | ベクトル変換装置及びベクトル変換方法 |
PL1864101T3 (pl) | 2005-04-01 | 2012-11-30 | Qualcomm Inc | Systemy, sposoby i urządzenia do generowania górnopasmowego pobudzenia |
US7660358B2 (en) * | 2005-10-05 | 2010-02-09 | Lg Electronics Inc. | Signal processing using pilot based coding |
JP2007142547A (ja) | 2005-11-15 | 2007-06-07 | Oki Electric Ind Co Ltd | 符号化方法及び復号化方法とその符号器及び復号器 |
RU2462770C2 (ru) | 2007-03-02 | 2012-09-27 | Панасоник Корпорэйшн | Устройство кодирования и способ кодирования |
CN101110214B (zh) * | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
JP5419714B2 (ja) * | 2008-01-16 | 2014-02-19 | パナソニック株式会社 | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
-
2009
- 2009-07-10 PT PT97937692T patent/PT2313887T/pt unknown
- 2009-07-10 CA CA2972812A patent/CA2972812C/en active Active
- 2009-07-10 DK DK09793770.0T patent/DK2301022T3/en active
- 2009-07-10 BR BRPI0915450-7A patent/BRPI0915450B1/pt active IP Right Grant
- 2009-07-10 CN CN2009801267394A patent/CN102119414B/zh active Active
- 2009-07-10 JP JP2011516937A patent/JP5710476B2/ja active Active
- 2009-07-10 PL PL09793769T patent/PL2313887T3/pl unknown
- 2009-07-10 CA CA2729752A patent/CA2729752C/en active Active
- 2009-07-10 US US12/501,201 patent/US9245532B2/en not_active Ceased
- 2009-07-10 CA CA2729751A patent/CA2729751C/en active Active
- 2009-07-10 CA CA2729665A patent/CA2729665C/en active Active
- 2009-07-10 DK DK09793768.4T patent/DK2301021T3/en active
- 2009-07-10 US US12/501,197 patent/US8712764B2/en active Active
- 2009-07-10 WO PCT/CA2009/000981 patent/WO2010003254A1/en active Application Filing
- 2009-07-10 KR KR1020117002977A patent/KR101604774B1/ko active IP Right Grant
- 2009-07-10 CN CN2009801267267A patent/CN102089810B/zh active Active
- 2009-07-10 NO NO09793769A patent/NO2313887T3/no unknown
- 2009-07-10 US US12/501,188 patent/US8332213B2/en active Active
- 2009-07-10 EP EP09793768.4A patent/EP2301021B1/en active Active
- 2009-07-10 WO PCT/CA2009/000979 patent/WO2010003252A1/en active Application Filing
- 2009-07-10 CA CA2972808A patent/CA2972808C/en active Active
- 2009-07-10 ES ES09793769.2T patent/ES2645375T3/es active Active
- 2009-07-10 PT PT97937684T patent/PT2301021T/pt unknown
- 2009-07-10 EP EP09793770.0A patent/EP2301022B1/en active Active
- 2009-07-10 JP JP2011516938A patent/JP2011527442A/ja active Pending
- 2009-07-10 KR KR1020117002983A patent/KR101592968B1/ko active IP Right Grant
- 2009-07-10 DK DK09793769.2T patent/DK2313887T3/da active
- 2009-07-10 PT PT97937700T patent/PT2301022T/pt unknown
- 2009-07-10 RU RU2011104813/08A patent/RU2011104813A/ru unknown
- 2009-07-10 ES ES09793768.4T patent/ES2639747T3/es active Active
- 2009-07-10 ES ES09793770.0T patent/ES2650492T3/es active Active
- 2009-07-10 MX MX2011000363A patent/MX2011000363A/es active IP Right Grant
- 2009-07-10 RU RU2011104784/08A patent/RU2509379C2/ru active
- 2009-07-10 WO PCT/CA2009/000980 patent/WO2010003253A1/en active Application Filing
- 2009-07-10 EP EP09793769.2A patent/EP2313887B1/en active Active
-
2011
- 2011-07-27 HK HK11107811.9A patent/HK1153840A1/xx unknown
- 2011-08-04 HK HK11108095.4A patent/HK1154109A1/xx unknown
-
2017
- 2017-09-08 CY CY20171100951T patent/CY1119501T1/el unknown
- 2017-10-26 CY CY20171101113T patent/CY1119494T1/el unknown
- 2017-12-05 CY CY20171101272T patent/CY1119659T1/el unknown
-
2018
- 2018-01-23 US US15/877,829 patent/USRE49363E1/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003510644A (ja) * | 1999-09-22 | 2003-03-18 | マイクロソフト コーポレイション | スーパーフレーム構造のlpcハーモニックボコーダ |
Non-Patent Citations (1)
Title |
---|
3GPP TS 26.290 Extended AMR-WB(AMR-WB+) codec(release 7), 3. 2007* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101592968B1 (ko) | 수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법 | |
MXPA05006664A (es) | Metodo y dispositivo para la cuantizacion robusta de vector predictivo de parametros de prediccion lineal en la codificacion de conversacion a velocidad variable de bits. | |
EP1181687B1 (en) | Multipulse interpolative coding of transition speech frames | |
KR100647290B1 (ko) | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190111 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20200116 Year of fee payment: 5 |