KR20220053032A - 선택적인 베이스 포스트 필터 - Google Patents
선택적인 베이스 포스트 필터 Download PDFInfo
- Publication number
- KR20220053032A KR20220053032A KR1020227012264A KR20227012264A KR20220053032A KR 20220053032 A KR20220053032 A KR 20220053032A KR 1020227012264 A KR1020227012264 A KR 1020227012264A KR 20227012264 A KR20227012264 A KR 20227012264A KR 20220053032 A KR20220053032 A KR 20220053032A
- Authority
- KR
- South Korea
- Prior art keywords
- post
- signal
- decoding
- filtering
- audio
- Prior art date
Links
- 238000001914 filtration Methods 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 94
- 230000002123 temporal effect Effects 0.000 claims description 46
- 230000004044 response Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 abstract description 31
- 230000003595 spectral effect Effects 0.000 description 23
- 238000001228 spectrum Methods 0.000 description 22
- 230000005284 excitation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000013016 damping Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L19/00—Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Fats And Perfumes (AREA)
- Lubrication Details And Ventilation Of Internal Combustion Engines (AREA)
- Filters For Electric Vacuum Cleaners (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
하나의 양태에서, 본 발명은 결과 비트 스트림을 디코딩할 디바이스가 고조파 사이의 잡음의 감쇠를 포함하는 포스트 필터링을 적용해야할지의 여부에 관해 행해지는 결정에 의해 특징지워진 오디오 인코딩 방법을 제공한다. 따라서, 비트 스트림에 인코딩되는, 포스트 필터를 이용할지의 여부에 대한 결정은 가장 적합한 코딩 모드에 관한 결정으로부터 별도로 행해진다. 또 다른 양태에서, 디코딩 단계 다음에 포스트-필터링 단계를 갖는 오디오 디코딩 방법이 제공되고, 상기 포스트-필터링 단계는 고조파 사이의 잡음 감쇠를 포함하고, 비트 스트림 신호에 인코딩된 포스트 필터링 정보에 따라 포스트 필터를 디스에이블링하는 단계에서 특징화된다. 이러한 방법은 또한 단지 포스트 필터링 정보에 의존하여, 따라서 현재 코딩 모드와 같은 팩터들(factors)에 독립적으로 포스트 필터를 비활성화하는 그것의 능력에 의해 혼합된-오리진 오디오 신호들을 위해 적합하다.
Description
본 발명은 일반적으로 디지털 오디오 코딩 특히, 상이한 특성들의 구성요소들을 포함하는 오디오 신호들을 위한 코딩 기술들에 관한 것이다.
음성(speech) 또는 노래를 포함하는 오디오 신호들을 위한 광범위한 클래스의 코딩 방법은 오디오 신호의 연속적인 시간 기간들 사이에서 특성의 변동들을 설명하기 위해 상이한 코딩 방법들로 시간 교대(time alternation)에 적용된 코드 여기 선형 예측(code excited linear prediction; CELP)을 포함하고, 상기 상이한 코딩 방법들은 특히 음악을 위해 적응된 주파수-도메인 코딩 방법들 또는 일반적인 성질의 방법들을 포함한다. 예를 들면, 단순화된 MPEG(Moving Pictures Experts Group), 통합 음성 오디오 코딩(Unified Speech and Audio Coding; USAC)(표준 ISO/IEC 23003-3을 참조하라) 디코더는 첨부된 도 2의 상부에 도시된 바와 같이, 적어도 3개의 디코딩 모드들 즉, 고급 오디오 코딩(Advanced Audio Coding; AAC)(표준 ISO/IEC 13818-7을 참조하라), 대수적인 CELP(ACELP) 및 TCX(transform-coded excitation)로 동작가능하다.
CELP의 다양한 실시예들은 인간의 음성 기관들의 속성들, 및 가능하면 인간의 청각에 적응된다. 이 명세서에 이용된 CELP는 ACELP, 광- 및 협-대역 CELP, SB-CELP(서브-대역 CELP), 저- 및 고-레이트 CELP, RCELP(릴렉싱된 CELP), LD-CELP(낮은-지연 CELP), CS-CELP(conjugate-structure CELP), CS-ACELP(conjugate-structure ACELP), PSI-CELP(pitch-synchronous innovation CELP) 및 VSELP(vector sum excited linear prediction)을 포함하지만, 이에 국한되지 않는 모든 가능한 실시예들 및 변형들을 언급할 것이다. CELP의 원리들은 IEEE 음향학, 음성, 및 신호 처리에 대한 국제 회의(ICASSP)의 회의록 vol. 10, pp. 937-940, 1985에서의 R. Schroeder 및 S. Atal에 의해 논의되고, 그것의 애플리케이션들의 몇몇은 음성 및 오디오 처리에 대한 IEEE 처리들, Vol. 3, no. 1, 1995에서 Chen 및 Gersho에 의해 인용된 참조들 25-29에서 설명된다. 전자의 논문에 또한 상세된 바와 같이, CELP 디코더(또는 유사하게 CELP 음성 신시사이저)는 인코딩된 음성 신호의 주기적인 구성요소를 복원하는 피치 예측기, 및 이노베이션 시퀀스(innovation sequence)가 부가되는 펄스 코드북을 포함할 수 있다. 피치 예측기는 차례로 피치를 복원하기 위한 긴 지연 예측기 및 스펙트럼 엔벨로프 정형화(spectral envelope shaping)에 의해 포먼트들(formants)을 복구하기 위한 짧은 지연 예측기를 포함할 수 있다. 이 콘텍스트에서, 피치는 일반적으로 성대에 의해 생성된 목소리 사운드(tonal sound) 구성요소의 기본 주파수로서 이해되고, 또한 성도의 부분들을 공명함으로써 음색이 정해진다(coloured). 그것의 고조파와 함께 이 주파수는 음성 또는 노래를 도미네이트(dominate)할 것이다. 일반적으로 말하면, CELP 방법들은 솔로 또는 하나의 파트의 노래를 처리하기 위해 최상으로 적합하고, 피치 주파수는 잘 규정되고 상대적으로 결정하기 쉽다.
CELP-코딩된 음성의 지각된 품질을 향상시키기 위해, 그것을 포스트 필터링(post filtering)(또 다른 용어에 의한 피치 강화)과 조합하는 것이 일반적인 실시이다. 미국 특허 제 4 969 192호 및 Chen 및 Gersho에 의한 논문의 섹션 Ⅱ는 이러한 포스트 필터들의 바람직한 속성들, 즉 검출된 음성 피치의 고조파들 사이에 위치된 잡음 구성요소들을 억제하기 위한 그들의 능력을 개시한다(롱 텀 부분; 섹션 Ⅳ를 참조하라). 이 잡음의 중요한 부분이 스펙트럼 엔벨로프 정형화로부터 발생한다고 알려져 있다. 단순한 포스트 필터의 롱-텀 부분은 다음 전송 함수를 갖도록 설계될 수 있다:
여기서, T는 샘플들의 수에 관한 추정된 피치 기간이고, α는 도 1 및 도 2에 도시된 바와 같은 포스트 필터의 이득이다. 콤 필터(comb filter)와 유사한 방식으로, 이러한 필터는 주파수들(1/(2T), 3/(2T), 5/(2T), ...,), 및 인접한 주파수들을 약화시키고, 상기 주파수들(1/(2T), 3/(2T), 5/(2T), ...,)은 피치 주파수의 고조파 사이의 중간에 위치된다. 감쇠는 이득(α)의 값에 의존한다. 조금 더 복잡한 포스트 필터들은 이 감쇠를 잡음이 가장 감지가능한 단지 낮은 주파수들에게만 적용한다 - 따라서, 공통적으로 베이스 포스트 필터라는 용어가 이용된다. 이것은 상기 설명된 전송 함수 HE 및 저역 필터(HLP)를 캐스케이딩(cascading)함으로써 표현될 수 있다. 따라서, 변환 도메인에서, 포스트 필터에 의해 제공된 포스트-처리된 디코딩된 SE는 다음과 같이 주어지고,
S는 포스트 필터에 입력으로서 제공되는 디코딩된 신호이다. 도 3은 기술 규격 ETSI TS 126 290, 버전 6.3.0, 릴리즈 6의 섹션 6.1.3에 또한 논의되는 이들 특성들을 갖는 포스트 필터의 일 실시예를 도시한다. 이 도면이 제안하는 바와 같이, 피치 정보는 비트 스트림 신호의 파라미터로서 인코딩되고 PLT에 의해 표현된 동작들을 실행하는 롱-텀 예측 필터에 통신적으로 접속된 피치 트래킹 모듈에 의해 검색된다.
이전 단락에서 설명된 롱-텀 부분은 홀로 이용될 수 있다. 대안적으로, 그것은 포먼트들에 대응하는 주파수 간격들로 구성요소들을 보존하고 다른 스펙트럼 영역들(숏-텀 부분; 섹션 Ⅲ을 참조하라) 즉, 포먼트 엔벨로프의 '스펙트럼 밸리들(spectral valleys)'에서의 잡음을 감쇄시키는 잡음-성형 필터(noise-shaping filter)와 직렬로 배열된다. 또 다른 가능한 변형으로서, 이 필터 총합은 또한 숏-텀 부분의 스펙트럼 기울기에 기인한 지각된 악화를 감소시키기 위해 점진적 고역 유형의 필터에 의해 보충된다.
상이한 오리진들(origins) - 예를 들면, 음색, 비-음색, 목소리(vocal), 악기(instrumental), 비-음악(non-musical) - 의 구성요소들의 혼합을 포함하는 오디오 신호들은 언제나 만족하는 방식으로 이용가능한 디지털 코딩 기술들에 의해 재생성되지 않는다. 이용가능한 기술들이 이러한 비-동질의 오디오 재료(audio material)를 핸들링, 일반적으로 구성요소들 중 하나를 다른 것의 희생 아래 선호(favouring)하는데 부족하다는 것이 더 정확하게 주목된다. 특히, 상기 설명된 본질의 방법들에 의해 인코딩되는, 하나 이상의 악기들 또는 합창 파트들에 의해 동반된 노래를 포함하는 음악은 지각가능한 아티팩트들(artefacts)로 디코딩되어 종종 음악을 듣는 경험의 일부를 망칠 것이다.
이전 섹션에서 개요된 단점들의 적어도 일부를 완화시키기 위해, 본 발명의 목적은 상이한 오리진들의 구성요소들의 혼합을 포함하는 신호들의 오디오 인코딩 및 디코딩을 위해 적응된 방법들 및 디바이스들을 제공하는 것이다. 특정 목적들로서, 본 발명은 코딩 효율 또는 (지각된) 재생성 충실도 또는 둘 모두의 관점으로부터 적합한 이러한 방법들 또는 디바이스들을 제공하기 위해 노력한다.
본 발명은 독립 청구항들에 규정된 바와 같이, 방법들 각각을 실행하기 위해 인코더 시스템, 디코더 시스템, 인코딩 방법, 디코딩 방법 및 컴퓨터 프로그램 제품들을 제공함으로써 이들 목적들 중 적어도 하나를 성취한다. 종속 청구항들은 본 발명의 실시예들을 규정한다.
발명자들은 비-동질의 오리진의 디코딩된 오디오 신호들에서 지각된 몇몇 아티팩트들이 적어도 하나가 디코더에서의 포스트 필터링을 포함하고 적어도 하나가 포함하지 않는 몇몇 코딩 모드들 사이의 부적절한 스위칭으로부터 유도됨을 인식했다. 다 상세하게, 이용가능한 포스트 필터들은 고조파 사이의 잡음(interharmonic noise)(및, 스펙트럼 밸리들에서의 적용가능한 잡음) 뿐만 아니라, '바람직한' 본질의 악기 또는 목소리 반주 및 다른 재료를 표현하는 신호 구성요소들을 제거한다. 스펙트럼 밸리들에서의 단지 현저한 차가 10dB(IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-4, pp. 697-708, 1986, Ghitza 및 Goldstein에 의해 언급된 바와 같은) 만큼 클 수 있다는 사실은 이들 주파수 대역들을 간소하게 필터링하기 위해 많은 설계자들에 의해 타당한 이유로서 취해질 수 있다. 그러나, 고조파 사이의(및 스펙트럼-밸리) 감쇠 그 자신에 의한 품질 저하는 스위칭 경우들의 품질 저하보다 덜 중요할 수 있다. 포스트 필터가 스위칭 온 될 때, 노래 음성 사운드들의 백그라운드는 갑자기 약해지고(muffled), 필터가 비활성화될 때, 백그라운드는 즉시 더 듣기 좋게 된다. 오디오 신호의 본질 또는 코딩 디바이스의 구성 때문에, 스위칭이 자주 발생하면, 스위칭 아티팩트가 존재할 것이다. 하나의 예로서, USAC 디코더는 포스트 필터링과 조합된 ACELP 모드 또는 포스트 필터링이 없는 TCX 모드에서 동작가능할 수 있다. ACELP 모드는 지배적 목소리 구성요소가 존재하는 에피소드들에서 이용된다. 따라서, ACELP 모드로의 스위칭은 목소리 구성요소가 더 이상 중요하지 않다는 점에서 볼 때, 새로운 뮤지컬 악절(musical phrase)의 시작, 새로운 절(verse)의 시작, 또는 단순히 반주가 노래 음성을 안들리게 하도록 간주되는 에피소드 이후와 같은, 노래의 온셋(onset)에 의해 트리거링(triggering)될 수 있다. 실험들은 리버브(reverb)와 같은 아티팩트들이 나타나기 때문에, TCX 코딩이 내내 이용되는(및 ACELP 모드가 디스에이블(disable)된다) 일 대안적인 해법, 또는 문제점의 약간의 우회가 문제점을 해결하지 않음을 확인했다.
따라서, 제 1 및 제 2 양태에서, 본 발명은 인코딩 방법에 의해 출력되는 비트 스트림을 디코딩할 디바이스가 고조파 사이의 잡음의 감쇠를 포함하는 포스트 필터링을 적용해야하는지의 여부에 관해 행해지는 결정에 의해 특징지워진 오디오 인코딩 방법(및 대응하는 특징들을 갖는 오디오 인코딩 시스템)을 제공한다. 결정의 결과는 비트 스트림에서 인코딩되고 디코딩 디바이스에 액세스가능하다.
본 발명에 의해, 포스트 필터를 이용할지의 여부의 결정은 가장 적합한 코딩 모드에 관한 결정으로부터 개별적으로 취해진다. 이것은 스위칭이 청취자를 귀찮게 하지 않을 이러한 길이의 기간 내내 하나의 포스트 필터링 상태를 유지하는 것을 가능하게 한다. 따라서, 인코딩 방법은 필터가 관습적으로 활성인 코딩 모드로 포스트 필터가 스위칭할지라도, 상기 포스트 필터는 비활성인 상태로 남아 있을 것임을 규정할 수 있다.
포스트 필터링을 적용할지의 여부에 대한 결정은 정상적으로 프레임-방식(frame-wise)으로 취해짐을 주의한다. 따라서, 첫번째, 포스트 필터링은 한번에 하나의 프레임 미만을 위해 적용되지 않는다. 두번째, 포스트 필터링을 디스에이블할지의 여부에 대한 결정은 단지 현재 프레임의 기속기간에 대해 유효하고 후속 프레임에 대해 유지될 수 있거나 재평가될 수 있다. 주 프레임 포맷 및 일반적인 포맷의 일부 예를 들면, 그것의 길이의 1/8인 감소된 포맷을 가능하게 하는 코딩 포맷에서, 개개의 감소된 프레임들에 대한 포스트-필터링 결정들을 취하는 것이 필요하지 않을 수 있다. 대신에, 정상 프레임까지 합산하는 복수의 감소된 프레임들이 고려될 수 있고, 필터링 결정에 대해 관련된 파라미터들은 그 안에 포함된 감소된 프레임들의 평균 또는 중앙값을 계산함으로써 얻어질 수 있다.
본 발명의 제 3 및 제 4 양태에서, 디코딩 단계 다음에 포스트-필터링 단계를 갖는 오디오 디코딩 방법(및 대응하는 특징들을 갖는 오디오 디코딩 시스템)이 제공되고, 상기 포스트-필터링 단계는 고조파 사이의 잡음 감쇠를 포함하고, 비트 스트림 신호에서 인코딩된 포스트 필터링 정보에 따라 포스트 필터를 디스에이블링하는 단계에서 특징화된다.
이들 특성들을 갖는 디코딩 방법은 또한 단지 포스트 필터링 정보에만 의존하고, 따라서 현재 코딩 모드와 같은 팩터들(factors)에 독립적인 포스트 필터를 비활성화하는 그것의 능력에 의해 혼합된-오리진 오디오 신호들의 코딩을 위해 적합하다. 포스트 필터 액티비티(activity)가 관습적으로 특정 코딩 모드들과 연관되는 코딩 기술들에 적용될 때, 포스트-필터링 디스에이블링 능력은 새로운 동작 모드, 즉 관습적으로 필터링된 디코딩 모드의 필터링되지 않은 응용을 가능하게 한다.
또 다른 양태에서, 본 발명은 또한 상기 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램 제품을 제공한다. 여전히, 본 발명은 포스트 필터에 제공된 포스트-필터링 신호에 의해 나타내어진 바와 같이, 활성 모드 또는 패스-스루 모드(pass-through mode)에서 동작가능한 고조파 사이의 잡음을 감쇠하기 위한 포스트 필터를 제공한다. 포스트 필터는 독자적으로 포스트 필터링 액티비티를 제어하기 위한 결정 섹션(decision section)을 포함할 수 있다.
당업자가 인식할 바와 같이, 디코더와 협력하도록 적응된 인코더는 인코딩된 신호의 믿을만한 재생성을 가능하게 하기 위해, 기능성 등가 모듈들을 구비한다. 이러한 등가 모듈들은 동일하거나 유사한 모듈들일 수 있거나 동일하거나 유사한 전송 특성들을 가지는 모듈들일 수 있다. 특히, 인코더 및 디코더에서의 모듈들 각각은 등가 세트들의 수학적 연산들을 수행하는 개별적인 컴퓨터 프로그램들을 실행하는 유사하거나 유사하지 않은 처리 유닛들일 수 있다.
하나의 실시예에서, 본 방법을 인코딩하는 것은 포스트 필터가 또한 스펙트럼 밸리들(포먼트 엔벨로프에 관한, 상기 내용을 참조하라)을 포함하는지의 여부에 관한 결정을 포함한다. 이것은 포스트 필터의 숏-텀 부분에 대응한다. 그 다음, 결정이 기초하는 기준을 포스트 필터의 본질에 적응시키는 것이 이롭다.
하나의 실시예는 특히 음성 코딩을 위해 적응된 인코더로 지향된다. 목소리 및 다른 구성요소들의 혼합이 코딩될 때, 본 발명을 유도(motivating)하는 문제점들의 몇몇이 관측되기 때문에, 본 발명에 의해 제공된 음성 코딩 및 포스트 필터링에 관한 독립적인 결정의 조합은 특히 이롭다. 특히, 이러한 디코더는 코드-여기된 선형 예측 인코딩 모듈이다.
하나의 실시예에서, 인코더는 지배적 기본 주파수(피치)를 갖는 신호 구성요소 및 기본 주파수 아래에 위치된 또 다른 신호 구성요소의 검출된 동시적 존재에 대한 그것의 결정에 기반한다. 검출은 또한 지배적 기본 주파수를 갖는 구성요소 및 이 기본 주파수의 고조파들 사이의 에너지를 갖는 또 다른 구성요소의 동시 발생을 발견하는 것을 목적으로 할 수 있다. 이것은 고려 중인 유형의 아티팩트들을 자주 접하게 되는 상황이다. 따라서, 이러한 동시적 존재가 확립되면, 인코더는 포스트 필터링이 적합하지 않음을 결정할 것이고, 따라서 이는 비트 스트림에 포함된 포스트 필터링 정보에 의해 표시될 것이다.
하나의 실시예는 그것의 검출 기준으로서, 피치 주파수 가능하게 인코더에서 롱-텀 예측에 의해 추정된 피치 주파수 아래의 오디오 시간 신호에서의 총 신호 전력 콘텐트를 이용한다. 이것이 미리 결정된 임계값보다 크면, 포스트 필터로 하여금 디스에이블되도록 할 피치 구성요소(고조파들을 포함하는)와 다른 관련 구성요소들이 존재함이 고려된다.
CELP 모듈을 포함하는 인코더에서, 이러한 모듈이 오디오 시간 신호의 피치 주파수를 추정하는 사실이 이용될 수 있다. 그 다음, 또 다른 검출 기준은 상기에 더 상세하게 설명된 바와 같이, 이 주파수의 고조파들 사이 또는 아래의 에너지 콘텐트를 검사하는 것이다.
CELP 모듈을 포함하는 이전 실시예의 또 다른 발전으로서, 결정은 CELP-코딩될(즉, 인코딩되고 디코딩될) 때의 오디오 신호의 추정된 파워와 CELP-코딩되고 포스트 필터링될 때의 오디오 신호의 추정된 파워 사이의 비교를 포함할 수 있다. 파워 차가 관련을 나타낼 수 있는 임계값보다 크면, 신호의 비-잡음 구성요소는 로스트(lost)될 것이고, 인코더는 포스트 필터를 디스에이블하도록 결정할 것이다.
일 이로운 실시예에서, 인코더는 CELP 모듈 및 TCX 모듈을 포함한다. 종래 기술에 공지된 바와 같이, TCX 코딩은 특정 종류들의 신호들 특히, 비-목소리 신호들에 대해서 이롭다. TCX-코딩된 신호에 포스트-필터링을 적용하는 것은 일반적인 실시는 아니다. 따라서, 인코더는 TCX 코딩, 포스트 필터링을 갖는 CELP 코딩 또는 포스트 필터링이 없는 CELP 코딩을 선택할 수 있어서, 상당한 범위의 신호 유형들을 커버한다.
이전 실시예의 하나의 또 다른 발전으로서, 3개의 코딩 모드들 사이의 결정은 레이트-왜곡 기준 즉, 종래 기술에 그 자체로 공지된 최적화 절차를 적용하는 것에 기초하여 취해진다.
이전 실시예의 또 다른 발전에서, 인코더는 또한 고급 오디오 코딩(Advanced Audio Coding; AAC) 코더를 포함하고, 상기 고급 오디오 코딩 코더는 또한 특정 유형들의 신호들을 위해 특히 적합하도록 공지된다. 바람직하게, AAC(주파수-도메인) 코딩을 적용할지의 여부에 대한 결정은 다른(선형-예측) 모드들 중 어느 것이 이용될 지에 대한 결정으로부터 별도로 행해진다. 따라서, 인코더는 2개의 수퍼-모드들, AAC 또는 TCX/CELP에서 동작가능한 것으로서 이해될 수 있고, 후자에서 인코더는 TCX, 포스트-필터링된 CELP 또는 비-필터링된 CELP 사이를 선택할 것이다. 이 실시예는 더 넓은 범위의 오디오 신호 유형들의 처리를 가능하게 한다.
하나의 실시예에서, 인코더는 디코딩에서의 포스트 필터링이 점진적으로 즉, 점진적으로 증가하는 이득을 갖고 적용되어야 함을 결정할 수 있다. 마찬가지로, 포스트 필터링이 점진적으로 제거되어야 함을 결정할 수 있다. 이러한 점진적인 응용 및 제거는 덜 지각가능한 포스트 필터링을 갖는 레짐들(regimes)과 상기 포스트 필터링을 갖지 않는 레짐들 사이를 스위칭하게 한다. 하나의 예로서, 포스트-필터링된 CELP 코딩이 적합한 것으로 발견되는 노래 에피소드는 악기 에피소드 다음에 올 수 있고, TCX 코딩은 최적이고; 그 다음, 본 발명에 따른 디코더는 노래 에피소드의 시작에서 또는 그 가까이에서 점진적으로 포스트 필터링을 적용할 수 있어서, 포스트 필터링의 이점들은 심지어 귀찮은 스위칭 아티팩트들이 회피된다고 하더라도, 보존된다.
하나의 실시예에서, 포스트 필터링이 적용되어야 하는지의 여부에 대한 결정은 대략적인 차 신호에 기초하고, 이는 포스트 필터에 의해 미래의 디코딩된 신호로부터 제거되어야 하는 신호 구성요소를 근사화한다. 하나의 옵션으로서, 대략적인 차 신호는 오디오 시간 신호와 (시뮬레이팅된) 포스트 필터링의 영향을 받게 될 때의 오디오 시간 신호 사이의 차로서 계산된다. 또 다른 옵션으로서, 인코딩 섹션은 중간 디코딩된 신호를 추출하고, 이에 의해 대략적인 차 신호는 오디오 시간 신호와 포스트 필터링의 영향을 받게 될 때의 중간 디코딩된 신호 사이의 차로서 계산될 수 있다. 중간 디코딩된 신호는 인코더의 롱-텀 예측 버퍼에 저장될 수 있다. 그것은 또한 또 다른 통합 필터링(성대, 울림)이 최종 디코딩된 신호를 얻기 위해 적용될 필요가 있을 수 있음을 내포하는 신호의 여기를 표현할 수 있다. 중간 디코딩된 신호를 이용하는데 있어서의 포인트는 그것이 특정요소들 중 몇몇, 특히 코딩 방법의 약점을 캡쳐하여, 포스트 필터의 영향의 더 현실적인 추정을 허용하는 것이다. 세번째 옵션으로서, 디코딩 섹션은 중간 디코딩된 신호를 추출하고, 이에 의해 대략적인 차 신호는 중간 디코딩된 신호와 포스트 필터링의 영향을 받게 될 때의 중간 디코딩된 신호 사이의 차로서 계산될 수 있다. 이 절차는 아마도 2개의 제 1 옵션들보다 덜 믿을 만한 추정을 제공하지만, 한편 독립적인 방식으로 디코더에 의해 실행될 수 있다.
따라서, 얻어진 대략적인 차 신호는 다음 기준들 중 하나에 대해서 평가되고, 긍정적으로 평가될 때, 그것은 포스트 필터를 디스에이블하기 위한 결정을 초래할 것이다:
a) 대략적인 차 신호의 파워가 신호의 중요한 부분이 포스트 필터에 의해 제거될 수 있음을 나타내는 미리 결정된 임계값을 초과하는지의 여부;
b) 대략적인 차 신호의 특성이 잡음과 비슷하기보다 오히려 목소리인지의 여부;
*c) 대략적인 차 신호와 오디오 시간 신호의 주파수 크기 스펙트럼 사이의 차가 주파수에 대해 불균형적으로 분포되어, 잡음이 아니지만 인간 청취자가 감지할 수 있게 하는 신호임을 제시하는 지의 여부;
d) 대략적인 차 신호의 주파수 크기 스펙트럼이 무엇이 일반적으로 처리될 유형의 신호로부터 기대될 수 있는지에 기초하여 미리 결정된 관련 엔벨로프 내의 주파수 간격들로 국한(localizing)되는지의 여부; 및
e) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 스케일 팩터에 의해 다운스케일링된 그 안의 가장 큰 신호 구성요소의 크기에 의해 오디오 시간 신호의 주파수 크기 스펙트럼을 스레시홀드(threshold)함으로써 얻어진 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부. 기준 e)를 평가할 때, 크기 스펙트럼에서 피크 트래킹(peak tracking)을 적용하는 즉, 잡음 보다는 음색 구성요소들과 정상적으로 연관된 피크와 비슷한 형태들을 가지는 부분들을 구별하는 것이 이롭다. 종래 기술에 그 자체로 공지된 몇몇 알고리즘에 의해 발생할 수 있는 피크 트래킹에 의해 식별된 구성요소들은 또한 임계값을 피크 높이에 적용함으로써 정렬될 수 있고, 이에 의해 남아 있는 구성요소들은 특정 크기의 음색 재료이다. 이러한 구성요소들은 일반적으로 잡음보다는 관련 신호 콘텐트를 표현하고, 이는 포스트 필터를 디스에이블하기 위한 결정을 유도(motivate)한다.
디코더로서 본 발명의 하나의 실시예에서, 포스트 필터를 디스에이블하기 위한 결정은 제어 섹션에 의해 제어가능하고 회로에서의 포스트 필터를 바이패스(bypass)할 수 있는 스위치에 의해 실행된다. 또 다른 실시예에서, 포스트 필터는 제어 섹션, 또는 그 안의 이득 제어기에 의해 제어가능한 가변 이득을 갖고, 디스에이블하기 위한 결정은 포스트 필터 이득(이전 섹션을 참조하라)을 0으로 설정하거나 그의 절대 값을 미리 결정된 임계값 아래로 설정함으로써 실행된다.
하나의 실시예에서, 본 발명에 따른 디코딩은 디코딩되고 있는 비트 스트림 신호로부터 포스트 필터링 정보를 추출하는 것을 포함한다. 특히, 포스트 필터링 정보는 송신하기 위해 적합한 포맷의 적어도 하나의 비트를 포함하는 데이터 필드에서 인코딩될 수 있다. 이롭게, 데이터 필드는 적용가능한 표준에 의해 규정되지만 이용하지 않는 존재하는 필드여서, 포스트 필터링 정보는 송신될 페이로드를 증가시키지 않는다.
일상적인 실험을 포함하는 당업자의 능력들 내에서의 적절한 수정들 이후에, 이 섹션에 개시된 방법들 및 장치가, 가능하게는 스테리오 채널들과 같은 상이한 채널들에 대응하는 몇몇 구성요소들을 가지는 신호들의 코딩에 적용될 수 있음에 주의한다. 본 출원을 통해서, 피치 강화 및 포스트 필터링은 동의어로서 이용된다. 또한, AAC은 주파수-도메인 코딩 방법들의 일 대표적인 예로서 논의됨을 주의한다. 실제로, 본 발명을 AAC보다 주파수-도메인 코딩 모드로 동작가능한 디코더 또는 인코더에 적용하는 것은 단지, 존재한다면 당업자의 능력들 내의 적은 수정들만 요구할 것이다. 유사하게, TCX는 가중된 선형 예측 변환 코딩 및 일반적인 변환 코딩의 일례로서 언급된다.
여기서 상기 설명된 2개 이상의 실시예들로부터의 특징들은 또 다른 실시예들에서 그들이 명백하게 보완적이지 않다면 조합될 수 있다. 2개의 특징들이 상이한 청구항들에서 나열되는 사실은 그들이 이롭게 조합될 수 있음을 배제하지 않는다. 마찬가지로, 또 다른 실시예들은 또한 원하는 목적을 위해 반드시 필요하지 않거나 필수적이지 않은 특정 특징들의 생략에 의해 제공될 수 있다.
본 발명의 실시예들은 이제 첨부된 도면들을 참조하여 설명될 것이다.
도 1은 포스트 필터를 갖는 종래의 디코더를 도시한 블록도.
도 2는 AAC, ACELP 및 TCX 모드로 동작가능하고 ACELP 모듈의 다운스트림에 영구적으로 접속된 포스트 필터를 포함하는 종래의 디코더의 개략적인 블록도.
도 3은 포스트 필터의 구조를 도시한 블록도.
도 4 및 도 5는 본 발명에 따른 2개의 디코더들의 블록도들.
도 6 및 도 7은 본 발명에 따른 종래의 디코더(도 6) 및 디코더(도 7) 사이의 차들을 도시한 블록도들.
도 8은 본 발명에 따른 인코더의 블록도.
도 9 및 도 10은 본 발명에 따른 종래의 디코더(도 9) 및 디코더(도 10) 사이의 차들을 도시한 블록도들.
도 11은 선택적으로 활성화 및 비활성화될 수 있는 독자적인 포스트 필터를 도시한 블록도.
도 2는 AAC, ACELP 및 TCX 모드로 동작가능하고 ACELP 모듈의 다운스트림에 영구적으로 접속된 포스트 필터를 포함하는 종래의 디코더의 개략적인 블록도.
도 3은 포스트 필터의 구조를 도시한 블록도.
도 4 및 도 5는 본 발명에 따른 2개의 디코더들의 블록도들.
도 6 및 도 7은 본 발명에 따른 종래의 디코더(도 6) 및 디코더(도 7) 사이의 차들을 도시한 블록도들.
도 8은 본 발명에 따른 인코더의 블록도.
도 9 및 도 10은 본 발명에 따른 종래의 디코더(도 9) 및 디코더(도 10) 사이의 차들을 도시한 블록도들.
도 11은 선택적으로 활성화 및 비활성화될 수 있는 독자적인 포스트 필터를 도시한 블록도.
도 4는 본 발명의 일 실시예에 따른, 그것의 입력으로서 비트 스트림 신호 및 그것을 출력으로서 오디오 신호를 가지는 디코더 시스템(400)의 개략적인 도면이다. 도 1에 도시된 종래의 디코더들로서, 포스트 필터(440)는 디코딩 모듈(410)의 다운스트림에서 정렬되지만, 스위치(442)를 동작시킴으로써 디코딩 경로로 또는 디코딩 경로 밖으로 스위칭될 수 있다. 포스트 필터는 도면에 도시된 스위치 위치에서 인에이블링된다. 스위치가 반대 위치로 설정되었으면 디스에이블될 수 있고, 이에 의해 디코딩 모듈(410)로부터의 신호는 대신에 바이패스 라인(444)에 걸쳐 컨덕팅(conducting)될 수 있다. 새로운 기여로서, 스위치(442)는 비트 스트림 신호에 포함된 포스트 필터링 정보에 의해 제어가능하여, 포스트 필터링은 디코딩 모듈(410)의 현재 상태에 상관없이 적용되고 제거될 수 있다. 포스트 필터(440)가 몇몇 지연에서 동작하기 때문에, - 예를 들면, 도 3에 도시된 포스트 필터는 적어도 피치 기간(T)에 해당하는 지연을 도입할 것이다 - 보상 지연 모듈(443)은 스위칭에서 동기화된 조건으로 모듈들을 유지하기 위해 바이패스 라인(444) 상에 정렬된다. 지연 모듈(443)은 포스트 필터(440)가 지연할 수 있는 것과 동일한 기간 만큼 신호를 지연시키지만, 그렇지 않으면 신호를 처리하지 않는다. 시간에 따른 변화를 최소화하기 위해, 보상 지연 모듈(443)은 항상 포스트 필터(440)와 동일한 신호를 수신한다. 포스트 필터(440)가 제로-지연 포스트 필터(예를 들면, 미래의 신호 값들과 관계 없이, 2개의 탭들을 갖는 필터와 같은, 원인 필터(causal filter))에 의해 대체되는 일 대안적인 실시예에서, 보상 지연 모듈(443)이 생략될 수 있다.
도 5는 도 2의 트리플-모드 디코더 시스템(500)의 본 발명의 교시들에 따른 또 다른 발전을 도시한다. ACELP 디코딩 모듈(511)은 TCX 디코딩 모듈(512) 및 AAC 디코딩 모듈(513)과 병렬로 정렬된다. 잡음 특히, 디코더 시스템(500)이 적응되는 비트 스트림 신호로부터 직접적으로 또는 간접적으로 얻어낼 수 있는 피치 주파수의 고조파들 사이에 위치된 잡음을 감쇠시키기 위한 포스트 필터(540)는 ACELP 디코딩 모듈(511)과 직렬로 정렬된다. 비트 스트림 신호는 또한 포스트 필터(540)를 처리 경로 밖으로 스위칭하고 그것을 도 4에서와 유사한 보상 지연 모듈(543)과 대체하도록 동작가능한 상부 스위치(541)의 위치들을 관리하는 포스트 필터링 정보를 인코딩한다. 하부 스위치(542)는 상이한 디코딩 모드들 사이를 스위칭하기 위해 이용된다. 이 구조를 이용하여, 상부 스위치(541)의 위치는 TCX 또는 AAC 모듈들(512, 513) 중 하나가 이용될 때는 중요하지 않다; 따라서, 포스트 필터링 정보는 ACELP 모드에서는 제외하고 이 위치를 반드시 나타내지는 않는다. 어떠한 디코딩 모드가 현재 이용되든지 간에, 신호는 하부 스위치(542)의 다운스트림 접속 포인트로부터 오디오 신호를 출력하는 스펙트럼 대역 복제(spectral band replication; SBR) 모듈(550)로 공급된다. 당업자는 도면이 이동가능한 접촉 수단을 갖는 별개의 물리 엔티티들과 같은 개략적으로 도시되는 스위치들로부터 특히 명백한 바와 같이, 개념적인 본질임을 인식할 것이다. 디코더 시스템의 가능한 실제 구현에서, 스위치들 뿐만 아니라, 다른 모듈들은 컴퓨터-판독가능한 지시들에 의해 구현될 것이다.
도 6 및 도 7은 또한 ACELP, TCX 또는 주파수-도메인 디코딩 모드로 동작가능한 2개의 트리플-모드 디코더 시스템들의 블록도들이다. 본 발명의 일 실시예를 도시하는 도 7을 참조하면, 비트 스트림 신호는 입력 포인트(701)에 제공되고, 상기 입력 포인트(701)는 결과적으로 각각의 브랜치들을 통해 3개의 디코딩 모듈들(711, 712, 713)에 영구적으로 접속된다. 입력 포인트(701)는 또한 피치 강화 모듈(740)에 대한 접속 브랜치(702)(도 6의 종래의 디코딩 시스템에는 존재하지 않는다)를 갖고, 상기 피치 강화 모듈(740)은 상기 설명된 일반적 유형의 포스트 필터로서 동작한다. 종래 기술에서의 일반적 실시로서, 제 1 전이 윈도우잉 모듈(703)은 디코딩 모듈들 사이의 전이들을 실행하기 위해 ACELP 및 TCX 모듈들(711, 712)의 다운스트림에서 정렬된다. 제 2 전이 모듈(704)은 2개의 수퍼-모드들 사이의 전이를 실행하기 위해 주파수-도메인 디코딩 모듈(713) 및 제 1 전이 윈도우잉 모듈(703)의 다운스트림에서 정렬된다. 또한, SBR 모듈(750)은 출력 포인트(705)의 바로 업스트림에서 제공된다. 명백하게, 비트 스트림 신호는 직접적으로 (또는 적절하게 디멀티플렉싱 이후에) 3개의 모든 디코딩 모듈들(711, 713, 713) 및 피치 강화 모듈(740)에 제공된다. 비트 스트림에 포함된 정보는 무슨 디코딩 모듈이 활성화이어야 하는지를 제어한다. 그러나, 발명에 의해 피치 강화 모듈(740)은 유사한 자기 동작을 수행하고, 상기 유사한 자기 동작은 비트 스트림의 포스트 필터링 정보에 응답하여, 포스트 필터로서 또는 단순히 패스-스루로서 동작할 수 있다. 이것은 예를 들면, 포스트 필터링 동작이 턴 온(turn on) 또는 턴 오프될 수 있음으로 인해 피치 강화 모듈(740)의 제어 섹션(도시되지 않음)의 제공을 통해 실현될 수 있다. 피치 강화 모듈(740)은 디코더 시스템이 주파수-도메인 또는 TCX 디코딩 모드로 동작할 때, 항상 그것의 패스-스루 모드에 있고, 엄격하게 말해서 어떠한 포스트 필터링 정보도 필요하지 않다. 발명적인 기여를 형성하지 않는 모듈들 및 그의 존재는 당업자에게 분명함이 이해되고 예를 들면, 디멀티플렉서는 명확성을 증가시키기 위해 도 7 및 다른 유사한 도면들로부터 생략된다.
변형으로서, 도 7의 디코더 시스템은 포스트 필터링이 분석-합성 방식을 이용하여 적용되어야 하는지의 여부를 결정하기 위한 제어 모듈(도시되지 않음)을 구비할 수 있다. 이러한 제어 모듈은 통신적으로 피치 강화 모듈(740) 및 ACELP 모듈(711)에 접속되고, 상기 ACELP 모듈(711)로부터 디코딩 처리의 중간 단계를 표현하는 중간 디코딩된 신호(), 바람직하게 신호의 여기에 대응하는 하나를 추출한다. 검출 모듈은 전송 함수들 PLT(z) 및 HLP(z)(배경기술 및 도 3을 비교하라), 또는 등가적으로 그들의 필터 임펄스 응답들(pLT(z) 및 hLP(n))에 의해 규정된 바와 같이, 피치 강화 모듈(740)의 동작을 시뮬레이트(simulate)하기 위한 필요한 정보를 갖는다. 배경기술 섹션에서의 논의에 의해서 다음과 같이, 포스트 필터링에서 차감될 구성요소는 에 비례하는 대략적인 차 신호(sAD(n))에 의해 추정될 수 있고, *는 이산 컨볼루션(discrete convolution)을 나타낸다. 이것은 오리지널 오디오 신호와 포스트-필터링된 디코딩된 신호 사이의 정확한 차의 근사치 즉, 이고, α는 포스트 필터 이득이다. 본 발명의 내용 섹션 및 청구항들에 개시된 바와 같이, 총 에너지, 저대역 에너지, 음색(tonality), 이 신호의 실제 크기 스펙트럼 또는 과거 크기 스펙트럼을 조사(study)함으로써, 제어 섹션은 피치 강화 모듈(740)을 활성화 또는 비활성화할지의 여부에 관한 결정에 대한 기초를 발견할 수 있다.
도 8은 본 발명의 일 실시예에 따른 인코더 시스템(800)을 도시한다. 인코더 시스템(800)은 디지털 오디오 신호들을 처리하도록 적응되고, 상기 디지털 오디오 신호들은 일반적으로 마이크로폰으로 사운드 파를 캡쳐하고 상기 파를 아날로그 전기 신호로 변환함으로써 얻어진다. 그 다음, 전기 신호는 적합한 포맷으로 인코더 시스템(800)에 제공되기 쉬운 디지털 신호로 샘플링된다. 시스템은 일반적으로 인코딩 모듈(810), 결정 모듈(820) 및 멀티플렉서(830)로 구성된다. 스위치들(814, 815)(기호적으로 표현된)에 의해, 인코딩 모듈(810)은 선택적으로 모듈들(811, 812, 813)을 활성화함으로써 CELP, TCX 또는 AAC 모드로 동작가능하다. 결정 모듈(820)은, 오디오 신호를 인코딩하도록 인코더 시스템(800)에 의해 생성된 비트 스트림 신호의 디코딩 도중에 포스트 필터링을 디스에이블시키는지의 여부를 결정하기 위해 하나 이상의 미리 결정된 기준들을 적용한다. 이 목적을 위해, 결정 모듈(820)은 오디오 신호를 직접 검사할 수 있거나 접속 라인(816)을 통해 인코딩 모듈(810)로부터 데이터를 수신할 수 있다. 결정 모듈(820)에 의해 취해진 결정을 나타내는 신호는 인코딩 모듈(810)로부터 인코딩된 오디오 신호와 함께, 멀티플렉서(830)에 제공되고, 상기 멀티플렉서(830)는 신호들을 인코더 시스템(800)의 출력을 구성하는 비트 스트림에 연결시킨다.
바람직하게, 결정 모듈(820)은 그것의 결정을 중간 디코딩된 신호(si_DEC)로부터 계산된 대략적인 차 신호에 근거를 두고, 상기 중간 디코딩된 신호(si_DEC)는 인코딩 모듈(810)로부터 차감될 수 있다. 중간 디코딩된 신호는 이전 단락들에서 논의된 바와 같이, 디코딩 처리의 중간 단계를 표현하지만, 인코딩 처리의 대응하는 단계로부터 추출될 수 있다. 그러나, 인코더 시스템(800)에서, 오리지널 오디오 신호(sORIG)가 이용가능하여, 이롭게 대략적인 차 신호는 다음으로서 형성된다:
근사치는 중간 디코딩된 신호가 최종 디코딩된 신호 대신에 이용되는 사실에 있다. 이것은 포스트 필터가 디코딩에서 제거할 구성요소의 본질의 평가를 가능하게 하고, 본 발명의 내용 섹션에서 논의된 기준들 중 하나를 적용함으로써, 결정 모듈(820)은 포스트 필터링을 디스에이블할지의 여부에 대한 결정을 할 수 있을 것이다.
이에 대한 변형으로서, 결정 모듈(820)은 중간 디코딩된 신호 대신에 오리지널 신호를 이용할 수 있어서, 대략적인 차 신호는 가 될 것이다. 이것은 아마도 덜 신뢰가 가는 근사치일 수 있지만, 한편 결정 모듈(820)과 인코딩 모듈(810) 사이의 접속 라인(816)의 존재를 선택적인 것으로 한다.
결정 모듈(820)이 오디오 신호를 직접적으로 조사하는 이 실시예의 이러한 다른 변형들에서, 하나 이상의 다음 기준들이 적용될 수 있다:
도 8에 도시된 인코더 구조의 모든 설명된 변형들에서 - 즉, 검출 기준의 근거에 상관없이 -, 결정 섹션(820)은 순조로운 전이들을 성취하기 위해 포스트 필터링의 점진적인 온셋 또는 점진적인 제거를 결정하도록 인에이블링될 수 있다. 점진적인 온셋 또는 제거는 포스트 필터 이득을 조절함으로써 제어될 수 있다.
도 9는 디코더에 공급된 비트 스트림 신호에 의존하여 주파수-디코딩 모드 및 CELP 디코딩 모드로 동작가능한 종래의 디코더를 도시한다. 포스트 필터링은 CELP 디코딩 모드가 선택될 때마다 적용된다. 이 디코더의 향상은 도 10에서 예시되고, 도 10은 본 발명의 일 실시예에 따른 디코더(1000)를 도시한다. 이 디코더는 주파수-도메인 디코딩 모듈(1013)이 활성인 주파수-도메인-기반 디코딩 모드, 및 CELP 디코딩 모듈(1011) 및 포스트 필터(1040)가 활성인 필터링된 CELP 디코딩 모드 뿐만 아니라, CELP 모듈(1011)이 바이패스 라인(1044)을 통해 보상 지연 모듈(1043)에 그것의 신호를 공급하는 필터링되지 않은 CELP 모드로 동작가능하다. 스위치(1042)는 무슨 디코딩 모드가 디코더(1000)에 제공된 비트 스트림 신호에 포함된 포스트 필터링 정보에 응답하여 현재 이용되는지를 제어한다. 이 디코더 및 도 9의 디코더에서, 마지막 처리 단계는 최종 오디오 신호가 출력되는 SBR 모듈(1050)에 의해 이루어진다.
도 11은 디코더(1199)의 다운스트림에서 정렬되기에 적합한 포스트 필터(1100)를 도시한다. 필터(1100)는 포스트 필터링 모듈(1140)을 포함하고, 상기 포스트 필터링 모듈(1140)은 포스트 필터(1100) 내의 결정 모듈(1120)로부터 수신된 포스트 필터링 신호에 응답하여, 제어 모듈(도시되지 않음), 특히 이진 또는 비-이진 이득 제어기에 의해 인에이블링되거나 디스에이블링된다. 결정 모듈은 포스트 필터링 모듈(1140)이 활성인지 또는 비활성인지의 여부에 대한 결정에 도달하기 위해 디코더로부터 얻어진 신호에 대한 하나 이상의 테스트들을 수행한다. 결정은 도 8의 결정 모듈(820)의 기능성의 라인들을 따라 취해질 수 있고, 상기 결정 모듈(820)은 포스트 필터의 동작을 예측하기 위해 오리지널 신호 및/또는 중간 디코딩된 신호를 이용한다. 결정 모듈(1120)의 결정은 또한 결정 모듈들이 중간 디코딩된 신호가 형성되는 그들 실시예들에서 이용하는 유사한 정보에 기초할 수 있다. 하나의 예로서, 결정 모듈(1120)은 피치 주파수를 추정할 수 있고(이것이 비트 스트림 신호로부터 용이하게 추출가능하지 않으면), 피치 주파수 아래의 및 그것의 고조파들 사이의 신호의 에너지 콘텐트를 계산할 수 있다. 이 에너지 콘텐트가 중요하다면, 그것은 아마도 잡음보다는 관련 신호 구성요소를 표현하고, 이것은 포스트 필터링 모듈(1140)을 디스에이블링하기 위한 결정을 유도한다.
6인의 청취 테스트가 수행되었고, 이 테스트 동안 본 발명에 따라 인코딩되고 디코딩된 음악 샘플들은 종래의 방식으로 포스트 필터링을 적용하지만, 모든 다른 파라미터들을 변동 없이 유지하면서 코딩된 동일한 음악을 포함하는 기준 샘플들과 비교되었다. 결과들은 지각된 품질 향상을 확인한다.
본 발명의 또 다른 실시예들은 상기 설명을 판독한 이후에 당업자에 명백해질 것이다. 본 설명과 도면들이 실시예들 및 예들을 개시할지라도, 본 발명은 이들 특정 예들에 제한되지 않는다. 많은 수정들 및 변형들이 첨부된 청구항들에 의해 규정되는 본 발명의 범위로부터 벗어나지 않고 행해질 수 있다.
여기에서 상기 개시된 시스템들 및 방법들은 소프트웨어, 펌웨어, 하드웨어 또는 그의 조합으로서 구현될 수 있다. 특정 구성요소들 또는 모든 구성요소들은 디지털 신호 처리기 또는 마이크로처리기에 의해 실행된 소프트웨어로서 구현될 수 있거나, 하드웨어 또는 주문형 반도체(application-specific integrated circuit)로서 구현될 수 있다. 이러한 소프트웨어는 컴퓨터 판독가능한 매체 상에 분배될 수 있고, 상기 컴퓨터 판독가능한 매체는 컴퓨터 저장 매체(또는 비-일시적 매체) 및 통신 매체(일시적 매체)를 포함할 수 있다. 당업자에게 잘 공지된 바와 같이, 컴퓨터 저장 매체는 컴퓨터 판독가능한 지시들, 데이터 구조들, 프로그램 모듈들 또는 다른 데이터와 같은, 정보를 저장하기 위한 임의의 방법 또는 기술에 구현된 휘발성 및 비휘발성, 제거가능하거나 제거가능하지 않은 매체 둘 모두를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기술, CD-ROM, 디지털 다기능 디스크들(DVD) 또는 다른 광 디스크 저장장치, 자기 카세트들, 자기 테이프, 자기 디스크 저장장치 또는 다른 자기 저장장치 디바이스들, 또는 원하는 정보를 저장하도록 이용될 수 있고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함하지만, 이에 제한되지 않는다. 또한, 통신 매체는 전형적으로 컴퓨터 판독가능한 지시들, 데이터 구조들, 프로그램 모듈들 또는 반송파 또는 다른 전송 매커니즘과 같은 변조된 데이터 신호의 다른 데이터를 구현하고 임의의 정보 전달 매체를 포함함이 당업자에게 잘 공지된다.
실시예들의 리스트
1. 오디오 시간 신호로서 비트 스트림 신호를 디코딩하기 위한 디코더 시스템(400; 500; 700; 1000)으로서:
예비 오디오 시간 신호로서 비트 스트림 신호를 디코딩하기 위한 디코딩 섹션(410; 511; 512; 513; 711; 712; 713; 1011; 1013); 및
오디오 시간 신호를 얻기 위해 예비 오디오 시간 신호를 필터링하기 위한 고조파 사이의 잡음 감쇠 포스트 필터(440; 540; 740; 1040)를 포함하는, 상기 디코더 시스템(400; 500; 700; 1000)에 있어서,
비트 스트림 신호에 인코딩된 포스트-필터링 정보에 응답하여 포스트 필터를 디스에이블링하도록 적응된 제어 섹션으로서, 예비 오디오 시간 신호는 오디오 시간 신호로서 출력되는, 상기 제어 섹션에 의해 특징지워지는, 디코더 시스템(400; 500; 700; 1000).
2. 실시예 1에 있어서, 포스트 필터는 또한 스펙트럼 밸리들에 위치된 잡음을 감쇠하도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
3. 실시예 1에 있어서, 제어 섹션은 디코더 시스템의 신호 처리 경로로부터 포스트 필터를 선택적으로 제외하기 위한 스위치(442; 541; 1042)를 포함하고, 포스트 필터는 디스에이블링되는, 디코더 시스템(400; 500; 700; 1000).
4. 실시예 1에 있어서, 포스트 필터는 고조파 사이의 감쇠를 결정하는 가변 이득을 갖고 제어 섹션은 미리 결정된 임계값 아래의 이득의 절대 값을 설정하도록 동작가능한 이득 제어기를 포함하고, 이에 의해 포스트 필터는 디스에이블링되는, 디코더 시스템(400; 500; 700; 1000).
5. 실시예 1에 있어서, 상기 디코딩 섹션은 음성 디코딩 모듈을 포함하는, 디코더 시스템(400; 500; 700; 1000).
6. 실시예 1에 있어서, 상기 디코딩 섹션은 코드-여기된 선형 예측, CELP, 디코딩 모듈(511; 711; 1011)을 포함하는, 디코더 시스템(400; 500; 700; 1000).
7. 실시예 5에 있어서, 인코더의 롱-텀 예측 섹션에 의해 추정된 피치 주파수는 비트 스트림 신호에 인코딩되는, 디코더 시스템(400; 500; 700; 1000).
8. 실시예 7에 있어서, 포스트 필터는 피치 주파수의 고조파들 사이에 위치된 스펙트럼 구성요소들을 감쇠하도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
9. 실시예 1에 있어서, 비트 스트림 신호는 피치 주파수의 표현을 포함하고 포스트 필터는 피치 주파수의 고조파들 사이에 위치된 스펙트럼 구성요소들을 감쇠하도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
10. 실시예 8 또는 실시예 9에 있어서, 포스트 필터는 미리 결정된 차단 주파수(cut-off frequency) 아래에 위치되는 단지 이러한 스펙트럼 구성요소들 만을 감쇠하도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
11. 실시예 6에 있어서,
디코딩 섹션은 또한 오디오 시간 신호로서 비트 스트림 신호를 디코딩하기 위한 변환-코딩된 여기(TCX) 디코딩 모듈(512; 712)을 포함하고,
제어 섹션은, 적어도,
a) TCX 모듈이 인에이블링되고 포스트 필터가 디스에이블링되는 모드;
b) CELP 모듈 및 포스트 필터가 인에이블링되는 모드; 및
c) CELP 모듈이 인에이블링되고 포스트 필터가 디스에이블링되는 모드의 모드들로 디코더 시스템을 동작시키도록 적응되고, 예비 오디오 시간 신호 및 오디오 시간 신호는 일치하는, 디코더 시스템(400; 500; 700; 1000).
12. 실시예 10에 있어서,
디코딩 섹션은 또한 오디오 시간 신호로서 비트 스트림 신호를 디코딩하기 위한 고급 오디오 코딩(AAC) 디코딩 모듈(513; 713)을 포함하고,
제어 섹션은 또한 다음 모드:
d) AAC 모듈이 인에이블링되고 포스트 필터가 디스에이블링되는 모드에서 디코더를 동작시키도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
13. 실시예 1에 있어서, 비트 스트림 신호는 시간 프레임들로 분할되고 제어 섹션은 전체 시간 프레임 또는 일련의 전체 시간 프레임들을 디스에이블링하도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
14. 실시예 13에 있어서, 제어 섹션은 또한 MPEG(Moving Pictures Experts Group) 비트 스트림의 각각의 시간 프레임에 대해, 이 시간 프레임과 연관된 데이터 필드를 수신하도록 적응되고 데이터 필드의 값에 응답하여, 포스트 필터를 디스에이블링하도록 동작가능한, 디코더 시스템(400; 500; 700; 1000).
15. 실시예 4에 있어서, 제어 섹션은 포스트 필터의 이득을 점진적으로 감소시키고/감소시키거나 증가시키도록 적응되는, 디코더 시스템(400; 500; 700; 1000).
16. 예비 오디오 시간 신호로서 비트 스트림 신호를 디코딩하기 위한 디코딩 섹션(410; 511; 512; 513; 711; 712; 713; 1011; 1013); 및
오디오 시간 신호를 얻기 위해 예비 오디오 시간 신호를 필터링하기 위한 고조파 사이의 잡음 감쇠 포스트 필터(440; 540; 740; 1040)를 포함하는, 디코더 시스템(400; 500; 700; 1000)에 있어서:
디코딩 섹션은 여기를 표현하는 중간 디코딩된 신호를 생성하고 상기 중간 디코딩된 신호를 제어 섹션에 제공하도록 적응되고;
제어 섹션은 중간 디코딩된 신호와 포스트 필터링의 영향을 받게 될 때의 중간 디코딩된 신호 사이의 차로서, 포스트 필터에 의해 디코딩된 신호로부터 제거되어야 하는 신호 구성요소를 근사화하는 대략적인 차 신호를 계산하고, 다음 기준들:
a) 대략적인 차 신호의 파워가 미리 결정된 임계값을 초과하는지의 여부;
b) 대략적인 차 신호의 특성이 음색인지의 여부;
c) 대략적인 차 신호의 주파수 크기 스펙트럼과 오디오 시간 신호의 주파수 크기 스펙트럼 사이의 차가 주파수에 대해 고르지 않게 분포되는지의 여부;
d) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 관련 엔벨로프 내의 주파수 간격들로 국한(localizing)되는지의 여부; 및
e) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 스케일 팩터에 의해 다운스케일링된 그 안의 가장 큰 신호 구성요소의 크기에 의해 오디오 시간 신호의 주파수 크기 스펙트럼을 스레시홀드(threshold)함으로써 얻어진 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부 중 적어도 하나의 기준을 평가하고,
긍정적인 결정에 응답하여, 포스트 필터를 디스에이블링하도록 적응되고, 이를 통해 예비 오디오 시간 신호는 오디오 시간 신호로서 출력되는, 디코더 시스템(400; 500; 700; 1000).
17. 예비 오디오 신호를 포함하는 입력 신호를 수신하고, 출력 오디오 신호를 제공하도록 적응된 고조파 사이의 잡음 감쇠 포스트 필터(440; 550; 740; 1040; 1140)에 있어서,
포스트-필터링 신호의 값에 따라, 다음 모드들:
i) 필터링된 신호를 얻기 위해 예비 오디오 신호를 필터링하고 상기 필터링된 신호를 출력 오디오 신호로서 제공하는 필터링 모드; 및
ii) 출력 오디오 신호로서 예비 오디오 신호를 제공하는 패스-스루 모드 중 하나의 모드로 포스트 필터를 선택적으로 동작시키기 위한 제어 섹션에 의해 특징지워지는, 고조파 사이의 잡음 감쇠 포스트 필터(440; 550; 740; 1040; 1140).
18. 실시예 17에 있어서, 포스트-필터링 신호는 입력 신호에 포함되는, 고조파 사이의 잡음 감쇠 포스트 필터(440; 550; 740; 1040; 1140).
19. 실시예 17에 있어서, 예비 오디오 신호의 피치 주파수를 추정하고 다음의 기준들:
a) 피치 주파수 아래의 스펙트럼 구성요소들의 파워가 미리 결정된 임계값을 초과하는지의 여부;
b) 피치 주파수 아래의 스펙트럼 구성요소들이 음색인지의 여부;
c) 피치 주파수의 고조파들 사이의 스펙트럼 구성요소들의 파워가 미리 결정된 임계값을 초과하는지의 여부; 및
d) 피치 주파수의 고조파들 사이의 스펙트럼 구성요소들이 음색인지의 여부 중 적어도 하나의 기준을 평가하고,
긍정적인 결정에 응답하여, 포스트 필터를 디스에이블링하는 부정적인 포스트-필터링 신호의 생성을 결정하도록 적응된 결정 모듈(1120)을 추가로 포함하는, 고조파 사이의 잡음 감쇠 포스트 필터(440; 550; 740; 1040; 1140).
20. 예비 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 단계; 및
고조파 사이의 잡음을 감쇠함으로써 예비 오디오 시간 신호를 포스트-필터링하여, 오디오 시간 신호를 얻는 단계를 포함하는, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 방법에 있어서:
포스트-필터링 단계는 비트 스트림 신호에 인코딩된 포스트-필터링 정보에 응답하여 선택적으로 생략되는 것을 특징으로 하는, 비트 스트림 신호를 디코딩하는 방법.
21. 실시예 20에 있어서, 포스트-필터링 단계는 또한 스펙트럼 밸리들에 위치된 잡음을 감쇠하는 단계를 포함하는, 비트 스트림 신호를 디코딩하는 방법.
22. 실시예 20에 있어서, 디코딩 단계는 음성 코딩을 위해 적응된 코딩 방법을 적용하는 단계를 포함하는, 비트 스트림 신호를 디코딩하는 방법.
23. 실시예 20에 있어서, 디코딩 단계는 코드-여기된 선형 예측(CELP) 디코딩을 적용하는 단계를 포함하는, 비트 스트림 신호를 디코딩하는 방법.
24. 실시예 22 또는 실시예 23에 있어서, 포스트-필터링 단계는 피치 주파수의 고조파들 사이에 위치된 스펙트럼 구성요소들을 감쇠하는 단계를 포함하고, 피치 주파수는 비트 스트림 신호로부터 추출되거나 디코딩 단계에서 추정되는, 비트 스트림 신호를 디코딩하는 방법.
25. 실시예 20에 있어서, 포스트-필터링 단계는 미리 결정된 차단 주파수 아래에 위치되는 단지 이러한 스펙트럼 구성요소들만 감쇠하는 단계를 포함하는, 비트 스트림 신호를 디코딩하는 방법.
26. 실시예 23에 있어서, 디코딩 단계 및 포스트-필터링 단계는:
a) TCX 디코딩;
b) 포스트 필터링을 갖는 CELP 디코딩; 및
c) 포스트 필터링이 없는 CELP 디코딩 중 하나를 선택적으로 수행하는, 비트 스트림 신호를 디코딩하는 방법.
27. 실시예 26에 있어서, 디코딩 단계 및 포스트-필터링 단계는 a), b), c) 및 d) 고급 오디오 코딩(AAC) 디코딩 중 하나를 선택적으로 수행하는, 비트 스트림 신호를 디코딩하는 방법.
28. 실시예 20에 있어서, 비트 스트림 신호는 시간 프레임들로 분할되고 포스트-필터링 단계는 전체 시간 프레임 또는 일련의 전체 시간 프레임들에 대해 생략되는, 비트 스트림 신호를 디코딩하는 방법.
29. 실시예 28에 있어서, 비트 스트림 신호는 MPEG(Moving Pictures Experts Group) 비트 스트림이고, 각각의 시간 프레임에 대해, 연관된 데이터 필드를 포함하고,
포스트-필터링 단계는 연관된 데이터 필드의 값에 응답하여 시간 프레임에서 생략되는, 비트 스트림 신호를 디코딩하는 방법.
30. 실시예 20에 있어서, 포스트-필터링의 상기 생략은:
감쇠의 완전한 생략,
감쇠의 부분적인 생략,
점진적으로 증가하는 감쇠, 및
점진적으로 감소하는 감쇠 중 하나를 포함하는, 비트 스트림 신호를 디코딩하는 방법.
31. 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 방법에 있어서:
예비 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 단계; 및
고조파 사이의 잡음을 감쇠함으로써 예비 오디오 시간 신호를 포스트-필터링하여, 오디오 시간 신호를 얻는 단계를 포함하고,
디코딩 단계는:
여기를 표현하는 중간 디코딩된 신호를 추출하는 단계;
중간 디코딩된 신호와 포스트 필터링의 영향을 받게 될 때의 중간 디코딩된 신호 사이의 차로서, 포스트 필터에 의해 디코딩된 신호로부터 제거되어야 하는 신호 구성요소를 근사화하는 대략적인 차 신호를 계산하는 단계;
다음 기준들:
a) 대략적인 차 신호의 파워가 미리 결정된 임계값을 초과하는지의 여부;
b) 대략적인 차 신호의 특성이 음색인지의 여부;
c) 대략적인 차 신호의 주파수 크기 스펙트럼과 오디오 시간 신호의 주파수 크기 스펙트럼 사이의 차가 주파수에 대해 고르지 않게 분포되는지의 여부;
d) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부; 및
e) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 스케일 팩터에 의해 다운스케일링된 그 안의 가장 큰 신호 구성요소의 크기에 의해 오디오 시간 신호의 주파수 크기 스펙트럼을 스레시홀드함으로써 얻어진 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부; 중
적어도 하나의 기준을 평가하는 단계; 및
긍정적인 결정에 응답하여, 포스트 필터를 디스에이블링하는 단계를 포함하고,
이에 의해 예비 오디오 시간 신호는 오디오 시간 신호로서 출력되는, 비트 스트림 신호를 디코딩하는 방법.
32. 비트 스트림 신호로서 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800)으로서, 비트 스트림 신호로서 오디오 시간 신호를 인코딩하기 위한 인코딩 섹션(810)을 포함하는, 상기 인코더 시스템(800)에 있어서,
고조파 사이의 잡음의 감쇠를 포함하는 포스트 필터링이 비트 스트림 신호의 디코딩에서 디스에이블링되어야 하는지의 여부를 결정하고 포스트 필터링 정보로서 비트 스트림 신호에 상기 결정을 인코딩하도록 적응된 결정 섹션(820)에 의해 특징지워지는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
33. 실시예 32에 있어서, 결정 섹션은 스펙트럼 밸리들에 위치된 잡음의 감쇠를 추가로 포함하는 포스트 필터링을 디스에이블링할지의 여부를 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
34. 실시예 32에 있어서, 인코딩 섹션은 음성 코딩 모듈을 포함하는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
35. 실시예 32에 있어서, 인코딩 섹션은 코드-여기된 선형 예측(CELP) 인코딩 모듈을 포함하는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
36. 실시예 32에 있어서, 결정 섹션은:
지배적 기본 주파수를 갖는 신호 구성요소 및 기본 주파수 아래에 위치된 신호 구성요소의 공동-존재를 검출하고, 선택적으로 상기 신호 구성요소들의 고조파들 사이를 검출하고;
그에 응답하여, 디스에이블링을 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
37. 실시예 35에 있어서,
CELP 인코딩 모듈은 오디오 시간 신호의 피치 주파수를 추정하도록 적응되고;
결정 섹션은 추정된 피치 주파수 아래에 위치된 스펙트럼 구성요소들을 검출하고, 그에 응답하여, 디스에이블링을 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
38. 실시예 35에 있어서, 결정 섹션은:
CELP-코딩될 때의 오디오 시간 신호의 예측된 파워와 CELP-코딩되고 포스트-필터링될 때의 오디오 시간 신호의 예측된 파워 사이의 차를 계산하고,
미리 결정된 임계값을 초과하는 상기 차에 응답하여, 디스에이블링을 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
39. 실시예 35에 있어서,
상기 인코딩 섹션은 또한 변환-코딩된 여기(TCX) 인코딩 모듈을 포함하고,
결정 섹션은 다음 코딩 모드들:
a) TCX 코딩;
b) 포스트 필터링을 갖는 CELP 코딩; 및
c) 포스트 필터링이 없는 CELP 코딩 중 하나를 선택하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
40. 실시예 39에 있어서, 다음 수퍼-모드들:
i) 결정 섹션이 디스에이블링되는 고급 오디오 코딩(AAC) 코딩; 및
ii) 결정 섹션이 코딩 모드들 a), b) 및 c) 중 하나를 선택하도록 인에이블링되는 TCX/CELP 코딩 중 하나를 선택하도록 적응된 코딩 선택기(814)를 추가로 포함하는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
41. 실시예 39에 있어서, 결정 섹션은 레이트-왜곡 최적화에 기초하여 어떤 모드가 이용되는지를 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
42. 실시예 32에 있어서,
비트 스트림 신호를 시간 프레임들로 분할하도록 또한 적응되고,
결정 섹션은 전체 프레임들로 구성되는 시간 세그먼트들에서 포스트 필터의 디스에이블링을 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
43. 실시예 32에 있어서,
결정 섹션은 포스트 필터의 감쇠를 점진적으로 감소시키고/감소시키거나 증가시킬지를 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
44. 실시예 32에 있어서,
결정 섹션은 추정된 피치 주파수 아래의 오디오 시간 신호의 파워를 계산하고;
미리 결정된 임계값을 초과하는 상기 파워에 응답하여, 디스에이블링을 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
45. 실시예 32에 있어서, 결정 섹션은:
오디오 시간 신호로부터, 포스트 필터에 의해 미래의 디코딩된 신호로부터 제거되어야 하는 신호 구성요소를 근사화하는 대략적인 차 신호를 얻고;
다음 기준들:
a) 대략적인 차 신호의 파워가 미리 결정된 임계값을 초과하는지의 여부;
b) 대략적인 차 신호의 특성이 음색인지의 여부;
c) 대략적인 차 신호의 주파수 크기 스펙트럼과 오디오 시간 신호의 주파수 크기 스펙트럼 사이의 차가 주파수에 대해 고르지 않게 분포되는지의 여부;
d) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부; 및
e) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 스케일 팩터에 의해 다운스케일링된 그 안의 가장 큰 신호 구성요소의 크기에 의해 오디오 시간 신호의 주파수 크기 스펙트럼을 스레시홀드함으로써 얻어진 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부; 중
적어도 하나의 기준을 평가하고;
긍정적인 결정에 응답하여, 포스트 필터의 디스에이블링을 결정하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
46. 실시예 45에 있어서, 결정 섹션은 오디오 시간 신호와 포스트 필터링의 영향을 받게 될 때의 오디오 시간 신호 사이의 차로서 대략적인 차 신호를 계산하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
47. 실시예 45에 있어서,
인코딩 섹션은 여기를 표현하는 중간 디코딩된 신호를 추출하고 결정 섹션에 상기 추출된 중간 디코딩된 신호를 제공하도록 적응되고;
결정 섹션은 오디오 시간 신호와 포스트 필터링의 영향을 받게 될 때의 중간 디코딩된 신호 사이의 차로서 대략적인 차 신호를 계산하도록 적응되는, 오디오 시간 신호를 인코딩하기 위한 인코더 시스템(800).
48. 비트 스트림 신호로서 오디오 시간 신호를 인코딩하는 방법으로서, 비트 스트림 신호로서 오디오 시간 신호를 인코딩하는 단계를 포함하는, 상기 방법에 있어서,
고조파 사이의 잡음의 감쇠를 포함하는 포스트 필터링이 비트 스트림의 디코딩에서 디스에이블링되어야 하는지의 여부를 결정하고 포스트 필터링 정보로서 비트 스트림 신호에 상기 결정을 인코딩하는 또 다른 단계에 의해 특징지워지는, 오디오 시간 신호를 인코딩하는 방법.
49. 실시예 48에 있어서, 결정 단계는 스펙트럼 밸리들에 위치된 잡음의 감쇠를 추가로 포함하는 포스트 필터링에 관련하는, 오디오 시간 신호를 인코딩하는 방법.
50. 실시예 48에 있어서, 인코딩 단계는 음성 코딩을 위해 적응된 코딩 방법을 적용하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
51. 실시예 48에 있어서, 인코딩 단계는 코드-여기된 선형 예측(CELP) 코딩을 적용하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
52. 실시예 48에 있어서,
지배적 기본 주파수를 갖는 신호 구성요소 및 기본 주파수 아래에 위치된 신호 구성요소의 공동-존재를 검출하고, 선택적으로 상기 신호 구성요소들의 고조파들 사이를 검출하는 단계를 추가로 포함하고,
포스트 필터링을 디스에이블링하기 위한 결정은 긍정적인 검출 결과의 경우에 행해지는, 오디오 시간 신호를 인코딩하는 방법.
53. 실시예 51에 있어서,
상기 CELP 코딩 단계는 오디오 시간 신호의 피치 주파수를 추정하는 단계를 포함하고,
결정 단계는 추정된 피치 주파수 아래에 위치된 스펙트럼 구성요소들을 검출하는 단계를 포함하고 포스트 필터링을 디스에이블링하기 위한 결정은 긍정적인 검출 결과의 경우에 행해지는, 오디오 시간 신호를 인코딩하는 방법.
54. 실시예 51에 있어서,
CELP-코딩될 때의 오디오 시간 신호의 예측된 파워와 CELP-코딩되고 포스트-필터링될 때의 오디오 시간 신호의 예측된 파워 사이의 차를 계산하는 단계를 추가로 포함하고,
포스트 필터링을 디스에이블링하기 위한 결정은, 이 차가 미리 결정된 임계값을 초과하면 행해지는, 오디오 시간 신호를 인코딩하는 방법.
55. 실시예 51에 있어서,
인코딩 단계는 CELP 코딩 또는 변환-코딩된 여기(TCX) 코딩을 선택적으로 적용하는 단계를 포함하고,
포스트 필터링이 디스에이블되어야 하는지의 여부를 결정하는 단계는 CELP 코딩이 적용될 때에만 행해지는, 오디오 시간 신호를 인코딩하는 방법.
56. 실시예 55에 있어서, 결정 단계는 레이트-왜곡 최적화에 기초하여, 다음 동작 모드들:
a) TCX 코딩 모드;
b) 포스트 필터링을 갖는 CELP 코딩 모드; 및
c) 포스트 필터링이 없는 CELP 코딩 모드; 중
하나의 모드를 선택하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
57. 실시예 55에 있어서, 결정 단계는 레이트-왜곡 최적화에 기초하여, 다음 동작 모드들:
a) TCX 코딩 모드;
b) 포스트 필터링을 갖는 CELP 코딩 모드;
c) 포스트 필터링이 없는 CELP 코딩 모드; 및
d) 고급 오디오 코딩(AAC) 코딩 모드; 중
하나의 모드를 선택하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
58. 실시예 48에 있어서,
인코딩 단계는 오디오 시간 신호를 시간 프레임들로 분할하고 대응하는 시간 프레임들을 가지는 비트 스트림 신호를 형성하는 단계를 포함하고,
포스트 필터링이 디스에이블링되어야 하는 결정 단계는 매 시간 프레임에 한번은 실행되는, 오디오 시간 신호를 인코딩하는 방법.
59. 실시예 48에 있어서, 포스트 필터링이 디스에이블링되어야 하는 결정 단계의 결과는:
감쇠 없음,
완전한 감쇠,
부분적인 감쇠,
점진적으로 증가하는 감쇠, 및
점진적으로 감소하는 감쇠로부터 선택되는, 오디오 시간 신호를 인코딩하는 방법.
60. 실시예 48에 있어서, 결정 단계는 추정된 피치 주파수 아래의 오디오 시간 신호의 파워를 계산하는 단계를 포함하고, 미리 결정된 임계값을 초과하는 상기 파워에 응답하여 포스트 필터를 디스에이블링하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
61. 실시예 48에 있어서,
인코딩 단계는 오디오 시간 신호로부터, 포스트 필터에 의해 미래의 디코딩된 신호로부터 제거되어야 하는 신호 구성요소를 근사화하는 대략적인 차 신호를 유도하는 단계를 포함하고,
결정 단계는:
a) 대략적인 차 신호의 파워가 미리 결정된 임계값을 초과하는지의 여부;
b) 대략적인 차 신호의 특성이 음색인지의 여부;
c) 대략적인 차 신호의 주파수 크기 스펙트럼과 오디오 시간 신호의 주파수 크기 스펙트럼 사이의 차가 주파수에 대해 고르지 않게 분포되는지의 여부;
d) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부; 및
e) 대략적인 차 신호의 주파수 크기 스펙트럼이 미리 결정된 스케일 팩터에 의해 다운스케일링된 그 안의 가장 큰 신호 구성요소의 크기에 의해 오디오 시간 신호의 주파수 크기 스펙트럼을 스레시홀드함으로써 얻어진 관련 엔벨로프 내의 주파수 간격들로 국한되는지의 여부 중 적어도 하나를 평가하는 단계; 및
적어도 긍정적인 결정에 응답하여, 포스트 필터를 디스에이블링하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
62. 실시예 61에 있어서, 대략적인 차 신호는 오디오 시간 신호와 포스트 필터링의 영향을 받게 될 때의 오디오 시간 신호 사이의 차로서 계산되는, 오디오 시간 신호를 인코딩하는 방법.
63. 실시예 61에 있어서,
인코딩 단계는 여기를 표현하는 중간 디코딩된 신호를 추출하는 단계를 포함하고,
결정 단계는 대략적인 차 신호를 오디오 시간 신호와 포스트 필터링의 영향을 받게 될 때의 중간 디코딩된 신호 사이의 차로서 계산하는 단계를 포함하는, 오디오 시간 신호를 인코딩하는 방법.
64. 실시예 20 내지 31 및 48 내지 63 중 어느 하나의 방법을 수행하기 위한 지시들을 저장하는 데이터 캐리어를 포함하는, 컴퓨터-프로그램 제품.
400: 디코더 시스템
410: 디코딩 모듈
440, 540, 1040, 1100: 포스트 필터 442, 1042: 스위치
443: 지연 모듈 444, 1044: 바이패스 라인
500: 트리플-모드 디코더 시스템 511, 711: ACELP 디코딩 모듈
512: TCX 디코딩 모듈 513: AAC 디코딩 모듈
703: 제 1 전이 윈도우잉 모듈 704: 제 2 전이 모듈
713, 1013: 주파수-도메인 디코딩 모듈 740: 피치 강화 모듈
750: SBR 모듈 800: 인코더 시스템
810: 인코딩 모듈 820, 1120: 결정 모듈
830: 멀티플렉서 1000: 디코더
1011: CELP 디코딩 모듈 1043: 보상 지연 모듈
1140: 포스트 필터링 모듈
440, 540, 1040, 1100: 포스트 필터 442, 1042: 스위치
443: 지연 모듈 444, 1044: 바이패스 라인
500: 트리플-모드 디코더 시스템 511, 711: ACELP 디코딩 모듈
512: TCX 디코딩 모듈 513: AAC 디코딩 모듈
703: 제 1 전이 윈도우잉 모듈 704: 제 2 전이 모듈
713, 1013: 주파수-도메인 디코딩 모듈 740: 피치 강화 모듈
750: SBR 모듈 800: 인코더 시스템
810: 인코딩 모듈 820, 1120: 결정 모듈
830: 멀티플렉서 1000: 디코더
1011: CELP 디코딩 모듈 1043: 보상 지연 모듈
1140: 포스트 필터링 모듈
Claims (7)
- 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코더 시스템(400; 500; 700; 1000)으로서:
예비 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코딩부(410; 511, 512, 513; 711, 712, 713; 1011, 1013)로서, 상기 디코딩부는 포스트 필터링을 포함하는 적어도 하나의 제 1 디코딩 모드에서 및 포스트 필터링을 포함하지 않는 적어도 하나의 제 2 디코딩 모드에서 작동가능한, 상기 디코딩부; 및
오디오 시간 신호를 얻기 위해 상기 예비 오디오 시간 신호를 포스트 필터링하는 피치 강화 필터(440; 540; 740; 1040)로서, 피치 강화는 포스트 필터 이득에 의해 제어되는, 상기 피치 강화 필터를 포함하는, 상기 디코더 시스템에 있어서,
제어부가, 상기 적어도 하나의 제 1 디코딩 모드에서, 포스트 필터 이득을 0(zero)으로 설정하여 비트 스트림 신호에서 인코딩되는 포스트 필터링 정보에만 응답하여 상기 피치 강화 필터를 선택적으로 디스에이블하도록 하고, 상기 포스트 필터링 정보는 포스트 필터링을 디스에이블할지 여부에 대한 인코더측 결정을 나타내고, 상기 예비 오디오 시간 신호는 상기 오디오 시간 신호로서 출력되는 것을 특징으로 하는, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코더 시스템. - 제 1 항에 있어서,
상기 디코딩부는, CELP(code-excited linear predicition) 디코딩 모듈(511; 711; 1011)을 포함하는, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코더 시스템. - 제 2 항에 있어서,
상기 디코딩부는 주파수 도메인 디코딩 모듈(713; 1013)인, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코더 시스템. - 제 1 항에 있어서,
상기 피치 강화 필터는, 피치 강화 필터가 디스에이블되면, 포스트 필터 이득을 0(zero)으로 설정하는 이득 제어기를 더 포함하는, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코더 시스템. - 제 1 항에 있어서,
상기 피치 강화 필터는 베이스 포스트 필터인, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 디코더 시스템. - 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 방법으로서:
예비 오디오 시간 신호로서 비트 스트림 신호를 복수의 디코딩 모드들 중 하나에서 디코딩하는 단계로서, 상기 복수의 디코딩 모드들은 포스트 필터링 단계를 포함하는 적어도 하나의 제 1 디코딩 모드 및 포스트 필터링 단계를 포함하지 않는 적어도 하나의 제 2 디코딩 모드를 포함하는, 상기 디코딩하는 단계를 포함하고,
상기 포스트 필터링 단계는 상기 예비 오디오 시간 신호에 대해 피치 강화 필터를 응용하여, 오디오 시간 신호를 얻고, 상기 피치 강화 필터는 포스트 필터 이득에 의해 제어되는, 상기 디코딩하는 방법에 있어서,
상기 적어도 하나의 제 1 디코딩 모드에서, 상기 포스트 필터링 단계는 포스트 필터 이득을 0(zero)으로 설정하여 비트 스트림 신호에서 인코딩되는 포스트 필터링 정보에만 응답하여 선택적으로 디스에이블되고, 상기 포스트 필터링 정보는 포스트 필터링을 디스에이블할지 여부에 대한 인코더측 결정을 나타내는 것을 특징으로 하는, 오디오 시간 신호로서 비트 스트림 신호를 디코딩하는 방법. - 디지털 신호 프로세서 상에서 실행될 때, 상기 디지털 신호 프로세서로 하여금 제 6 항의 방법을 수행하도록 하는 명령들을 저장하는 데이터 캐리어를 포함하는 컴퓨터 프로그램 프라덕트.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020237002578A KR20230018539A (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36123710P | 2010-07-02 | 2010-07-02 | |
US61/361,237 | 2010-07-02 | ||
KR1020217027394A KR102388001B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
PCT/EP2011/060555 WO2012000882A1 (en) | 2010-07-02 | 2011-06-23 | Selective bass post filter |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217027394A Division KR102388001B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237002578A Division KR20230018539A (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220053032A true KR20220053032A (ko) | 2022-04-28 |
KR102492622B1 KR102492622B1 (ko) | 2023-01-30 |
Family
ID=44504387
Family Applications (12)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237002578A KR20230018539A (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020197028834A KR102079000B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020217009907A KR102296955B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020167018666A KR101696634B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020167016672A KR101730356B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020137001635A KR101449979B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020207003957A KR102238082B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020217027394A KR102388001B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020227012264A KR102492622B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020167016674A KR101696632B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020197011298A KR102030335B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020147010347A KR101972762B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
Family Applications Before (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237002578A KR20230018539A (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020197028834A KR102079000B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020217009907A KR102296955B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020167018666A KR101696634B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020167016672A KR101730356B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020137001635A KR101449979B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020207003957A KR102238082B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020217027394A KR102388001B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167016674A KR101696632B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020197011298A KR102030335B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
KR1020147010347A KR101972762B1 (ko) | 2010-07-02 | 2011-06-23 | 선택적인 베이스 포스트 필터 |
Country Status (18)
Country | Link |
---|---|
US (15) | US9224403B2 (ko) |
EP (9) | EP3605534B1 (ko) |
JP (13) | JP6178236B2 (ko) |
KR (12) | KR20230018539A (ko) |
CN (7) | CN105261370B (ko) |
AU (1) | AU2011273680B2 (ko) |
CA (14) | CA2801805C (ko) |
DK (2) | DK3079153T3 (ko) |
ES (7) | ES2683648T3 (ko) |
HK (8) | HK1183965A1 (ko) |
HU (2) | HUE039862T2 (ko) |
IL (10) | IL295473B2 (ko) |
MX (1) | MX2012014525A (ko) |
MY (4) | MY176192A (ko) |
PL (2) | PL3079152T3 (ko) |
RU (6) | RU2562422C2 (ko) |
SG (7) | SG10201604880YA (ko) |
WO (1) | WO2012000882A1 (ko) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3079152T3 (pl) | 2010-07-02 | 2018-10-31 | Dolby International Ab | Dekodowanie audio z selektywnym późniejszym filtrowaniem |
AU2014211525B2 (en) * | 2013-01-29 | 2016-09-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal |
EP2981959B1 (en) | 2013-04-05 | 2018-07-25 | Dolby International AB | Audio encoder and decoder for interleaved waveform coding |
WO2014204911A1 (en) | 2013-06-18 | 2014-12-24 | Dolby Laboratories Licensing Corporation | Bass management for audio rendering |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
US10141004B2 (en) * | 2013-08-28 | 2018-11-27 | Dolby Laboratories Licensing Corporation | Hybrid waveform-coded and parametric-coded speech enhancement |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
CN105957534B (zh) * | 2016-06-28 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 自适应滤波方法和自适应滤波器 |
TWI752166B (zh) | 2017-03-23 | 2022-01-11 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US10475456B1 (en) * | 2018-06-04 | 2019-11-12 | Qualcomm Incorporated | Smart coding mode switching in audio rate adaptation |
EP4139919B1 (en) | 2020-04-24 | 2024-10-30 | Telefonaktiebolaget LM ERICSSON (PUBL) | Low cost adaptation of bass post-filter |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999038155A1 (en) * | 1998-01-21 | 1999-07-29 | Nokia Mobile Phones Limited | A decoding method and system comprising an adaptive postfilter |
US6098036A (en) * | 1998-07-13 | 2000-08-01 | Lockheed Martin Corp. | Speech coding system and method including spectral formant enhancer |
Family Cites Families (154)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
FI95085C (fi) * | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
US5434947A (en) * | 1993-02-23 | 1995-07-18 | Motorola | Method for generating a spectral noise weighting filter for use in a speech coder |
JPH06250697A (ja) * | 1993-02-26 | 1994-09-09 | Fujitsu Ltd | 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置 |
CA2094780A1 (en) | 1993-04-23 | 1994-10-24 | Claude Laflamme | Transform coded excitation for speech and audio coding |
FI96248C (fi) * | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
CA2121667A1 (en) | 1994-04-19 | 1995-10-20 | Jean-Pierre Adoul | Differential-transform-coded excitation for speech and audio coding |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5664055A (en) | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
JPH0946268A (ja) | 1995-07-26 | 1997-02-14 | Toshiba Corp | ディジタル音声通信装置 |
JPH0950298A (ja) * | 1995-08-07 | 1997-02-18 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号化装置 |
JP3483998B2 (ja) * | 1995-09-14 | 2004-01-06 | 株式会社東芝 | ピッチ強調方法および装置 |
US5864798A (en) | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
TW321810B (ko) | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
WO1997031367A1 (en) | 1996-02-26 | 1997-08-28 | At & T Corp. | Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models |
JP2940464B2 (ja) * | 1996-03-27 | 1999-08-25 | 日本電気株式会社 | 音声復号化装置 |
US5802109A (en) | 1996-03-28 | 1998-09-01 | Nec Corporation | Speech encoding communication system |
JPH09319397A (ja) * | 1996-05-28 | 1997-12-12 | Sony Corp | ディジタル信号処理装置 |
JP3183826B2 (ja) | 1996-06-06 | 2001-07-09 | 三菱電機株式会社 | 音声符号化装置及び音声復号化装置 |
EP0814458B1 (en) * | 1996-06-19 | 2004-09-22 | Texas Instruments Incorporated | Improvements in or relating to speech coding |
JP2974059B2 (ja) * | 1996-07-18 | 1999-11-08 | 日本電気株式会社 | ピッチポストフィルタ装置 |
JPH10143195A (ja) * | 1996-11-14 | 1998-05-29 | Olympus Optical Co Ltd | ポストフィルタ |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
JPH113099A (ja) * | 1997-04-16 | 1999-01-06 | Mitsubishi Electric Corp | 音声符号化復号化システム、音声符号化装置及び音声復号化装置 |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US6114859A (en) | 1997-07-14 | 2000-09-05 | Nissin Electric Co., Ltd. | Harmonic characteristic measuring method and harmonic characteristic measuring apparatus |
US6385195B2 (en) | 1997-07-21 | 2002-05-07 | Telefonaktiebolaget L M Ericsson (Publ) | Enhanced interworking function for interfacing digital cellular voice and fax protocols and internet protocols |
JP3986150B2 (ja) | 1998-01-27 | 2007-10-03 | 興和株式会社 | 一次元データへの電子透かし |
TW376611B (en) * | 1998-05-26 | 1999-12-11 | Koninkl Philips Electronics Nv | Transmission system with improved speech encoder |
US6714908B1 (en) | 1998-05-27 | 2004-03-30 | Ntt Mobile Communications Network, Inc. | Modified concealing device and method for a speech decoder |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
KR100281181B1 (ko) * | 1998-10-16 | 2001-02-01 | 윤종용 | 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법 |
JP2000206999A (ja) * | 1999-01-19 | 2000-07-28 | Nec Corp | 音声符号伝送装置 |
EP1052622B1 (en) * | 1999-05-11 | 2007-07-11 | Nippon Telegraph and Telephone Corporation | Selection of a synthesis filter for CELP type wideband audio coding |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7222070B1 (en) | 1999-09-22 | 2007-05-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
JP3559485B2 (ja) | 1999-11-22 | 2004-09-02 | 日本電信電話株式会社 | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 |
US20020016161A1 (en) * | 2000-02-10 | 2002-02-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for compression of speech encoded parameters |
JP2001249700A (ja) * | 2000-03-06 | 2001-09-14 | Oki Electric Ind Co Ltd | 音声符号化装置及び音声復号装置 |
ATE420432T1 (de) * | 2000-04-24 | 2009-01-15 | Qualcomm Inc | Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
JP2002149200A (ja) | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
JP2005510925A (ja) | 2001-11-30 | 2005-04-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号コード化 |
JP3733588B2 (ja) * | 2001-12-13 | 2006-01-11 | 日本電気株式会社 | 音声復号化装置、及び、音声復号化方法 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
DE10328777A1 (de) | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
CN1288557C (zh) * | 2003-06-25 | 2006-12-06 | 英业达股份有限公司 | 多执行线程同时停止的方法 |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN1212608C (zh) * | 2003-09-12 | 2005-07-27 | 中国科学院声学研究所 | 一种采用后置滤波器的多通道语音增强方法 |
US7478040B2 (en) | 2003-10-24 | 2009-01-13 | Broadcom Corporation | Method for adaptive filtering |
AU2003274864A1 (en) * | 2003-10-24 | 2005-05-11 | Nokia Corpration | Noise-dependent postfiltering |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
AU2004319555A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding models |
DE602004025517D1 (de) | 2004-05-17 | 2010-03-25 | Nokia Corp | Audiocodierung mit verschiedenen codierungsrahmenlängen |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
US20060047522A1 (en) | 2004-08-26 | 2006-03-02 | Nokia Corporation | Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
KR100640468B1 (ko) * | 2005-01-25 | 2006-10-31 | 삼성전자주식회사 | 디지털 통신 시스템에서 음성 패킷의 전송과 처리 장치 및방법 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
PL1864101T3 (pl) | 2005-04-01 | 2012-11-30 | Qualcomm Inc | Systemy, sposoby i urządzenia do generowania górnopasmowego pobudzenia |
EP1881488B1 (en) * | 2005-05-11 | 2010-11-10 | Panasonic Corporation | Encoder, decoder, and their methods |
US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US8214220B2 (en) | 2005-05-26 | 2012-07-03 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
KR100718132B1 (ko) | 2005-06-24 | 2007-05-14 | 삼성전자주식회사 | 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치 |
RU2376656C1 (ru) | 2005-08-30 | 2009-12-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ кодирования и декодирования аудиосигнала и устройство для его осуществления |
KR100647336B1 (ko) | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
WO2007083934A1 (en) * | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
EP1974346B1 (en) | 2006-01-19 | 2013-10-02 | LG Electronics, Inc. | Method and apparatus for processing a media signal |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
US7991494B2 (en) | 2006-02-23 | 2011-08-02 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
US7454335B2 (en) | 2006-03-20 | 2008-11-18 | Mindspeed Technologies, Inc. | Method and system for reducing effects of noise producing artifacts in a voice codec |
EP2323131A1 (en) | 2006-04-27 | 2011-05-18 | Panasonic Corporation | Audio encoding device, audio decoding device, and their method |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
ATE408217T1 (de) | 2006-06-30 | 2008-09-15 | Fraunhofer Ges Forschung | Audiokodierer, audiodekodierer und audioprozessor mit einer dynamisch variablen warp-charakteristik |
JP5190363B2 (ja) | 2006-07-12 | 2013-04-24 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
CN101145343B (zh) | 2006-09-15 | 2011-07-20 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN100483509C (zh) | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
KR101016224B1 (ko) | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
JPWO2008072701A1 (ja) | 2006-12-13 | 2010-04-02 | パナソニック株式会社 | ポストフィルタおよびフィルタリング方法 |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
EP1944761A1 (en) | 2007-01-15 | 2008-07-16 | Siemens Networks GmbH & Co. KG | Disturbance reduction in digital signal processing |
CN101231850B (zh) | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
US8620645B2 (en) * | 2007-03-02 | 2013-12-31 | Telefonaktiebolaget L M Ericsson (Publ) | Non-causal postfilter |
CN101622667B (zh) * | 2007-03-02 | 2012-08-15 | 艾利森电话股份有限公司 | 用于分层编解码器的后置滤波器 |
CN101256771A (zh) | 2007-03-02 | 2008-09-03 | 北京工业大学 | 嵌入式编码、解码方法、编码器、解码器及系统 |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
BRPI0808198A8 (pt) | 2007-03-02 | 2017-09-12 | Panasonic Corp | Dispositivo de codificação e método de codificação |
EP2116998B1 (en) * | 2007-03-02 | 2018-08-15 | III Holdings 12, LLC | Post-filter, decoding device, and post-filter processing method |
WO2008107027A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications network |
CN101617362B (zh) * | 2007-03-02 | 2012-07-18 | 松下电器产业株式会社 | 语音解码装置和语音解码方法 |
DE102007025401B4 (de) | 2007-05-31 | 2015-10-01 | Siemens Aktiengesellschaft | Verfahren zur Auswertung eines Tomographie-Datensatzes und Tomographie-Arbeitsstation |
CN101321033B (zh) | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及系统 |
PT2165328T (pt) | 2007-06-11 | 2018-04-24 | Fraunhofer Ges Forschung | Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
KR101513028B1 (ko) * | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
KR101531910B1 (ko) | 2007-07-02 | 2015-06-29 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
WO2009010672A2 (fr) * | 2007-07-06 | 2009-01-22 | France Telecom | Limitation de distorsion introduite par un post-traitement au decodage d'un signal numerique |
ATE448649T1 (de) | 2007-08-13 | 2009-11-15 | Harman Becker Automotive Sys | Rauschverringerung mittels kombination aus strahlformung und nachfilterung |
WO2009022193A2 (en) | 2007-08-15 | 2009-02-19 | Nokia Corporation | Devices, methods and computer program products for audio signal coding and decoding |
CN101383151B (zh) * | 2007-09-06 | 2011-07-13 | 中兴通讯股份有限公司 | 一种数字音频质量增强系统和方法 |
KR101505831B1 (ko) | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
KR101170137B1 (ko) | 2008-02-15 | 2012-07-31 | 노키아 코포레이션 | 복잡성이 축소된 벡터 인덱싱 및 탈-인덱싱 |
KR101452722B1 (ko) | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
EP2269188B1 (en) | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
US8296135B2 (en) | 2008-04-22 | 2012-10-23 | Electronics And Telecommunications Research Institute | Noise cancellation system and method |
KR20090122143A (ko) | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN101609684B (zh) * | 2008-06-19 | 2012-06-06 | 展讯通信(上海)有限公司 | 解码语音信号的后处理滤波器 |
PT2313887T (pt) * | 2008-07-10 | 2017-11-14 | Voiceage Corp | Dispositivo e método de quantificação de filtro de lpc de taxa de bits variável e quantificação inversa |
ES2401487T3 (es) | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
TWI520128B (zh) | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
RU2400832C2 (ru) | 2008-11-24 | 2010-09-27 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) | Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
KR101622950B1 (ko) | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
KR20100115215A (ko) * | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
US9031834B2 (en) | 2009-09-04 | 2015-05-12 | Nuance Communications, Inc. | Speech enhancement techniques on the power spectrum |
US8260220B2 (en) * | 2009-09-28 | 2012-09-04 | Broadcom Corporation | Communication device with reduced noise speech coding |
EP2491556B1 (en) * | 2009-10-20 | 2024-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decoder, corresponding method and computer program |
CN108718413B (zh) * | 2010-04-26 | 2021-12-07 | 太阳专利托管公司 | 用于从周围块的统计推断出针对帧内预测的滤波模式 |
ES2501840T3 (es) | 2010-05-11 | 2014-10-02 | Telefonaktiebolaget Lm Ericsson (Publ) | Procedimiento y disposición para el procesamiento de señales de audio |
PL3079152T3 (pl) | 2010-07-02 | 2018-10-31 | Dolby International Ab | Dekodowanie audio z selektywnym późniejszym filtrowaniem |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
US11429505B2 (en) * | 2018-08-03 | 2022-08-30 | Dell Products L.P. | System and method to provide optimal polling of devices for real time data |
-
2011
- 2011-06-23 PL PL16166356T patent/PL3079152T3/pl unknown
- 2011-06-23 EP EP19196423.8A patent/EP3605534B1/en active Active
- 2011-06-23 SG SG10201604880YA patent/SG10201604880YA/en unknown
- 2011-06-23 MY MYPI2016001264A patent/MY176192A/en unknown
- 2011-06-23 EP EP11743032.2A patent/EP2589046B1/en active Active
- 2011-06-23 MY MYPI2012005368A patent/MY183707A/en unknown
- 2011-06-23 AU AU2011273680A patent/AU2011273680B2/en active Active
- 2011-06-23 ES ES16166358.8T patent/ES2683648T3/es active Active
- 2011-06-23 IL IL295473A patent/IL295473B2/en unknown
- 2011-06-23 SG SG10202005270YA patent/SG10202005270YA/en unknown
- 2011-06-23 CN CN201510680024.0A patent/CN105261370B/zh active Active
- 2011-06-23 KR KR1020237002578A patent/KR20230018539A/ko not_active Application Discontinuation
- 2011-06-23 CN CN201510680507.0A patent/CN105390140B/zh active Active
- 2011-06-23 CA CA2801805A patent/CA2801805C/en active Active
- 2011-06-23 CN CN201510681071.7A patent/CN105244035B/zh active Active
- 2011-06-23 CA CA2958360A patent/CA2958360C/en active Active
- 2011-06-23 MY MYPI2016000762A patent/MY176187A/en unknown
- 2011-06-23 ES ES21201950T patent/ES2984913T3/es active Active
- 2011-06-23 DK DK16166357.0T patent/DK3079153T3/en active
- 2011-06-23 HU HUE16166357A patent/HUE039862T2/hu unknown
- 2011-06-23 KR KR1020197028834A patent/KR102079000B1/ko active IP Right Grant
- 2011-06-23 ES ES16166356.2T patent/ES2683647T3/es active Active
- 2011-06-23 JP JP2013517203A patent/JP6178236B2/ja active Active
- 2011-06-23 KR KR1020217009907A patent/KR102296955B1/ko active IP Right Grant
- 2011-06-23 CA CA2976490A patent/CA2976490C/en active Active
- 2011-06-23 MY MYPI2016000763A patent/MY176188A/en unknown
- 2011-06-23 IL IL302557A patent/IL302557B2/en unknown
- 2011-06-23 CA CA3093517A patent/CA3093517C/en active Active
- 2011-06-23 RU RU2013102794/08A patent/RU2562422C2/ru active
- 2011-06-23 CA CA3025108A patent/CA3025108C/en active Active
- 2011-06-23 ES ES14164773.5T patent/ES2666150T3/es active Active
- 2011-06-23 KR KR1020167018666A patent/KR101696634B1/ko active IP Right Grant
- 2011-06-23 US US13/703,875 patent/US9224403B2/en active Active
- 2011-06-23 SG SG10201604866VA patent/SG10201604866VA/en unknown
- 2011-06-23 KR KR1020167016672A patent/KR101730356B1/ko active IP Right Grant
- 2011-06-23 KR KR1020137001635A patent/KR101449979B1/ko active IP Right Grant
- 2011-06-23 HU HUE16166356A patent/HUE038985T2/hu unknown
- 2011-06-23 KR KR1020207003957A patent/KR102238082B1/ko active IP Right Grant
- 2011-06-23 KR KR1020217027394A patent/KR102388001B1/ko active IP Right Grant
- 2011-06-23 CA CA3124114A patent/CA3124114C/en active Active
- 2011-06-23 CA CA2929090A patent/CA2929090C/en active Active
- 2011-06-23 PL PL16166357T patent/PL3079153T3/pl unknown
- 2011-06-23 EP EP14164773.5A patent/EP2757560B1/en active Active
- 2011-06-23 CA CA2958350A patent/CA2958350C/en active Active
- 2011-06-23 CA CA3160488A patent/CA3160488C/en active Active
- 2011-06-23 SG SG10201503004WA patent/SG10201503004WA/en unknown
- 2011-06-23 KR KR1020227012264A patent/KR102492622B1/ko active IP Right Grant
- 2011-06-23 KR KR1020167016674A patent/KR101696632B1/ko active IP Right Grant
- 2011-06-23 ES ES16166357.0T patent/ES2691934T3/es active Active
- 2011-06-23 EP EP18166150.5A patent/EP3422346B1/en active Active
- 2011-06-23 CA CA2928180A patent/CA2928180C/en active Active
- 2011-06-23 EP EP21201950.9A patent/EP3971893B1/en active Active
- 2011-06-23 CA CA3239015A patent/CA3239015A1/en active Pending
- 2011-06-23 EP EP16166358.8A patent/EP3079154B1/en active Active
- 2011-06-23 DK DK16166356.2T patent/DK3079152T3/en active
- 2011-06-23 SG SG10201901308TA patent/SG10201901308TA/en unknown
- 2011-06-23 KR KR1020197011298A patent/KR102030335B1/ko active IP Right Grant
- 2011-06-23 CA CA2937672A patent/CA2937672C/en active Active
- 2011-06-23 IL IL311020A patent/IL311020A/en unknown
- 2011-06-23 CA CA2976485A patent/CA2976485C/en active Active
- 2011-06-23 MX MX2012014525A patent/MX2012014525A/es active IP Right Grant
- 2011-06-23 EP EP16166356.2A patent/EP3079152B1/en active Active
- 2011-06-23 CN CN201180033082.4A patent/CN103098129B/zh active Active
- 2011-06-23 KR KR1020147010347A patent/KR101972762B1/ko active IP Right Grant
- 2011-06-23 CN CN201510680485.8A patent/CN105355209B/zh active Active
- 2011-06-23 ES ES11743032.2T patent/ES2484794T3/es active Active
- 2011-06-23 SG SG2012089884A patent/SG186209A1/en unknown
- 2011-06-23 CN CN201510680820.4A patent/CN105261372B/zh active Active
- 2011-06-23 SG SG10201605650WA patent/SG10201605650WA/en unknown
- 2011-06-23 CN CN201510680324.9A patent/CN105261371B/zh active Active
- 2011-06-23 EP EP16166357.0A patent/EP3079153B1/en active Active
- 2011-06-23 ES ES19196423T patent/ES2902392T3/es active Active
- 2011-06-23 EP EP24182508.2A patent/EP4407615A3/en active Pending
- 2011-06-23 WO PCT/EP2011/060555 patent/WO2012000882A1/en active Application Filing
- 2011-06-23 CA CA3207181A patent/CA3207181A1/en active Pending
-
2012
- 2012-11-28 IL IL223319A patent/IL223319A/en active IP Right Grant
-
2013
- 2013-10-10 HK HK13111395.3A patent/HK1183965A1/xx unknown
-
2014
- 2014-12-10 HK HK14112416.5A patent/HK1199135A1/xx unknown
-
2015
- 2015-05-07 RU RU2015117332A patent/RU2692416C2/ru active
- 2015-05-07 JP JP2015094729A patent/JP6258257B2/ja active Active
- 2015-11-09 US US14/936,408 patent/US9343077B2/en active Active
- 2015-11-09 US US14/936,393 patent/US9396736B2/en active Active
- 2015-11-20 US US14/947,906 patent/US9830923B2/en active Active
-
2016
- 2016-02-04 IL IL243958A patent/IL243958A/en active IP Right Grant
- 2016-02-18 US US15/047,317 patent/US9558753B2/en active Active
- 2016-03-31 US US15/086,409 patent/US9858940B2/en active Active
- 2016-04-12 US US15/097,201 patent/US9558754B2/en active Active
- 2016-04-12 US US15/097,192 patent/US9552824B2/en active Active
- 2016-04-25 RU RU2016116043/08A patent/RU2599338C1/ru active
- 2016-04-27 US US15/140,356 patent/US9595270B2/en active Active
- 2016-05-04 RU RU2016117277A patent/RU2642553C2/ru active
- 2016-05-10 IL IL245591A patent/IL245591A/en active IP Right Grant
- 2016-06-07 HK HK16106487.9A patent/HK1218462A1/zh unknown
- 2016-06-12 HK HK16106714.4A patent/HK1218803A1/zh unknown
- 2016-06-16 HK HK16106925.9A patent/HK1218987A1/zh unknown
- 2016-06-21 HK HK16107107.7A patent/HK1219168A1/zh unknown
- 2016-06-28 JP JP2016127884A patent/JP2016194711A/ja active Pending
- 2016-06-28 JP JP2016127885A patent/JP6679433B2/ja active Active
- 2016-07-10 IL IL246684A patent/IL246684A0/en active IP Right Grant
- 2016-07-11 HK HK16108033.4A patent/HK1220036A1/zh unknown
- 2016-07-11 RU RU2016127810A patent/RU2616774C1/ru active
- 2016-08-02 HK HK16109188.5A patent/HK1221326A1/zh unknown
- 2016-10-05 JP JP2016197150A patent/JP6279686B2/ja active Active
-
2017
- 2017-10-24 US US15/792,589 patent/US10236010B2/en active Active
- 2017-12-06 JP JP2017234202A patent/JP6556815B2/ja active Active
-
2019
- 2019-03-12 US US16/351,133 patent/US10811024B2/en active Active
- 2019-03-27 IL IL265661A patent/IL265661A/en active IP Right Grant
- 2019-05-14 RU RU2019114430A patent/RU2707716C1/ru active
- 2019-07-10 JP JP2019128330A patent/JP6682683B2/ja active Active
-
2020
- 2020-03-25 JP JP2020054398A patent/JP6812585B2/ja active Active
- 2020-10-16 US US17/073,228 patent/US11183200B2/en active Active
- 2020-11-18 IL IL278805A patent/IL278805B/en unknown
- 2020-12-16 JP JP2020208421A patent/JP6944038B2/ja active Active
-
2021
- 2021-09-09 JP JP2021146950A patent/JP7073565B2/ja active Active
- 2021-09-14 IL IL286405A patent/IL286405B2/en unknown
- 2021-11-22 US US17/532,775 patent/US11610595B2/en active Active
-
2022
- 2022-05-11 JP JP2022078082A patent/JP7147090B2/ja active Active
- 2022-09-21 JP JP2022150720A patent/JP7319441B2/ja active Active
-
2023
- 2023-03-17 US US18/185,691 patent/US11996111B2/en active Active
- 2023-07-20 JP JP2023118701A patent/JP2023134779A/ja active Pending
-
2024
- 2024-04-23 US US18/643,296 patent/US20240274145A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999038155A1 (en) * | 1998-01-21 | 1999-07-29 | Nokia Mobile Phones Limited | A decoding method and system comprising an adaptive postfilter |
US6098036A (en) * | 1998-07-13 | 2000-08-01 | Lockheed Martin Corp. | Speech coding system and method including spectral formant enhancer |
Non-Patent Citations (3)
Title |
---|
CHEN, Juin-Hwey; GERSHO, Allen. Adaptive postfiltering for quality enhancement of coded speech. IEEE Transactions on Speech and Audio Processing, 1995, 3.1: 59-71. * |
Juin-Hwey Chen, et al. Adaptive postfiltering for quality enhancement of coded speech. IEEE Transactions on Speech and Audio Processing. 1995.01. Vol.3. No. 1, pp.59-71. * |
Max Neuendorf(editor). WD7 of USAC. ISO/IEC JTC1/SC29/WG11 N11299. 2010.04.26. * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7319441B2 (ja) | デコーダシステム、方法及び記憶媒体 | |
AU2016204672B2 (en) | Audio encoder and decoder with multiple coding modes | |
AU2016202478B2 (en) | Pitch filter for audio signals and method for filtering an audio signal with a pitch filter | |
AU2015200065B2 (en) | Post filter, decoder system and method of decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |