KR20070062502A - 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화 - Google Patents

공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화 Download PDF

Info

Publication number
KR20070062502A
KR20070062502A KR1020077003513A KR20077003513A KR20070062502A KR 20070062502 A KR20070062502 A KR 20070062502A KR 1020077003513 A KR1020077003513 A KR 1020077003513A KR 20077003513 A KR20077003513 A KR 20077003513A KR 20070062502 A KR20070062502 A KR 20070062502A
Authority
KR
South Korea
Prior art keywords
parameter
channel
channels
quantization
energy
Prior art date
Application number
KR1020077003513A
Other languages
English (en)
Other versions
KR100878371B1 (ko
Inventor
요나스 뢰덴
요나스 엥데가르트
하이코 푸른하겐
제뢴 브레바트
에릭 슈이예르스
스티븐 반 데 파르
요하네스 힐페르트
쥐르겐 헤르
Original Assignee
코딩 테크놀러지스 에이비
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코딩 테크놀러지스 에이비, 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우., 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코딩 테크놀러지스 에이비
Publication of KR20070062502A publication Critical patent/KR20070062502A/ko
Application granted granted Critical
Publication of KR100878371B1 publication Critical patent/KR100878371B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

공간적 오디오 파라미터들의 효율적인 부호화를 위한 에너지 종속 양자화.
하나의 채널 또는 한 쌍의 채널들의 특징에 대한 척도인 파라미터는 다채널 신호의 다른 채널에 관련된 상기 채널 또는 한 쌍의 채널들의 특징에 대한 척도이고, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관련을 바탕으로 생성되는 양자화 규칙을 이용하여 더욱 효율적으로 양자화 될 수 있다. 심리음향적인 접근을 고려하는 양자화 규칙을 생성함으로써 부호화된 표현으로부터 재구성될 때, 다채널 신호의 부호화된 표현의 크기는 다채널 신호를 인식하는 질을 심각하게 방해하는 것 없이 더 거친 거친 양자화에 의해 감소될 수 있다.

Description

공간적 오디오 파라미터들의 효율적인 부호화를 위한 에너지 종속 양자화{ENERGY DEPENDENT QUANTIZATION FOR EFFICIENT CODING OF SPATIAL AUDIO PARAMETERS}
본 발명은, 공간적 오디오 파라미터들의 양자화에 관한 것으로서, 특히, 양자화된 공간적 오디오 파라미터들을 이용하는 재구성된 오디오 신호의 인식 품질을 줄이는 것 없이 더 효율적인 압축을 가능하게 하는 개념에 관한 것이다.
최근에, 다채널 오디오 재구성 기술은 더욱더 중요하게 되고 있다. 다섯 이상의 분리된 오디오 채널들을 구비한 다채널 오디오 신호들의 효율적인 전송 측면에서, 스테레오 또는 다채널 신호를 압축하는 다수의 방법들이 개발되어 왔다. 다채널 오디오 채널(파라미터 스테레오(PS:Parameteric Sereo), "BCC(Binaural Cue Coding)" 등)에 대한 최근의 접근은 다운-믹스 신호(단일음이 될 수 있거나 다수의 채널을 포함할 수 있는) 및 인식된 공간적 사운드 스테이지를 특징하는 파라미터릭 보조 정보 또는 사이드 정보(공간적 큐(spatial cues)로서 언급되는)에 의하여 다채널 오디오 신호를 나타낸다.
다채널 부호화 장치는 일반적으로 입력으로서 적어도 두 채널을 수신하고 하나 이상의 반송파 채널 및 파라미터 데이터를 출력한다. 상기 파라미터 데이터는 복호화기에서, 원래 다채널 신호의 근사치가 계산될 수 있도록 유도된다. 일반적으로, 상기 파라미터 데이터가 공간적 계수들의 샘플들이 아닌 임의의 재구성 알고리즘을 제어하기 위한 제어 파라미터들을 포함할 때, 상기 반송파 채널은 중요한 신호의 상대적 미세 표시를 제공하는 부 밴드 샘플들, 공간적 계수들, 시간 영역 샘플들 등을 포함할 것이다. 그러한 재구성은 다중화, 시간 천이, 주파수 천이, 위상 천이 등에 의한 가중치를 포함할 수 있다. 그래서, 파라미터 데이터는 신호 또는 관련 채널의 상대적으로 거친(조잡한, 조밀하지 않은, 등의 의미로 사용한다) 표현만을 포함한다.
상기 BCC(Binaural Cue Coding) 기술은, 2002년 5월 뮌휀 AES 회의 문서 5574에서 C. Faller 및 F. Baumgarte에 의해 저작된 "스테레오 및 다채널 오디오 압축에 적용된 BCC" 및 2002년 5월 올랜도 FL에서 C. Faller와 F. Baumgarte에 의해 저작된 "BCC용 청각 공간적 신호의 추정" 및 제2차 ICASSP 공개에서의 "BCC:공간적 오디오의 일반적이고 효율적인 표현"에서와 같은 다수의 공개에서 설명된다.
BCC 부호화에서, 다수의 오디오 입력 채널들은 중복 창을 구비한 변환을 바탕으로 이산 퓨리에 변환(Discrete Fourier Transform)을 이용하는 스펙트럼 표시로 변환된다. 결과적으로 일정한 스펙트럼은 비중복 영역으로 나뉜다. 각 영역은 ERB(equivalent rectangular bandwidth)에 비례하는 대역을 가진다. 이어서, 채널간 레벨 차(ICLD:Inter-Channel Level Difference) 및 채널간 시간 차(ICTD:Inter-Channel Level Difference)로 불려지는 공간적 파라미터들이 각 영역에 대해 추정된다. 상기 채널간 레벨 차(ICLD) 파라미터는 두 채널 사이의 레벨 차이를 설명하 고, 상기 채널간 시간 차(ICTD) 파라미터는 두 채널의 두 신호 사이의 시간 차(위상 천이)를 설명한다. 상기 레벨 차 및 시간 차는 일반적으로 기준 채널에 관하여 각 채널에 주어진다. 이러한 파라미터들의 유도 후에, 파라미터들은 전송을 위해 최종적으로 양자화되고 부호화된다.
비록, 채널간 레벨 차(ICLD) 파라미터 및 채널간 시간 차(ICTD) 파라미터가 가장 중요한 음향 소스 로컬 파라미터를 나타낸다 할지라도, 이러한 파라미터들을 이용하는 공간적 표현은 추가적인 파라미터들을 도입함으로써 강화될 수 있다.
"파라미터 스테레오"로 불려지는 관련 기술은 전송된 모노 신호에 추가된 파라미터 사이드 정보를 기반으로 2-채널 스테레오 신호의 파라미터 부호화를 설명한다. 채널간 세기 차이(IIDs), 채널간 위상 차이(IPDs) 및 채널간 간섭성(IC)으로 언급되는 3가지 타입의 공간적 파라미터들이 있다. 간섭 파라미터(상관관계 파라미터)로 설정된 공간 파라미터의 확장은 음향 스테이지의 인식된 공간적 "확산" 또는 공간적 "압축"의 파라미터화를 가능하게 한다. 파라미터 스테레오는 "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, pages 1305-1322, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116th Convention, Preprint 6072, Berlin, May 2004, 및 "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116th Convention, Preprint 6073, Berlin, May 2004" 에서 더욱 상세히 설명된다.
국제 공개 WO 2004/008805 A1은, 다수의 파라미터 스테레오 모듈을 결합하고 다운-믹스 신호와 파라미터 사이드 정보를 포함하는 원 다채널 오디오 신호의 표현을 유도하는 계층적 구조를 실현함으로써 다채널 오디오 신호가 어떻게 유리하게 압축될 수 있는지를 개시한다.
상기 BCC 및 파라미터 스테레오(PS)의 접근에서, 오디오 채널 사이의 레벨 차(ICLD 또는 강도 차 IID로 불려지는)의 표현은 입체스테레오/다채널 오디오 신호의 파라미터 표현의 필수적인 부분이다. 그러한 정보 및 다른 공간적 파라미터들은 각 시간/주파수 슬롯에 대해 부호화기로부터 복호화기에 전송된다. 그러므로, 부호화 효율의 관점에서, 오디오 품질을 보존할 때 가능한 컴팩트하게 이러한 파라미터들을 표현하는 것이 효율이 높다.
BCC 부호화에서, 레벨 차이는 소위 "기준 채널"에 대하여 상대적으로 표현되고, 기준 채널에 상대적인 dB의 단위로 일정한 크기로 양자화된다. 이것이, 기준 채널에 관하여 낮은 레벨을 구비한 채널들이 인간 청취자들에 의해 들려질 때 중요한 마스킹 효과(masking effect)의 영향을 받기 쉽다는 사실을 최적으로 이용하는 것은 아니다. 전혀 신호를 갖지 않는 채널의 극한의 경우에, 이러한 특별한 채널을 설명하는 파라미터에 의해 사용되는 대역폭은 완전히 낭비된다. 하나의 채널이 다른 채널보다 더 약한, 더욱 일반적인 경우에, 상기 약한 신호가 더 강한 신호에 의해 주로 마스킹되기 때문에, 재생하는 동안 청취자는 약한 채널을 거의 들을 수 없고, 약한 채널을 덜 정밀하게 재생하여도 청취자는 동일한 품질로 인식하게 될 것 이다.
다채널 신호를 부호화할 때 발생하는 상황 및 문제들을 설명하기 위해, 통상적으로 사용되는 5-채널 신호가 도시된 도 10a가 참조 된다. 5-채널 구성은 좌측 후방 채널(101)(신호 a(t)를 갖는 A), 좌측 전방 채널(102)(신호 b(t)를 갖는 B), 중앙 채널(103)(신호 c(t)를 갖는 C), 우측 전방 채널(104)(신호 d(t)를 갖는 D) 및 우측 후방 채널(105)(신호 e(t)를 갖는 E)을 갖는다. 신호 채널들 또는 채널 쌍들 사이의 세기 관계는 화살표로 표시된다. 이에 따라, 좌측 전방 채널(102)과 우측 전방 채널(104) 사이의 세기 분포는 r1(110)으로 표시되고, 좌측 후방 채널과 우측 후방 채널 사이의 세기 분포는 r4(112)로 표시된다. 좌측 전방 채널(102)과 우측 전방 채널(104) 및 중앙 채널(103)의 조합 사이에서의 세기 분포는 r2(114)로 표시되고, 후방 채널들의 조합과 전방 채널들의 조합 사이의 세기 분포는 r3(116)로 표시된다. 예를 들면, 간단한 단방향이 기록될 때, 대부분의 에너지는 중앙 채널(103)에 포함될 것이다. 이 예에서, 특히 후방 채널들은 아주 적은 에너지(또는 0)를 포함할 것이다. 그래서, 주로 중앙 채널(102) 또는 전방 채널들이 재생동안 활성화되기 때문에, 후방 채널의 특성을 설명하는 파라미터들은 이 예에서는 단순히 낭비된다.
도 10a를 바탕으로, 채널들 또는 채널 조합들 사이에서의 에너지 분포를 계산하는 방법들이 다음의 문단에서 설명된다.
도 10a는 다른 오디오 채널들이 101 내지 105에 의해 지시되는 5 채널 스피 커 설정용 다채널 파라미터화를 도시한다; a(t)(101)는 좌측 서라운드 채널의 신호를 나타내고, b(t)(102)는 좌측 전방 채널의 신호를 나타내며, c(t)(103)는 중앙 채널의 신호를 나타내고, d(t)(104) 우측 전방 채널의 신호를 나타내며, e(t)(105)는 우측 서라운드 채널의 신호를 나타낸다. 상기 스피커 설정은 전방부와 후방부로 나뉘어 진다. 상기 전체 전방 채널 설정(102, 103 및 104)과 후방 채널들(101 및 105) 사이의 에너지 분포는 도 10a에서 화살에 의해 도시되고 r3 파라미터로 표시된다. 중앙 채널(103)과 좌측 전방(102) 및 우측 전방(103) 채널들 사이의 에너지 분포는 r2에 의해 표시된다. 좌측 서라운드 채널(101) 및 우측 서라운드 채널(105) 사이의 에너지 분포는 r4에 의해 표시된다. 최종적으로, 좌측 전방 채널(102) 및 우측 전방 채널(104) 사이의 에너지 분포는 r1에 의해 주어진다. r1 내지 r4는 다른 영역들의 파라미터화이기 때문에, 에너지 분포뿐만 아니라 다른 필수적인 영역 특성들이 예를 들면 영역들 사이의 상관관계로서 파라미터화 될 수 있다는 것은 명확하다. 추가로, 각 파라미터 r1 내지 r4에 대한 로컬 에너지가 계산될 수 있다. 예를들면, r4의 로컬 에너지는 채널A(101) 및 채널E(105)의 합산 에너지이다.
LocalEnergyr4 = E[a2(t)] + E[e2(t)]
상기 E[.]는 하기의 식에 의해 정해지는 기대 값이다.
Figure 112007013464144-PCT00001
도 10b는 예를들면 WO 2004/008805 A1에서 설명되는 바와 같이, 계층적으로 파라미터 스테레오 모듈들을 순서화함으로써 형성된 다채널 오디오 복호화기를 나타낸다. 이때, 도 10a에 소개된 바와 같은 오디오 채널들(101 내지 105)은, 하나의 단일음의 다운-믹스 신호(120, M)과 대응되는 사이드정보로부터 단계적으로 재생성되는데, 즉 제1 두채널 복호화기(122), 제2 두채널 복호화기(124), 제3 두채널 복호화기(126), 및 제4 두채널 복호화기(128)에 의하여 단계적으로 이루어 진다. 도시된 바와 같이, 도 10b의 트리구조에서, 제1 두채널 복호화기는 단일음의 다운-믹스 신호(120)를 두번째 및 제3 두채널 복호화기들(124 및 126)에 급전된 두 신호들로 분리한다. 그 점에서, 제3 두채널 복호화기(126)로 급전된 채널은 좌측 후방 채널(101) 및 우측 후방 채널(105)로부터 조합된 조합 채널이다. 상기 제2 두채널 복호화기(124)로 급전된 채널은 좌측 전방 채널(102) 및 우측 전방 채널(104)의 조합인 조합채널과 중앙 채널(103)의 조합이다.
그래서, 계층적인 복호화의 제2 단계 이후에, 좌측 후방 채널(101), 우측 후방 채널(105), 중앙 채널(103) 및 상기 좌측 전방 채널(102)과 우측 전방 채널(104)의 조합인 조합 채널들은 두채널 복호화기들(122, 124 및 126)의 각각에 의한 사용을 위해 레벨 파라미터를 포함하는 전송된 공간적 파라미터들을 이용하여 재구성된다.
계층적 복호화의 제3 단계에서, 제4 두채널 복호화기(128)는 제4 두채널 복호화기(128)용 부 정보로서 전송된 레벨 정보를 이용하여 좌측 전방 채널(102) 및 우측 전방 채널(104)을 유도한다. 도 10b에 도시된 바와 같이, 선행 기술의 계층적 복호화기를 이용할 때, 각 싱글 출력 채널에 대한 바람직한 에너지는 입력 신호와 각 출력 신호 사이의 다양한 서로 다른 파라미터 스테레오 모듈을 따른다. 즉, 특정 출력 채널의 에너지는 다수의 파라미터 스테레오 모듈의 IID/ICLD 파라미터에 좌우될 수 있다. 연결된 파라미터 스테레오 모듈의 트리 구조에서, IID 파라미터의 불균일한 양자화가 각 파라미터 스테레오 모듈내에서 IID값들을 생성하도록 적용될 수 있다. 상기 IID 값들은 부 정보의 일부로서 복호화기에 의해 사용된다. 각 모듈("리프(leaf)")에서의 양자화는, 상대적인 레벨에서 높아 마스킹을 생성할 수 있는 다른 오디오 채널들의 에너지/레벨에서 독립적으로 실행되기 때문에, 서브-최적화임에도 불구하고 불균일한 IID 양자화의 이점을 지역적으로, 예를 들면 개별적으로 각 파라미터 스테레오 모듈을 이용한다.
"리프"모듈들은 더 높은 트리 레벨, 예를 들면 "루트(root)"모듈에서 전체적인 레벨 분포를 알지 못하기 때문에 이것이 가능하다. 각 리프는 자신의 대응하는 IID/ICLD를 가지며, 상기 IID/ICLD는 자신의 입력으로부터 출력 채널을 향하는 에너지 분포를 나타낸다. 예를들면, 리프 "r3"의 IID/ICLD 파라미터(제1 두채널 복호화기(122)에 의해 처리된)는 유입되는 에너지의 10%가 r4에 보내질때, 유입되는 에너지의 90%가 리프 r2에 보내져야 한다는 것을 가리킬 수 있다. 이러한 과정은 상기 트리에서 각 리프에 대해 반복된다. 각 에너지 분포 파라미터가 한정된 정확성으로 표현되기 때문에 각 출력 채널 A 내지 E의 바람직한 에너지와 실제적인 에너지 사이의 편차는 IID/ICLD 파라미터에서 양자화 에러뿐만 아니라 에너지 분포(그리고 양자화 에러의 전파로부터)에 좌우된다. 즉, 동일한 양자화 테이블은 r1부터 r4까지 모든 파라미터 단계에서 임의의 파라미터 타입, 예를들면 ICC 또는 IID용으로 사용되기 때문에, IID/ICLD 양자화는 단지 지역적으로 최적화되게 실행된다. 이것은 r1부터 r4까지 각 파라미터 단계에 대한 출력 채널들의 출력 에너지에서의 에러가 종래기술의 구현에서 가장 약한 출력 채널에 대해 최대라는 것을 의미한다.
이전의 단락에서 상세히 언급된 바와 같이, 대역폭은, 채널내에서 낮은 에너지에 기인된 주로 마스크된 채널들을 설명하는 공간적 파라미터에 대해 소모될 수 있기 때문에, 다채널 오디오 신호의 공간적 인식을 설명하는 ICC, 위상차 또는 시간 차와 같은 다른 파라미터들 또는 레벨 파라미터들(IID 또는 ICLD)의 양자화는 여전히 차선책이다.
본 발명의 목적은 다채널 오디오 신호의 공간적 파라미터의 양자화를 위한 향상된 개념을 제공하는 것이다.
본 발명의 제1 측면에 따른 이러한 목적은 입력 파라미터를 양자화하는 파라미터 양자화기에 의해 달성되고, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도(기준, 측정치, 측정값, 기준치, 수치, 등을 의미하는 용어로 여기서 사용한다)이며, 상기 다채널 신호의 에너지 척도 및 상기 한 쌍의 채널 또는 한 채널의 에너지 척도와의 관계를 바탕으로 하여 양자화 규칙을 생성하는 양자화 규칙 생성기; 및 상기 생성된 양자화 규칙을 사용하여 상기 입력 파라미터로부터 양자화된 양자화 파라미터를 유도하는 값양자화기를 포함한다.
본 발명의 제2 측면에 따른 이러한 목적은 파라미터를 유도하는 양자화 파라미터를 탈양자화하기 위한 파라미터 탈양자화기에 의해 달성되고, 상기 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 파라미터 탈양자화기는, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 기반으로 탈양자화 규칙을 생성하기 위한 탈양자화 규칙 생성기; 및 상기 생성된 탈양자화 규칙을 이용하여 양자화 파라미터로부터 파라미터를 유도하기 위한 값 탈양자화기를 포함한다.
본 발명의 제3 측면에 따른 이러한 목적은 입력 파라미터를 양자화하는 방법에 의해 달성되고, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 양자화 방법은, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도를 기반으로 양자화 규칙을 생성하는 단계와; 상기 생성된 양자화 규칙을 이용하여 입력 파라미터로부터 양자화 파라미터를 유도하는 단계를 포함한다.
본 발명의 제4 측면에 따른 이러한 목적은 파라미터를 유도하는 양자화 파라미터를 탈양자화하기 위한 파라미터 탈양자화 방법에 의해 달성되고, 상기 파라미터는 한 채널 또는 다른 한 채널에 관련된 한 쌍의 채널들 또는 다채널 신호의 한 쌍의 채널의 특징에 대한 척도이며, 상기 방법은, 상기 한 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 바탕으로 탈양자화 규칙을 생성하는 단계; 및 상기 생성된 탈양자화 규칙을 이용하여 상기 양자화 파라미터로부터 상기 파라미터를 유도하는 단계를 포함한다.
본 발명의 제5 측면에 따른 이러한 목적은, 싱글 채널 또는 한 쌍의 채널들의 특징에 대한 척도인 파라미터의 양자화된 표현인 양자화 파라미터를 갖는 다채널 신호의 표현에 의해 달성되고, 상기 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 양자화 파라미터는 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 기반으로 양자화 규칙을 이용하여 유도된다.
본 발명의 제6 측면에 따른 이러한 목적은, 상기에 설명된 바와 같은 다채널 신호의 표현에 저장되는 장치-기록가능한 저장 매체에 의해 달성된다.
본 발명의 제7 측면에 따른 이러한 목적은, 입력 파라미터를 양자화하는 파라미터 양자화기를 구비한 오디오 레코더기 또는 송신기에 의해 달성되고, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 오디오 레코더기 또는 송신기는, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 기반으로 양자화 규칙을 생성하기 위한 양자화 규칙 생성기와; 상기 생성된 양자화 규칙을 이용하여 상기 입력파라미터로부터 양자화 파라미터를 유도하기 위한 값 양자화기를 포함한다.
본 발명의 제8 측면에 따른 이러한 목적은 파라미터를 유도하는 양자화 파라미터를 탈양자화하기 위한 파라미터 탈양자화기를 구비한 수신기 또는 오디오 플레이어에 의해 달성되고, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 파라미터 탈양자화기를 구비한 수신기 또는 오디오 플레이어는, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 기반으로 탈양자화 규칙을 생성하기 위한 탈양자화 규칙 생성기; 및 상기 생성된 탈양자화 규칙을 이용하여 양자화 파라미터로부터 파라미터를 유도하기 위한 값 탈양자화기를 포함한다.
본 발명의 제9 측면에 따른 이러한 목적은 송신 또는 오디오 레코딩의 방법에 의해 달성되고, 상기 방법은 입력 파라미터를 양자화하는 방법을 포함하며, 상기 입력 파라미터는 싱글 채널 또는 다른 싱글 채널에 관한 한 쌍의 채널들 또는 다채널 신호의 한 쌍의 채널들의 특징에 대한 척도이고, 상기 양자화 방법은, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도를 기반으로 양자화 규칙을 생성하는 단계와; 상기 생성된 양자화 규칙을 이용하여 입력 파라미터로부터 양자화 파라미터를 유도하는 단계를 포함한다.
본 발명의 제10 측면에 따른 이러한 목적은 오디오 재싱 또는 수신의 방법에 의해 달성되고, 상기 방법은 파라미터를 유도하는 양자화 파라미터를 탈양자화하는 방법을 구비하며, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 방법은, 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 기반으로 탈양자화 규칙을 생성하는 단계; 및 상기 생성된 탈양자화 규칙을 이용하여 양자화 파라미터로부터 파라미터를 유도하는 단계를 포함한다.
본 발명의 제11 측면에 따른 이러한 목적은, 입력 파라미터를 양자화하기 위한 파라미터 양자화기를 구비한 송신기; 및 상기 양자화 파라미터를 탈양자화하기 위한 파라미터 탈양자화기를 구비한 수신기를 포함하는 전송 시스템에 의해 달성된다.
본 발명의 제12 측면에 따른 이러한 목적은, 입력 파라미터를 양자화하는 방법을 구비한 전송 방법; 및 상기 양자화 파라미터를 탈양자화하기 위한 방법을 구비한 수신 방법을 포함하는 송수신 방법에 의해 달성된다.
본 발명의 제13 측면에 따른 이러한 목적은, 컴퓨터가 구동될 때, 상기 방법들 중 하나를 실행하기 위한 컴퓨터 프로그램에 의해 달성된다.
본 발명은, 다채널 신호의 한 채널 또는 한 쌍의 채널이 다른 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도가 되는 파라미터들이 상기 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 기반으로 생성된 양자화 규칙을 이용하여 더 효율적으로 양자화될 수 있다는 것을 발견한 데에 기반을 둔다.
본 발명의 개념은 양자화 규칙이 생성되거나 적절한 양자화 규칙이, 서술될 신호의 에너지에 종속되는, 이용가능한 양자화 규칙들의 그룹들로부터 선택된다는 장점을 가진다. 그래서, 심리 음향 모델이 실제 신호의 필요성에 적응된 양자화를 이용하도록 복호화 동안에는 복호화기 또는 부호화 동안에는 부호화기에 적용될 수 있다. 특히, 어떤 채널이 다채널 신호 내의 다른 채널들에 비하여 매우 적은 에너지를 가질때, 이 채널은 높은 에너지를 가지는 신호들을 양자하는 것보다 더 거칠게 양자화 할 수 있다. 이것은 높은 에너지 신호들이 재생하는 동안 낮은 에너지 신호를 마스크한다는 사실 때문이다. 즉, 청취자는 낮은 에너지 신호의 상세내용을 거의 알지 못할 것이고, 그래서, 낮은 에너지 신호는 높은 에너지 신호의 마스킹 때문에 그 잘못된 것을 인식할 수 있는 청취자 없기 때문에 거친 양자화를 통해 낮은 에너지 신호가 더 열화 될 수 있다.
본 발명의 일 실시 예에서, 파라미터를 양자화하는 파라미터 양자화기는 양자화 규칙을 생성하는 양자화 규칙 생성기 및 생성된 양자화 규칙을 이용하여 입력 파라미터들로부터 양자화 파라미터를 유도하는 값 양자화기를 구비한다. 적절한 양자화 규칙을 생성하기 위해, 양자화 선택기는 부호화될 다채널 오디오 신호의 총 에너지를 입력으로서 수신하고, 한 쌍의 채널들 또는 채널의 로컬 에너지의 공간적 파라미터들이 양자화된다. 총 에너지와 로컬 에너지를 알게 되면, 양자화 선택기는 사용할 양자화 규칙을 결정할 수 있다. 즉, 비교적 낮은 로컬 에너지를 구비한 채널 쌍 또는 채널들에 대해 더욱 거친 양자화 규칙을 선택한다. 선택적으로, 양자화 선택기는 존재하는 양자화 규칙을 조정하거나 총 에너지 및 로컬 에너지에 종속하는 완전히 새로운 양자화 규칙을 계산하기 위한 알고리즘 규칙을 유도할 수 있다. 전송될 신호 정보의 크기를 줄이는 목적을 달성하기 위해 선형 양자화기 또는 비선형 양자화기에 앞서 신호에 적용되는 일반적인 스케일 팩터(scale factor)를 계산하는 하나의 가능성이 있다.
본 발명의 다른 실시 예에서, 다채널 신호는 쌍대비교(pairwise) 방법으로, 즉 트리-같은 구조에서 순서화된 다수의 2대1 다운-믹서기들을 구비하는 계층구조를 이용함으로써 부호화된다. 이때, 각 다운-믹서기는 입력된 두 채널을 하나의 채널로 만든다. 본 발명의 개념에 따라, 에너지 종속의 양자화는 국부적으로, 즉 2대1 다운-믹서기만의 입력에 이용가능한 정보를 갖는 각 2대1 다운-믹서기에서 뿐만아니라 신호 에너지의 합에 대한 전체적인 정보를 기반으로 실현될 수 있다. 이것이 신호의 인식 품질을 중요하게 강화시킨다.
부호화된 다채널 오디오 신호의 질이 거의 영향받지 않을 때, 부 정보 크기가 줄어들 수 있다는 다음의 본 발명의 개념은 명백하다.
본 발명의 다른 실시 예에서, 발명의 파라미터 양자화기는, 파라미터 비트열을 유도하는 양자화 파라미터를 부호화하기 위해 사용되는, 차등 부호화기 및 후프만(Huffman) 부호화기 이전에 파라미터 부호화기에서 병합된다. 그러한 발명의 부호화기는, 양자화 파라미터를 설명하는 데 필요로 하는 코드 워드(code word)의 크기를 줄이는 것에 더하여, 차등 부호화기 및 후프만(Huffman) 부호화기에 공급되는 동일한 코드 워드의 양을 자동으로 증가시키는 큰 장점을 가지는데, 이는 부 정보의 크기를 더 줄여서 양자화 파라미터의 높은 압축을 허용하기 때문이다.
본 발명의 다른 실시 예에서, 발명의 파라미터 양자화기는 양자화기 팩터(factor) 함수 생성기 및 파라미터 곱셈기를 구비한다. 상기 양자화기 팩터 함수 생성기는 입력으로서 전부 및 로컬 에너지를 수신하고, 입력 양으로부터 싱글 스칼라 값을 유도한다. 상기 파라미터 곱셈기는, 고정된 양자화 규칙을 변경된 파라미터에 적용하는 양자화기에 보정된 파라미터를 전송하기에 앞서 양자화기 팩터에 의해 파라미터를 분할하는 유도된 양자화기 팩터 f 및 파라미터들을 수신한다.
이러한 실시예의 변형은 양자화기 뒤에 파라미터 곱셈기를 가지고, 이에 따라 양자화기로부터 기인된 인덱스를 분할하도록 유도된 양자화기 팩터를 사용하는 것이다. 이것의 결과는 다시 정수 인덱스로 라운드(반올림) 되어야 한다.
파라미터에 대한 스케일 팩터의 응용은 다른 양자화 규칙을 선택하는 것과 같은 동일한 효과를 가진다. 왜냐하면, 예를 들어 큰 계수에 의한 분리는 이미 존재하는 양자화 규칙의 단지 더 작은 부분이 효율적이 되도록 입력 파라미터 공간을 압축하기 때문이다. 이러한 해결책은, 처리되거나 저장될 하나의 양자화 규칙만 있기 때문에 복호화기 및 부호화기 측의 추가 메모리가 절약될 수 있다는 장점을 가진다. 왜냐하면, 상기 비례가 단지 제한된 추가적인 하드웨어 또는 소프트웨어를 요청하는 간단한 곱셈에 의해 이루어지기 때문이다.
추가적인 장점은 양자화기 팩터를 적용함으로써 양자화기 팩터가 어떤 가능한 함수의 종속성을 이용하여 유도될 수 있다는 것이다. 그래서, 양자화기 또는 탈양자화기는 주어진 샘플로부터 미리 정의된 양자화 규칙을 선택하는 것보다 모든 가능한 입력 파라미터 공간 내에서 민감하게 계속적으로 조절될 수 있다.
본 발명의 바람직한 실시 예들은 첨부된 도면들을 참조하여 하기에서 더 상 세히 설명될 것이다.
도 1은 본 발명의 파라미터 양자화기의 블록도를 나타낸다.
도 2a내지 도 2c는 적용가능한 다수의 양자화 규칙을 나타낸다.
도 3은 본 발명의 파라미터 양자화를 구비한 파라미터 부호화기를 나타낸다.
도 4a 및 도 4b는 본 발명의 파라미터 양자화기를 구비한 파라미터 부호화기의 다른 실시예를 나타낸다.
도 5는 스케일 팩터 함수들의 예를 나타낸다.
도 6은 비선형화 양자화 규칙을 나타낸다.
도 7은 본 발명의 파라미터 탈양자화기를 나타낸다.
도 8은 본 발명의 파라미터 탈양자화기를 구비한 파라미터 해독기를 나타낸다.
도 9a는 본 발명의 파라미터 탈양자화기의 일 실시예를 나타낸다.
도 9b는 본 발명의 파라미터 탈양자화기를 구현하는 다른 실시예를 나타낸다.
도 9c는 에너지 종속의 양자화를 구현하기 위한 실시예를 나타낸다.
도 9d는 에너지 종속의 탈양자화를 구현하기 위한 다른 실시예를 나타낸다.
도 9e는 양자화 및 탈양자화 파라미터의 실시예를 나타낸다.
도 10a는 5채널 다채널 오디오 신호의 표현을 나타낸다.
도 10b는 선행기술에 따른 계층적 파라미터 다채널 복호화기를 나타낸다.
도 1은 양자화기(200) 및 양자화 선택기(202)를 갖는 본 발명의 파라미터 양자화기(199)를 나타낸다. 상기 양자화 선택기(202)는 다채널 오디오 신호의 총 에너지 및 부호화될 파라미터를 강조하는 한 쌍의 채널들 또는 채널의 로컬 에너지를 수신한다. 두 에너지 정보를 근거로 하여, 양자화 선택기(202)는 파라미터(206) 입력으로부터 양자화기(200)에 양자화 파라미터(204)를 유도(발생)하기 위해 양자화기(200)에 의해 이용되는 양자화 규칙을 생성한다. 그러므로, 이 경우에 상기 양자화 선택기(202)는 양자화 규칙 생성기로서 작동한다.
상기 양자화 선택기(202)의 입력 파라미터는 원 다채널 신호의 총 에너지와 양자화될 파라미터에 의해 설명되는 채널에 대한 로컬 에너지이다. 본 발명의 바람직한 실시 예에서, 로컬 에너지와 총 에너지 사이의 비율은 사용할 양자화기를 결정하는 데에 사용될 수 있는 척도를 제공한다. 일 예로서, 이러한 비율 q(상대적인 로컬 에너지)는 다음의 방정식을 이용하여 데시벨(dB)로 계산될 수 있다.
Figure 112007013464144-PCT00002
상기 선택된 양자화기는 양자화기와 함께 파라미터(206)를 양자화하는 데에 이용된다.
본 발명은, 만약 파라미터화 단계가 총 에너지에 비하여 에너지에서 더 낮다면 즉, 로컬 에너지(q)가 상대적으로 작을 때, IID/ICLD 파라미터의 더 거친 양자화가 사용될 수 있다는 것을 개시한다. 본 발명은 덜 중요하고/낮은 에너지를 갖는 오디오 신호보다 높은 정밀성을 갖는 우세하고/높은 에너지 신호를 파라미터화하는 것이 더 중요하다는 심리음향 관계를 이용한다. 이것을 더욱 명확하게 하기 위해, 참조가 도10a에 참조된다. 원 다채널 신호에서 오디오 장면(scene)내에 상기 에너지/신호가 좌측 전방 채널(102), 중앙 채널(103) 및 우측 전방 채널(104)을 의미하는 전방 이미지에 주로 존재할 때, 주변 채널들이 훨씬 적은 에너지를 가지고 있기 때문에 주변 채널들이 적은 정확도를 가지고 양자화될 수 있다. 더욱 거친 양자화로부터 도입된 추가적인 양자화 에러는 전방 채널들이 더 많은 에너지를 가지고 있기 때문에 인식될 수 없다. 그리고, 이로부터, r4의 양자화 에러(그리고 서라운드 채널 A와 E에 대한 결과적인 에너지 에러)는 채널 B, D 및/또는 C에 의해 마스크된다.
가장 극단적인 예의 경우에, 서라운드 채널 A와 E만이 약간의 희미한 잡음을 갖고, 전방 채널들 B, C 및 D는 완전한 크기 신호를 가진다. 그런 경우에, 16비트 펄스코드변조(PCM) 원 신호는 80데시벨(dB)보다 더 큰 에너지 차이를 가리킨다. 그래서, 파라미터(r4)는 거친 양자화 때문에 청취가능한 차이를 도입하지 않아도 자유자재로 거칠게 조잡하게 양자화될 수 있다.
그림 2a 내지 2c는 양자화 에러의 서로 다른 레벨들을 도입하는 세 가지 가능한 양자화 규칙을 나타낸다. 모든 도면들은 x축에서 원 파라미터를 나타내고 y축에서 파라미터에 할당된 정수 값을 나타낸다. 더욱이 도면 2a 내지 2c는 각 양자화 단계용 인덱스에 대응하고 전송 또는 저장용으로 사용될 수 있는 대시 라인(dashed lines)을 나타낸다. 상기 전송된 인덱스는 복호화기 측에서, 예를들면, 탈양자화를 위한 룩업 테이블과의 조합에 사용될 수 있다.
정밀한 양자화는, x축의 이산 파라미터 간격을 13개의 정수 값으로 맵핑하는 양자화 커브(230)에 의해 도 2a에서 표시된다. 중간 양자화는 도 2b에서 양자화 커브(232)에 의해 달성된다. 반면에, 가장 거친 양자화는 도 2c의 양자화 커브(234)에 의해 달성된다. 도입된 양자화 에러는 도 2c에서 도시된 예에서 가장 크고, 도 2a에서 도시된 예에서 가장 작다.
이러한 세가지 양자화 규칙은 양자화 선택기(202)에 의해 선택될 수 있는 양자화 규칙의 예이다. 즉, 도 2a 내지 2c는 세 가지 서로 다른 선형 양자화 규칙을 도시한다. 이때, x축은 입력 값을 나타내고, y축은 대응하는 양자화 값을 나타낸다. 도 2a 내지 2c는 x축과 y축에 모두 동일한 스케일을 가지고, 이로부터 도 2a는 세 가지의 양자화 규칙 중 가장 정밀한 양자화 및 가장 작은 양자화 에러를 갖는다. 도 2c는 가장 거친 양자화 및 가장 큰 양자화 에러를 갖는다. 가장 작은 양의 양자화 계단을 가지기 때문에 차등 부호화 및 후프만(Huffman) 부호화 이후에 가장 낮은 비트율을 실현한다.
일 예로서, 가능한 양자화 규칙은, 상기에 도입된 바와 같이 로컬 에너지 및 총 에너지 사이에서 상대적인 로컬 에너지(q)를 바탕으로 생성될 수 있다. 일 예로서, 양자화 규칙의 선택에 대응하는 q값의 가능한 범위가 다음의 테이블에서 요약된다.
q의 값 [dB] 선택된 양자화기
0 <= q <-10 정밀한 양자화 (도 2A)
-10 <= q <-20 중간 양자화 (도 2B)
-20 <= q 거친 양자화 (도 2C)
도 3은 본 발명의 파라미터 양자화기(199), 차등 부호화기(220) 및 후프만(Huffman) 부호화기(222)를 구비한 본 발명의 파라미터 압축기를 나타낸다. 도 3의 파라미터 부호화기는 상기 차등 부호화기(220)에 대한 입력으로서 양자화 파라미터를 사용함으로써 도 1의 파라미터 양자화기를 확장한다. 상기 파라미터 부호화기(222)는 출력으로서 최종 파라미터 비트열의 파라미터 비트열 성분(224)를 유도하는 차등적으로 부호화된 양자화 파라미터에 후프만(Huffman) 부호화 방법을 적용하는 후프만 부호화기(222)에 입력된다.
거친 양자화가 결과적으로 더 많은 양의 동일한 심벌(양자화 파라미터)이 되기 때문에 차등 부호화기 및 후프만 부호화기를 구비한 본 발명의 파라미터 양자화기의 조합은 특히 매력적이다. 더 거친 양자화에 의해 가능한 입력 심볼의 수가 감소될 때, 상기 차등 부호화기(220) 및 후프만 부호화기(222)의 조합은 더 컴팩트한 양자화 파라미터(파라미터 비트열 성분(224))의 부호화된 표현을 명백히 제공할 것이다.
도 4a는 본 발명의 파라미터 양자화기(250), 차등 부호화기(252) 및 후프만 부호화기(254)를 이용하는 본 발명의 파라미터 부호화기의 다른 실시예를 나타낸다.
본 발명의 양자화기(250)는 양자화기 팩터(factor) 생성기(256), 파라미터 스케일러(parameter scaler)(258) 및 양자화기(260)를 구비한다. 이 경우에, 상기 양자화기 팩터 생성기(256)는 파라미터 스케일러(258)와 함께 양자화 규칙 생성기로서 작동한다.
상기 양자화기 팩터 생성기(256)는 양자화될 파라미터에 대한 채널 쌍 또는 채널의 로컬 에너지 및 다채널 오디오 신호의 총 에너지를 입력으로서 수신한다. 상기 양자화기 팩터 생성기(256)는 로컬 에너지 및 총 에너지를 기반으로 스케일 팩터(f)(262)를 생성한다. 바람직한 실시 예에서, 이것은 상대적인 로컬에너지(q)에서 기인된 로컬 에너지와 총 에너지 사이에서의 비율을 기초로 다음과 같이 이루어진다.
Figure 112007013464144-PCT00003
이러한 비율 q는 양자화 파라미터를 추가로 수신하는 파라미터 스케일러(258)에 대한 입력으로서 사용되는 양자화기 팩터 f (262)를 계산하기 위해 양자화기 팩터 생성기(256)에서 사용될 수 있다.
상기 파라미터 스케일러(258)는 양자화기 팩터(262)에 의해 파라미터가 분할될 수 있는 입력 파라미터에 스케일링을 적용한다. 상기 파라미터의 스케일링은 다른 양자화 규칙을 선택하는 것과 등가이다. 상기 스케일된 파라미터는 본 발명의 실시 예에서 고정된 양자화 규칙을 적용하는 양자화기(260)에 입력된다. 양자화 파라미터의 추가 처리는 도 3의 처리와 동일하다. 상기 파라미터는 차등적으로 부호화되고 이후에 후프만은 최종적으로 파라미터 비트열 성분를 생산하도록 부호화된 다.
상기 양자화 팩터(262)를 유도하는 분석적인 함수는 기본적으로 임의의 형태를 가질 수 있기 때문에, 상기 파라미터에 스케일링 팩터를 적용하는 것은 계속적인 방법으로 양자화 규칙이 필요에 적응될 수 있다는 장점을 가진다.
도 4b는 도 4a에 도시된 본 발명의 파라미터 부호화기(250)와 유사한 본 발명의 파라미터 부호화기(270)의 다른 실시예를 나타낸다. 그래서, 파라미터 부호화기(250)와의 유일한 차이는 다음의 단락에 간단히 설명될 것이다.
본 발명의 파라미터 부호화기(270)는 파라미터 스케일러(파라미터 부호화기(250)의 파라미터 스케일러(258))를 구비하지 않는다. 양자화의 에너지 종속성을 달성하기 위해, 파라미터 양자화기(270)는 대신에 압축 장치(272)를 구비한다. 이것은, 압축 장치(272)와 함께 상기 양자화기 팩터 생성기(256)가 양자화 규칙 생성기로서 이 경우에 작동한다는 것을 의미한다. 상기 압축 장치(272)는 양자화기 팩터 생성기(256)및 양자화기(260)에 연결되어 있다. 상기 압축 장치(272)는 고정된 양자화 방법을 이용함에 따라 양자화기(260)에 의해 양자화되는 양자화 파라미터를 입력으로서 수신한다. 상기 에너지 종속성을 구현하기 위해, 상기 압축부는 입력으로서 양자화 파라미터를 이용하고, 스케일 팩터(262)를 이용하여 양자화 파라미터를 스케일한다. 이것은 델타 부호화기(252)에 전송될 양자화 파라미터의 가능한 숫자를 감소시킴으로써 비트율을 줄인다. 예를 들어, 이러한 압축은 스케일 팩터(262)에 의해 양자화 파라미터 인덱스의 분할에 의해 달성될 수 있다.
상대적인 로컬 에너지 비율 q로부터 스케일 팩터(262)를 유도할 수 있는 가 능한 함수들이 도 5에 도시된다. 도 5는 일예로서, 스케일 팩터(f)를 유도하도록 사용될 수 있는 서로 다른 네 가지 가능한 함수들(300, 302, 303 및 304)을 나타낸다. 상기 제1 팩터 함수(300)는 상수 함수이고 에너지에 종속되지 않는다.
상기 팩터 함수(302 및 304)는 팩터 함수를 구현하는 두 가능성을 나타낸다. 상기 팩터 함수(302)는 패터 함수(304)를 이용하는 것보다 덜 활동적이고 도입된 양자화 에러를 더 적게 증가시킨다. 반면에, 팩터 함수(302)는, 팩터 함수(304)보다 더 적은 비트율을 줄일수 있다. 상기 팩터 함수(303)는 에너지 쿼터(q)로부터 양자화기 팩터를 유도하는 4번째 가능성을 나타낸다. 상기 팩터 함수(303)는 계단 모양이고, 그래서 동일한 양자화기 팩터에 에너지 쿼터(q)의 간격을 할당한다.
도 6은 비균일한 양자화기를 예시한다. 상기 비균일한 양자화기는 x축에 입력이 y축에 그려진 출력(y)을 유도하는 함수(310)에 따라 데시벨(dB)로 양자화된다. 그러한 비균일한 양자화기 함수는 공간적 파라미터를 양자화하는 데에 사용될 수 있다. BCC부호화 방법에서 참조 채널이 다채널 신호에서 가장 강한 채널이 되도록 선택될 때, 이것은 특별한 이득이 된다. 도 6에 도시된 바와 같이, 참조 채널에 비교되는 에너지 레벨이 더 작아짐에 따라 상기 양자화 계단이 증가하기 때문에, 상기 비균일한 양자화기는 필요에 적합한 양자화기 함수(310)를 예시한다. 상기 에너지 양자화 에러는 가장 강한 채널에 대해 더 적은 에너지를 구비한 채널에 대해 더 커질 수 있기 때문에, 이것은 특히 매력적인 특성이다.
도 7은 탈양자화기(502) 및 탈양자화 선택기(504)를 구비하는 본 발명의 파라미터 탈양자화기(500)를 나타낸다. 상기 탈양자화 선택기(504)는 양자화되는 양 자화 파라미터와 함께 채널 쌍 또는 채널의 에너지 및 다채널 신호의 총 에너지를 수신한다. 상기 수신된 에너지 정보를 기반으로, 상기 탈양자화 선택기(504)는 양자화 파라미터(505)를 탈양자화하도록 탈양자화기(502)에 의해 사용되는 탈양자화 규칙을 유도한다. 이에 따라, 이런 경우에 탈양자화 선택기(504)는 탈양자화 규칙 생성기로서 작동한다.
상기 탈양자화 선택기(504)가 다른 방법으로 작동할 수 있다는 것이 주목될 수 있다. 제1 가능성은 상기 탈양자화 선택기(504)는 직접적으로 탈양자화 규칙을 유도하고 상기 유도된 양자화 규칙을 상기 탈양자화기(502)에 전달한다. 다른 가능성은 탈양자화 선택기(504)가 탈양자화 규칙 결정을 충족한다는 것이다. 상기 탈양자화 규칙 결정은, 예를 들어 탈양자화기(502)에 저장된 다수의 양자화 규칙들로부터 적절한 탈양자화 규칙을 선택하도록 상기 탈양자화 규칙 결정을 이용할 수 있는 탈양자화기(502)에 전송된다.
도 8은 파라미터 탈양자화기(500), 차등 복호화기(510) 및 후프만 복호화기(512)를 구비한 본 발명의 파라미터 복호화기를 나타낸다.
상기 후프만 복호화기(512)는 파라미터 비트열 성분(513)을 수신하고, 게다가 이것과 연관하여, 상기 탈양자화 선택기(504)는 다채널 오디오 신호의 총 에너지 및 파라미터 비트열 성분(513)에 의해 설명되는 채널 쌍 또는 채널의 로컬 에너지를 수신한다. 도 3에 도시된 바와 같이, 상기 파라미터 비트열 성분(513)은 본 발명의 파라미터 부호화기에 의해 생성된다. 그래서, 상기 파라미터 비트열 성분(513)은 상기 탈양자화기(502)에 적용되기 이전에 후프만 복호화기(512)에 의해 복호화되고 상기 차등 복호화기에 의해 차등적으로 후프만-복호화된다. 상기 후프만 복호화기(512) 및 차등 복호화기(510)에 의한 복호화 이후에, 상기 탈양자화는, 도 7의 본 발명의 파라미터의 설명에서 이미 설명된 바와 같이, 본 발명의 파라미터 탈양자화기(500)에 의해 실행된다.
즉, 도 8은 에너지 종속의 탈양자화기(500)를 이용하는, 본 발명의 부호화기에 대응하는 복호화기를 도시한다. 상기 파라미터 비트열 성분은 인덱스에 차등적으로 복호화되고 후프만-복호화된다. 상기 정확한 탈양자화기는, 입력으로서 로컬 에너지 및 총 에너지를 구비한 부호화기에 사용되는 것과 같은 함수 및 동일한 규칙을 이용하는 상기 탈양자화기(504)에서 선택된다. 상기 선택된 탈양자화기는 탈양자화기(502)를 이용하여 인덱스를 탈양자화 파라미터로 탈양자화하는 데에 사용된다.
도 9a는 본 발명의 에너지 종속의 탈양자화기(520), 후프만 복호화기(512) 및 차등 복호화기(510)를 구비한 본 발명의 파라미터 복호화기의 다른 실시예를 나타낸다. 상기 파라미터 탈양자화기(520)는 양자화기 팩터 생성기(522), 탈양자화기(524) 및 파라미터 스케일러(526)를 포함한다. 이 경우에, 상기 파라미터 스케일러(526)와 함께 상기 탈양자화기 팩터 생성기(522)는 탈양자화 규칙 생성기로서 작동한다.
상기 후프만 복호화기 및 차등 복호화기에 의해 상기 파라미터 비트열(513)을 복호화한 후에, 상기 양자화 파라미터는 상기 탈양자화기(524)에 의해 탈양자화된다. 상기 탈양자화기(524)는 양자화 파라미터를 생성하도록 사용되는 양자화 규 칙을 매칭하는 탈양자화 규칙을 이용한다. 상기 양자화기 팩터 생성기(522)는 다채널 오디오 신호의 로컬 에너지 및 총 에너지의 비율로부터 스케일 팩터 f (528)를 유도한다. 상기 파라미터 스케일러(526)는 상기 탈양자화 파라미터를 구비한 스케일 팩터의 곱셈에 의해 탈양자화 파라미터에 상기 스케일 팩터(528)를 적용한다.
상기 파라미터 스케일러(526)에 의해 스케일링한 이후에, 해독된 탈양자화 파라미터들은 본 발명의 파라미터 복호화기에서 이용가능하다.
도 9b는 본 발명의 파라미터 복호화기(520)와 유사한 본 발명의 파라미터 복호화기(530)의 다른 실시예를 나타낸다. 그래서, 상기 파라미터 복호화기(520)와 유일한 차이점은 다음의 단락에서 상세히 설명된다.
본 발명의 파라미터 복호화기(530)는 본 발명의 파라미터 복호화기(520)에서 파라미터 스케일러(526)로서 동일한 함수 결과를 달성하는 해독기 또는 신장기(532)를 구비한다. 상기 해독기(532)는 양자화 파라미터를 입력으로서 수신하고, 상기 팩터 생성기(522)로부터 스케일 팩터(528)를 추가 입력으로서 수신한다. 이것은 상기 해독기(532)와 함께 상기 팩터 생성기(522)가 이 경우에 탈양자화 규칙 생성기로서 작동한다는 것을 의미한다. 에너지 가중된 탈양자화의 기능성을 구현하기 위해, 상기 유도되고 스케일된 양자화 파라미터가 상기 탈양자화기(524)에 입력되기 이전에 상기 양자화 파라미터는 상기 해독기(532)에 의해 스케일된다. 상기 탈양자화기(524)는 고정된 탈양자화 규칙을 이용하여 상기 탈양자화 파라미터를 유도하기 위해 상기 스케일된 양자화 파라미터를 탈양자화한다. 이러한 해독은 예를들어, 스케일 팩터(528)에 의해 양자화 파라미터 인덱스의 곱셈에 의해 달성될 수 있 다.
비록, 부호화 및 복호화 동안에 파라미터 스케일러(258) 및 파라미터 스케일러(256)에 의한 스케일링이 부호화 동안의 분할 및 복호화 동안의 곱셈이 되도록 설명될지라도, 다른 양자화 규칙을 이용하는 것과 같이 동일한 효과를 가지는 다른 형식의 스케일링은 부호화 또는 복호화 동안의 파라미터들에 적용될 수 있다.
도 10b에서 예를들어 예시된 바와 같이, 적층된 파라미터화(계층적 복호화 또는 부호화)의 경우에, 복호화기는 루트(root)(다운-믹스 채널)로부터 리프(leaf)까지 에너지 분포를 복호화할 수 있기 때문에 각 파리미터화 r1 으로부터 r4 (두채널 복호화기들(122, 124, 126 및 128))까지 잘 정의된 로컬 에너지가 존재한다는 점에 주목해야 한다. 상기 각 파라미터는 복호화 측에서 로컬 에너지로서 사용될 수 있다. 추가로, 복호화기가 루트로부터 리프까지 양자화한다면, 정확하게 동일한 로컬 에너지가 양자화 선택기 및 양자화기 팩터 함수를 위한 로컬 에너지로서 부호화기에 사용될 수 있다.
즉, 복호화기는 총 에너지 및 로컬 에너지를 이용하여 탈양자화 규칙을 독립적으로 결정할 수 있다. 선택적으로, 탈양자화 규칙이 상기 파라미터를 탈양자화하하는 적절한 규칙인 복호화기에서 추가적인 부 정보에 의해 신호화될 수 있다.
비록, 본 발명의 다른 실시 예에서 설명될지라도, 스케일 팩터의 응용 및 적절한 탈양자화 규칙의 선택은 본 발명의 부호화기 또는 복호화기의 실시 예에서 조합될 수 있다.
더욱 상세한 예를 제공하기 위해, 추가적으로 전송된 공간적 파라미터(CLD 및 ICC)를 이용하는 전송된 단음의 신호(M)로부터 다채널 신호의 재구성을 위한 에너지 종속의 탈양자화를 구현하는 두 가능한 방법들이 도 9c 및 도 9d에 도시된다. 도면들을 설명하기 이전에, 도면에 도시된 트리 구조가 공간적 파라미터의 재구성에 대해서만 중요하다는 점에 주목한다. 다채널 신호의 각 채널의 생성에 대한 실질적인 업-믹스는 하나의 단계에서 일반적으로 실행된다.
도 9c는 파라미터(CLD0)가 원 신호의 채널들의 수를 이용하여 조합되는 채널들 사이에서 에너지 분포를 설명한다고 가정하여 파라미터(CLD)가 유도되는 상황을 나타낸다.
제1 계층적 업-믹스 위치(1000)에서, CLD0는 두 채널들 사이에서의 에너지 관계를 설명한다. 제1 채널은 좌측 전방, 우측 전방, 중앙 및 저 주파 확장 채널의 조합(1002) 이다. 제2 채널은 좌측 후방 및 우측 후방 채널의 조합이다. 즉, 파라미터(CLD0)는 모든 후방 채널 및 전방 채널들 사이에서 에너지 분포를 설명한다.
그래서, 모든 채널들이 동시에 재생될 때 거친 양자화에 의해 추가로 도입된 왜곡은 거의 들을 수 없기 때문에, CLD0가 후방 채널에 포함된 적은 에너지만을 을 가리킬 때 좌측 후방 및 우측 후방 채널들 사이에서 공간적 특성을 설명하는 파라미터들이 더 강하게 양자화될 수 있다는 것은 명백하다.
도 9b에 도시된 바와 같이, 본 발명의 파라미터 양자화기는, 예를 들어 실제 탈양자화가 실행되기 이전에, 파라미터 인덱스를 가지고 탈양자화되는 파라미터를 곱함으로써 탈양자화를 구현하는 스캐일 팩터(528)를 계산한다. 그래서, 만약 파라미터(CLD0)가 전송되면, 예를들어 도 9b의 복화화기를 이용할 때, 다음의 식에 따라 다른 계층적 단계의 최종적으로 사용된 CLD 파라미터를 계산할 수 있다.
다음에서, 용어 "DEQ"는 절차 DEQ에 주어진 파라미터에 고정된 탈양자화 테이블의 응용을 설명한다. 이것은, 다음의 식에서 표현되는 바와 같이, 전송된 파라미터 IDX CLD(0,L)가 직접적으로 탈양자화될 수 있다.
Figure 112007013464144-PCT00004
상기 CLD 파라미터는 두 채널들 사이의 에너지 분포를 설명하고 채널들은 도 9c에 표시된 바와 같이 채널들의 조합이기 때문에, 상대적인 로컬 에너지(FC)를 다음과 같이 유도할 수 있다.
Figure 112007013464144-PCT00005
따라서, 후방 채널의 상대적인 로컬 에너지는 다음과 같다.
Figure 112007013464144-PCT00006
상기에 제시된 본 발명의 개념처럼, CLD1는 조합 신호(1002)에 포함된 모든 에너지를 고려하여 다음과 같이 계산될 수 있다.
Figure 112007013464144-PCT00007
상기 식에서, 용어 "facFunc"는 상대적인 로컬 에너지(FC)의 실수값 독립을 제공하는 함수을 나타낸다. 즉, 식 4는 탈양자화 이전에, 전송된 파라미터 인덱스 IDX CLD(1,1,m)가 중간 양자화 파라미터를 유도하는 스케일 팩터(facFunc)에 의해 곱해진다. 상기 중간 양자화 파라미터는 정수값을 필요로 하지 않기 때문에, 상기 중간 양자화 파라미터가 다음의 수식에 의해 사용되는 최종 파라미터로 탈양자화되는 IdxCLDEdQ를 유도하도록 반올림 되어야 한다.
Figure 112007013464144-PCT00008
탈양자화는 예를들어 다음과 같은 표준 탈양자화 테이블에 의해 실행된다.
Figure 112007013464144-PCT00009
제2 계층적 단계(1004)에서의 채널 분해로부터 보여지는 바와 같이, 상기 유도된 파라미터(CLD1)는 좌측 전방과 우측 전방 채널의 조합이 되는 채널 및 중앙과 저주파 강조 채널의 조합이 되는 채널 사이의 에너지 관계를 설명한다. 전방 채널 들(좌측 전방 및 우측 전방)에 포함된 에너지를 설명하는 상대적인 로컬 에너지(F)는 다음의 수식에 따라 계산될 수 있다.
Figure 112007013464144-PCT00010
후방 채널의 에너지를 설명하는 상대적인 로컬 에너지(S)는 중간 양자화 파라미터(IDX, CLD, EDQ)가 다음의 수식에 따라 계층적인 박스(1006)에 대해 계산될 수 있도록 유도된다.
Figure 112007013464144-PCT00011
앞서 서술된 바와 같이, 전방 채널의 에너지를 설명하는 상대적인 로컬 에너지(F5151)만이 이용가능하기 때문에, 파라미터(CLD3)는 좌측 전방 및 우측 전방 채널 사이의 에너지 관계가 다음의 수식에 따른 에너지 종속의 방법으로 유도될 수 있다.
Figure 112007013464144-PCT00012
하나의 가능한 구현 예에서, 중앙 및 저주파 강조 채널 사이의 에너지 관계를 설명하는 파라미터(CAD4)는 팩터(factor) 함수를 이용하지 않으면서 유도될 수 있다.
Figure 112007013464144-PCT00013
다른 실시 예에서, 파라미터(CLD4)의 유도시에 에너지 종속을 구현하는 것은 물론 가능하다.
도 9d는 공간적 파라미터의 유도에 대한 계층을 한정하는 다른 가능성을 보여준다.
도 9c의 설명과 유사하게, 각 CLD 파라미터는 다음의 수식에 따라 유도될 수 있다.
Figure 112007013464144-PCT00014
Figure 112007013464144-PCT00015
Figure 112007013464144-PCT00016
Figure 112007013464144-PCT00017
Figure 112007013464144-PCT00018
Figure 112007013464144-PCT00019
Figure 112007013464144-PCT00020
Figure 112007013464144-PCT00021
다른 팩터(factor) 함수들은, 예를 들어 도 5에 도시된 함수들 중 하나와 같이 본 발명의 개념을 구현하기 위해 사용될 수 있다.
일반적으로, 상기에 이미 언급한 바와 같이, 본 발명의 개념은, 다른 신호 부분들에 비교하여 상대적으로 낮은 에너지를 포함하는 에너지의 부분의 파라미터(CLD)가 더 거친 방법으로 양자화된다는 점에서 에너지 종속의 양자화를 적용하는 것이다. 즉, 팩터 함수는 낮은 에너지 구성에 대해 적용된 팩터가 커야한다.
이를 더욱 상세히 설명하기 위해, 본 발명의 개념을 더욱 명확하게 하고, 부호화 및 복호화에서의 조작을 나타내는 일 실시예가 도 9e에 제공된다. 도시된 예를 계산하기 위해 미리 도입된 양자화 테이블이 참조된다.
테이블 9d는 좌측 열(1100)의 양자화기 측에서 양자화 인덱스의 조작과, 열(1102)에서 양자화기 측에 전송된 파라미터의 재구성을 나타낸다. 상기 전송된 파라미터는 열(1104)에서 제공된다. 상대적으로 낮은 에너지를 구비한 채널의 조합에 대한 두 예가 도시된다. 이것은 1보다 더 큰 공통 스케일 팩터(4.5)에 의해 표시된다(도 4 참조). 본 발명의 개념에 따라, 양자화 인덱스(IDX)는 양자화기 크기에서 양자화 이후에 스케일 팩터에 의해 분할된다. 이후에, 그 결과는 차등적으로 후프만 부호화되도록 정수값으로 라운드(4사5입과 같이 정수화하는 방식)되어야 한다(도 4a 참조). 그래서, 두 인덱스(10 및 9)의 예는 결국 전송된 인덱스(2의 IDXtransm)가 된다.
상기 탈양자화기는 탈양자화를 위해 사용되는 재구성된 인덱스(IDXrek)를 유도하는 스케일 팩터에 의해 전송된 인덱스를 곱한다. 상기 양자화기 크기에서 인덱스(10)의 제1 예에 도시된 바와 같이, 1의 추가적인 에러가 양자화기 크기에서 분할된 인덱스의 라운딩 때문에 발생한다. 반면에, 상기 양자화기 측에서 스케일 팩터의 분할이 전송될 정수값 인덱스(IDXtransm)를 생산할 때, 추가적인 에러가 도입되지 않는다.
명백히, 추가적인 에러 도입은 증가하는 스케일 팩터(f)의 위험을 야기한다. 이것은 낮은 에너지 신호에 추가적인 에러를 더하는 가능성이 다소 높다는 것을 의미한다. 상기 CLD 파라미터에 의해 설명되는 신호들이 상대적으로 동일한 에너지를 가질 때, 상기 CLD 값이 거의 일치하게 되고 스케일 팩터(예를들어 도 5를 참조)가 될 것이다. 이것은, 파라미터들이 에너지 종속의 방법으로 부호화되는 채널들이 동일한 에너지를 공유할 때, 추가적인 에러가 양자화에서 일반적으로 도입되지 않는다는 것을 의미한다. 물론, 모든 채널이 다채널 신호에서 동일한 에너지를 가질 때, 동시 재생시에 모든 싱글 채널들이 청취가능하기 때문에, 이것이 가장 적절하다. 그래서, 도입된 에러는 청취자에게 명확하게 청취될 것이다.
상대적으로 낮은 에너지를 갖는 채널들에 대해서만 에러가 받아들여지는 것은 본 발명의 명백한 장점이다. 반면에, 그러한 채널들에 대해 일부 큰 수에 의해 조합된 파라미터의 인덱스를 분할함으로써 채널들의 인덱스 값을 평균적으로 0에 더 근접하게 한다. 이것은 다채널 신호의 전송된 파라미터에 대해 소비되는 비트율을 효율적으로 줄이기 위해 다음의 차등적 부호화 및 후프만 부호화 과정에 의해 완벽하게 이용될 수 있다.
이용할 양자화/탈양자화 규칙의 결정 근거인 로컬 에너지와 총 에너지의 관계는 이전의 단락에서 대수적 척도(logarithmic measure)가 되도록 서술된다. 물론, 이것이 본 발명의 개념을 실현하도록 사용될 수 있는 유일한 척도는 아니다. 상기 로컬 에너지 또는 총 에너지 사이의 에너지 차를 서술하는 다른 척도, 예를들어 통상적인 차이(plain difference)가 결정하는 데에 사용될 수 있다.
본 발명의 다른 중요한 특징은, 예를 들어 CLD와 같은 파리미터(인입되는 에너지가 두 출력 채널에 대한 에너지의 합과 동일함을 의미한다)에 의해 전형적으로 제어되는 두 출력 채널에 인입되는 에너지를 분배하는 두 채널 복호화기 설계를 조합하는 것이다. 이때, 각 두 채널 복호화기들(122, 124, 126 및 128)에 대한 총 에너지와 로컬 에너지 사이의 상대적인 로컬 에너지는 CLD 파라미터에 의해 정의된다. 스케일 팩터를 계산하기 위해 전형적으로 이용되는 데시벨(dB)에서 에너지의 차이는 상기 CLD 파라미터에 의해 정의되기 때문에, 총 에너지 및 로컬 에너지를 실제적으로 측정할 필요가 없다는 것을 의미한다.
본 발명에 따른 방법의 구현 요건에 종속되어, 본 발명의 방법은 하드웨어 또는 소프트웨어로 구현될 수 있다는 것은 명백하다. 본 발명의 방법은 실행되도록 프로그램가능한 컴퓨터 시스템과 함께 작동할 수 있는 디지털 저장매체, 특히 전자 적으로 판독가능한 저장된 제어신호를 구비한 디스크, DVD 또는 시디(CD)에서 구현될 수 있다. 그래서, 일반적으로, 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 기계판독가능한 캐리어 상에 저장된 본 발명의 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램 제품에 존재한다. 즉, 본 발명의 발명들은 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때, 상기 발명중 적어도 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
앞서 서술한 내용이 상세한 실시예들을 참조하여 상세히 보이고 기술되어 있는 한, 당 분야의 숙련된 자들에 의해 그것의 정신과 목적이 벗어나지 않으면서 형태와 세목에 다양한 변화들이 만들어질 수 있다는 것을 알게 될 것이다. 이 발명에서 서술한 폭 넓은 개념으로부터 벗어나지 않으면서 다른 실시예로 적응될 수 있게 다양한 변화들이 만들어질 수 있다는 것을 앞으로 서술할 청구항들에 의해 이해될 것이다.

Claims (44)

  1. 입력 파라미터를 양자화하는 파라미터 양자화기로서, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며, 상기 파라미터 양자화기는:
    상기 다채널 신호의 에너지 척도 및 상기 한 쌍의 채널 또는 한 채널의 에너지 척도와의 관계를 바탕으로 하여 양자화 규칙을 생성하는 양자화 규칙 생성기; 및
    상기 생성된 양자화 규칙을 사용하여 상기 입력 파라미터로부터 양자화된 양자화 파라미터를 유도하는 값양자화기를 포함하는 파라미터 양자화기.
  2. 제1항에 있어서,
    상기 양자화 규칙 생성기는 높은 에너지 척도를 갖는 채널 쌍 또는 한 채널보다 낮은 에너지 척도를 갖는 채널 쌍 또는 한 채널에 대해 더 거칠게 양자화하는 양자화 규칙을 생성하도록 작동하는 것인 파라미터 양자화기.
  3. 제1항에 있어서,
    상기 양자화 규칙 생성기는 둘 이상 미리 설정된 양자화 규칙으로부터 하나의 양자화 규칙을 선택하도록 작동하는 것인 파라미터 양자화기.
  4. 제1항에 있어서,
    상기 양자화 규칙 생성기는 다채널 신호의 에너지 척도와 상기 한 채널 또는 한 쌍의 채널들의 에너지 척도의 관계를 바탕으로 하여 새로운 양자화 규칙을 계산하도록 작동하는 것인 파라미터 양자화기.
  5. 제4항에 있어서,
    상기 양자화 규칙 생성기는 양자화 규칙의 계산이 스케일 팩터의 계산을 포함하도록 작동하는 것인 파라미터 양자화기.
  6. 제5항에 있어서,
    상기 스케일 팩터를 이용하여 입력 파라미터를 조정하기 위한 파라미터 스케일러를 더 포함하는 파라미터 양자화기.
  7. 제6항에 있어서,
    상기 파라미터 스케일러는 상기 조정이 스케일러 팩터에 의해 입력 파라미터의 분할을 포함하도록 상기 입력 파라미터를 조정하는 것인 파라미터 양자화기.
  8. 제5항에 있어서,
    압축 장치를 더 포함하며,
    상기 파라미터 양자화기는 미리 설정된 양자화 규칙을 이용하여 중간 양자화 파라미터를 유도하도록 작동하며,
    상기 압축장치는 상기 스케일 팩터 및 중간 양자화 파라미터를 이용하여 양자화 파라미터를 유도하도록 작동하는 파라미터 양자화기.
  9. 제1항에 있어서,
    상기 양자화 규칙 생성기는 상기 입력 파라미터에 상기 양자화 규칙을 적용하여 주어진 입력 파라미터 범위 내의 모든 입력 파라미터에 대하여 동일한 양자화 파라미터를 할당하는 양자화 규칙을 생성하도록 작동하는 것인 파라미터 양자화기.
  10. 제1항에 있어서,
    상기 입력 파라미터는, 다채널 오디오 신호의 공간적 인식을 설명하는 공간적 파라미터이고, 다음의 파라미터들의 리스트로부터 선택되는 것인 파라미터 양자화기,
    채널간 상관관계/간섭성(ICC);
    채널간 레벨/크기 차(ICLD or IID);
    채널간 위상 차(IPD); 및
    채널간 시간 차(ICTD).
  11. 제1항에 있어서,
    차등 부호화기 및 후프만 부호화기를 더 포함하며,
    상기 차등 부호화기는 양자화 파라미터의 차등적으로 부호화된 표현을 유도하도록 작동하고,
    상기 후프만 부호화기는 차등적으로 부호화된 표현의 후프만-부호화된 표현을 유도하도록 작동하는 것인 파라미터 양자화기.
  12. 파라미터를 유도하도록 양자화된 파라미터를 탈양자화하는 파라미터 탈양자화기로서, 상기 입력 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며,
    상기 다채널 신호의 채널들로부터 유도된 에너지 척도 및 상기 한 쌍의 채널 또는 한 채널의 에너지 척도와의 관계를 바탕으로 하여 탈양자화 규칙을 생성하는 양자화 규칙 생성기; 및
    상기 생성된 탈양자화 규칙을 이용하여, 상기 양자화 파라미터로부터 상기 파라미터를 유도하는 값 탈양자화기를 포함하는 파라미터 탈양자화기.
  13. 제12항에 있어서,
    상기 탈양자화 규칙 생성기는 다채널 신호의 채널들로부터 유도된 에너지 척도를 이용하도록 작동하며, 이것은 상기 채널 또는 한 쌍의 채널을 구비하지 않은 채널들의 조합으로부터 유도되는 것이 특징인 파라미터 탈양자화기.
  14. 제12항에 있어서,
    상기 탈양자화 규칙 생성기는 높은 에너지 척도를 갖는 한 채널 또는 한 쌍의 채널들 보다 낮은 에너지 척도를 갖는 한 채널 또는 한 쌍의 채널들에 대하여 탈양자화가 더 거칠게 되도록 하는 탈양자화 규칙을 생성하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  15. 제12항에 있어서,
    상기 탈양자화 규칙 생성기는 메모리에 저장된 둘 이상의 고정된 탈양자화 규칙으로부터 하나의 탈양자화 규칙을 선택하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  16. 제12항에 있어서,
    상기 탈양자화 규칙 생성기는 한 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 채널들로부터 유도된 에너지 척도의 관계를 바탕으로 새로운 탈양자화 규칙을 계산하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  17. 제12항에 있어서,
    상기 탈양자화 규칙 생성기는 상기 탈양자화 규칙의 계산이 스케일 팩터의 계산을 포함하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  18. 제17항에 있어서,
    상기 탈양자화 규칙 생성기는 상기 스케일 팩터를 이용하는 파라미터를 조정기 위한 파라미터 스케일러를 더 포함하는 것이 특징인 파라미터 탈양자화기.
  19. 제17항에 있어서,
    상기 파라미터 스케일러는 상기 조정이 스케일 팩터에 의해 파라미터의 곱셈을 포함할 만큼 상기 파라미터를 조정하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  20. 제17항에 있어서,
    상기 탈양자화 규칙 생성기는 상기 스케일 팩터를 이용하여 양자화 파라미터로부터 중간 양자화 파라미터를 유도하기 위한 해독기를 더 포함하며,
    상기 값 탈양자화기는 고정된 탈양자화 규칙을 이용하는 상기 중간 양자화 파라미터로부터 파라미터를 유도하도록 작동하는 것이 특징인 파라미터 탈양자화기
  21. 제20항에 있어서,
    상기 해독기는 상기 양자화 파라미터 및 스케일 팩터의 곱셈에 의해 상기 중간 양자화 파라미터를 유도하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  22. 제20항에 있어서,
    상기 탈양자화 규칙 생성기는 중간 양자화된 파라미터로부터 정수값의 중간 양자화 파라미터를 유도하는 라운더기를 더 포함하며,
    상기 값 탈양자화기는 고정된 탈양자화 규칙을 이용하는 정수값의 중간 양자화 파라미터로부터 파라미터를 유도하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  23. 제12항에 있어서,
    상기 양자화 파라미터는 중앙 채널과 저주파 강조 채널의 조합 및 좌측 전방 채널과 우측 전방 채널의 조합 사이에서의 에너지 관계에 대한 척도이며,
    상기 에너지 척도는 좌측 전방과 우측 전방 채널로부터 조합된 제1 채널 및 중앙 채널과 저주파 강조 채널로부터 조합된 제2채널을 구비하는 한 쌍의 채널에 대한 에너지 척도이며,
    상기 다채널 신호의 채널들로부터 유도된 에너지 척도는 좌측 후방 및 우측 후방 채널의 조합으로부터 유도된 에너지 척도인 것이 특징인 파라미터 탈양자화기.
  24. 제12항에 있어서,
    상기 양자화 파라미터는 좌측 후방 및 우측 후방 채널 사이에서의 에너지 관계에 대한 척도이고,
    상기 에너지 척도는 좌측 후방 및 우측 후방 채널을 구비한 한 쌍의 채널들에 대한 에너지 척도이며,
    상기 다채널 신호의 채널들로부터 유도된 에너지 척도는 좌측 전방, 우측 전방, 중앙 및 저주파 강조 채널의 조합으로부터 유도된 에너지 척도인 것이 특징인 파라미터 탈양자화기.
  25. 제12항에 있어서,
    상기 양자화 파라미터는 좌측 전방 및 우측 전방 채널 사이에서의 에너지 관계에 대한 척도이고,
    상기 에너지 척도는 좌측 전방 및 우측 전방 채널을 구비한 한 쌍의 채널들에 대한 척도이며,
    상기 다채널 신호의 채널들로부터 유도된 에너지 척도는 중앙 및 저주파 강조 채널의 조합으로부터 유도된 에너지 척도인 것이 특징인 파라미터 탈양자화기.
  26. 제12항에 있어서,
    상기 양자화 파라미터는 좌측 전방과 좌측 후방의 조합 및 우측 전방과 우측 후방의 조합 사이에서의 에너지 관계에 대한 척도이고,
    상기 에너지 척도는 좌측 전방과 좌측 후방 채널로부터 조합된 제1채널 및 우측 전방과 우측 후방 채널로부터 조합된 제2채널을 구비한 한 쌍의 채널에 대한 에너지 척도이며,
    상기 다채널 신호의 채널로부터 유도된 에너지 척도는 중앙 및 저주파 강조 채널의 조합으로부터 유도된 에너지 척도인 것이 특징인 파라미터 탈양자화기.
  27. 제12항에 있어서,
    상기 양자화 파라미터는 좌측 전방 및 좌측 후방 채널 사이에서의 에너지 관계에 대한 척도이고,
    상기 에너지 척도는 좌측 전방 및 좌측 후방 채널을 구비한 한 쌍의 채널에 대한 에너지 척도이며,
    상기 다채널 신호의 채널로부터 유도된 에너지 척도는 우측 전방 및 우측 후방 채널의 조합으로부터 유도된 에너지 척도인 것이 특징인 파라미터 탈양자화기.
  28. 제12항에 있어서,
    상기 양자화 파라미터는 우측 전방 및 우측 후방 채널 사이에서의 에너지 관계에 대한 척도이고,
    상기 에너지 척도는 우측 전방 및 우측 후방 채널을 구비한 한 쌍의 채널에 대한 에너지 척도이며,
    상기 다채널 신호의 채널로부터 유도된 에너지 척도는 좌측 전방 및 좌측 후방 채널의 조합으로부터 유도된 에너지 척도인 것이 특징인 파라미터 탈양자화기.
  29. 제12항에 있어서,
    상기 양자화 파라미터에 상기 탈양자화 규칙을 적용하여 상기 파라미터에 양자화 파라미터의 할당을 포함하는 탈양자화 규칙을 생성하도록 작동하는 것이 특징 인 파라미터 탈양자화기.
  30. 제12항에 있어서,
    차등 복호화기 및 후프만 복호화기를 더 포함하며,
    상기 후프만 복호화기는 수신된 후프만-부호화된 표현의 후프만 복호화 표현을 유도하도록 작동하고,
    상기 차등 복호화기는 후프만-복호화된 표현으로부터 양자화 파라미터를 유도하도록 작동하는 것이 특징인 파라미터 탈양자화기.
  31. 제12항에 있어서,
    상기 파라미터는, 다채널 오디오 신호의 공간적 인식을 설명하는 공간적 파라미터이고, 상기 입력 파라미터는 다음의 파라미터들의 리스트로부터 선택되는 것이 특징인 파라미터 양자화기,
    채널간 상관관계/간섭성(ICC);
    채널간 레벨/크기 차(ICLD or IID);
    채널간 위상 차(IPD); 및
    채널간 시간 차(ICTD).
  32. 입력 파라미터를 양자화하는 방법으로서, 상기 입력 파라미터는 한 채널 또는 다른 한 채널과 관련된 한 쌍의 채널들 또는 다채널 신호의 한쌍의 채널의 특징 에 대한 척도이며, 상기 방법은:
    상기 한 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 바탕으로 양자화 규칙을 생성하는 단계; 및
    상기 생성된 양자화 규칙을 이용하여 입력 파라미터로부터 양자화 파라미터를 유도하는 단계를 포함하는 입력 파라미터를 양자화하는 방법.
  33. 파라미터를 유도하도록 양자화 파라미터를 탈양자화하는 방법으로서, 상기 파라미터는 한 채널 또는 다른 한 채널에 관련된 한 쌍의 채널들 또는 다채널 신호의 한 쌍의 채널의 특징에 대한 척도이며, 상기 방법은:
    상기 한 채널 또는 한 쌍의 채널들의 에너지 척도 및 다채널 신호의 에너지 척도의 관계를 바탕으로 탈양자화 규칙을 생성하는 단계; 및
    상기 생성된 탈양자화 규칙을 이용하여 상기 양자화 파라미터로부터 상기 파라미터를 유도하는 단계를 포함하는 파라미터를 유도하도록 양자화 파라미터를 탈양자화하는 방법.
  34. 한 채널 또는 한 쌍의 채널들의 특징에 대한 척도인 파라미터의 양자화된 표현인 양자화 파라미터를 가진 다채널 신호의 표현으로서,
    상기 파라미터는 한 채널 또는 한 쌍의 채널이 다른 다채널 신호의 한 채널 또는 한 쌍의 채널과 관련된 특징에 대한 척도이며,
    상기 양자화 파라미터는 상기 다채널 신호의 에너지 척도 및 상기 한 쌍의 채널 또는 한 채널의 에너지 척도와의 관계를 바탕으로 한 양자화 규칙을 사용하여 유도된 것이 특징인 다채널 신호의 표현.
  35. 청구항 34항의 다채널 신호의 표현을 저장하는 기계판독가능한 저장 매체.
  36. 청구항 1항의 파라미터 양자화기를 구비한 송신기 또는 오디오 레코더.
  37. 청구항 12항의 파라미터 탈양자화기를 구비한 수신기 또는 오디오 플레이어.
  38. 청구항 32항의 양자화 방법을 포함하는 전송방법 또는 오디오 기록 방법.
  39. 청구항 33항의 탈양자화 방법을 구비하는, 수신 방법 또는 오디오 재생 방법.
  40. 청구항 1항의 파라미터 양자화기를 갖는 송신기 및 청구항 12항의 파라미터 탈양자화기를 갖는 수신기를 구비하는 전송 시스템.
  41. 청구항 32항의 양자화방법을 구비하는 송신 방법 및 청구항 33항의 탈양자화 방법을 구비하는 수신 방법을 포함하는 송수신 방법.
  42. 컴퓨터에서 구동될 때, 청구항 32항, 33항, 38항, 39항 및 41항의 방법 중 어느 하나의 방법에 따른 방법을 실행하기 위한 컴퓨터 프로그램.
  43. 다채널 신호의 재구성을 생성하기 위한 다채널 복호화기로서,
    청구항12항에 따른 파라미터 탈양자화기; 및
    상기 파라미터 탈양자화기에 의해 탈양자화된 파라미터를 이용하여 전송된 다운-믹스된 신호로부터 다채널 신호의 재구성을 업-믹싱하기 위한 업-믹서를 포함하는 다채널 복호화기.
  44. 다채널 신호의 부호화된 표현을 생성하기 위한 다채널 부호화기로서,
    청구항1항에 따른 파라미터 양자화기; 및
    상기 양자화기에 의해 양자화된 파라미터를 이용하여 다채널 신호로부터 다운-믹스 신호를 생성하는 다운-믹서를 포함하며,
    상기 다운-믹스 신호는 다채널 신호보다 더 작은 수의 채널들을 가지는 것이 특징인 다채널 부호화기.
KR1020077003513A 2005-04-19 2006-04-10 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화 KR100878371B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67294305P 2005-04-19 2005-04-19
US60/672,943 2005-04-19

Publications (2)

Publication Number Publication Date
KR20070062502A true KR20070062502A (ko) 2007-06-15
KR100878371B1 KR100878371B1 (ko) 2009-01-15

Family

ID=36581679

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077003513A KR100878371B1 (ko) 2005-04-19 2006-04-10 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화

Country Status (15)

Country Link
US (1) US8054981B2 (ko)
EP (1) EP1754222B1 (ko)
JP (1) JP4521032B2 (ko)
KR (1) KR100878371B1 (ko)
CN (1) CN1993733B (ko)
AT (1) ATE378675T1 (ko)
BR (1) BRPI0605857A (ko)
DE (1) DE602006000239T2 (ko)
ES (1) ES2297825T3 (ko)
HK (1) HK1095993A1 (ko)
MY (1) MY141427A (ko)
PL (1) PL1754222T3 (ko)
RU (1) RU2376655C2 (ko)
TW (1) TWI327306B (ko)
WO (1) WO2006111294A1 (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006104017A1 (ja) * 2005-03-25 2006-10-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
JP5463143B2 (ja) * 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
US8352249B2 (en) * 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
CN102027535A (zh) * 2008-04-11 2011-04-20 诺基亚公司 信号处理
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US9167367B2 (en) * 2009-10-15 2015-10-20 France Telecom Optimized low-bit rate parametric coding/decoding
JP2012023540A (ja) * 2010-07-14 2012-02-02 Asahi Kasei Electronics Co Ltd マルチビットデルタシグマ変調器及びadコンバータ
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
JP5775637B2 (ja) * 2011-08-04 2015-09-09 ドルビー・インターナショナル・アーベー パラメトリック・ステレオを使った改善されたfmステレオ電波受信機
KR101662682B1 (ko) 2012-04-05 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 채널간 차이 추정 방법 및 공간적 오디오 코딩 장치
KR101647576B1 (ko) * 2012-05-29 2016-08-10 노키아 테크놀로지스 오와이 스테레오 오디오 신호 인코더
US9154785B2 (en) 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
US9350970B2 (en) 2012-12-14 2016-05-24 Qualcomm Incorporated Disparity vector derivation
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
BR112015025009B1 (pt) 2013-04-05 2021-12-21 Dolby International Ab Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar
US9821908B2 (en) * 2013-06-07 2017-11-21 Bell Helicopter Textron Inc. System and method for assisting in rotor speed control
CN105324812A (zh) * 2013-06-17 2016-02-10 杜比实验室特许公司 不同信号维度的参数矢量的多级量化
EP3014609B1 (en) * 2013-06-27 2017-09-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
US9911423B2 (en) 2014-01-13 2018-03-06 Nokia Technologies Oy Multi-channel audio signal classifier
KR102482162B1 (ko) * 2014-10-01 2022-12-29 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
EP3201918B1 (en) * 2014-10-02 2018-12-12 Dolby International AB Decoding method and decoder for dialog enhancement
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
MY196198A (en) * 2016-11-08 2023-03-22 Fraunhofer Ges Forschung Apparatus and Method for Downmixing or Upmixing a Multichannel Signal Using Phase Compensation
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
PT3874492T (pt) 2018-10-31 2024-01-09 Nokia Technologies Oy Determinação de codificação de parâmetro de áudio espacial e descodificação associada
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
GB2595883A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2598773A (en) * 2020-09-14 2022-03-16 Nokia Technologies Oy Quantizing spatial audio parameters

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HU216669B (hu) * 1990-09-19 1999-08-30 Koninklijke Philips Electronics N.V. Információhordozó fő adatállománnyal és vezérlőállománnyal, eljárás és készülék ezen állományok rögzítésére, valamint készülék azok kiolvasására
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
AU2002343151A1 (en) * 2001-11-23 2003-06-10 Koninklijke Philips Electronics N.V. Perceptual noise substitution
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
AU2003244932A1 (en) * 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
DE602004002390T2 (de) 2003-02-11 2007-09-06 Koninklijke Philips Electronics N.V. Audiocodierung
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
CA2533119A1 (en) * 2003-07-24 2005-02-03 Qiagen Gmbh Method for the reverse transcription and/or amplification of nucleic acids

Also Published As

Publication number Publication date
EP1754222A1 (en) 2007-02-21
DE602006000239D1 (de) 2007-12-27
KR100878371B1 (ko) 2009-01-15
RU2007106874A (ru) 2008-08-27
CN1993733B (zh) 2010-12-08
ES2297825T3 (es) 2008-05-01
TWI327306B (en) 2010-07-11
RU2376655C2 (ru) 2009-12-20
US8054981B2 (en) 2011-11-08
HK1095993A1 (en) 2007-05-25
JP2008517339A (ja) 2008-05-22
ATE378675T1 (de) 2007-11-15
TW200703238A (en) 2007-01-16
US20070016416A1 (en) 2007-01-18
JP4521032B2 (ja) 2010-08-11
MY141427A (en) 2010-04-30
PL1754222T3 (pl) 2008-04-30
DE602006000239T2 (de) 2008-09-18
BRPI0605857A (pt) 2007-12-18
CN1993733A (zh) 2007-07-04
WO2006111294A1 (en) 2006-10-26
EP1754222B1 (en) 2007-11-14

Similar Documents

Publication Publication Date Title
KR100878371B1 (ko) 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화
KR100913987B1 (ko) 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법
US7916873B2 (en) Stereo compatible multi-channel audio coding
US7945449B2 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
US8015018B2 (en) Multichannel decorrelation in spatial audio coding
US9565509B2 (en) Enhanced coding and parameter representation of multichannel downmixed object coding
CN101228575B (zh) 利用侧向信息的声道重新配置
EP2360681A1 (en) Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
CN110223701B (zh) 用于从缩混信号产生音频输出信号的解码器和方法
EP1934973A1 (en) Temporal and spatial shaping of multi-channel audio signals
EP1941498A2 (en) Controlling spatial audio coding parameters as a function of auditory events
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121228

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131227

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20141229

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20151230

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20161230

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20171228

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20181228

Year of fee payment: 11