KR20170084335A - 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 - Google Patents

오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 Download PDF

Info

Publication number
KR20170084335A
KR20170084335A KR1020177018317A KR20177018317A KR20170084335A KR 20170084335 A KR20170084335 A KR 20170084335A KR 1020177018317 A KR1020177018317 A KR 1020177018317A KR 20177018317 A KR20177018317 A KR 20177018317A KR 20170084335 A KR20170084335 A KR 20170084335A
Authority
KR
South Korea
Prior art keywords
matrix
decoding
sound field
loudspeakers
audio sound
Prior art date
Application number
KR1020177018317A
Other languages
English (en)
Other versions
KR101795015B1 (ko
Inventor
요한-마커스 바트케
플로리안 케일러
요하네스 보엠
Original Assignee
돌비 인터네셔널 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비 filed Critical 돌비 인터네셔널 에이비
Publication of KR20170084335A publication Critical patent/KR20170084335A/ko
Application granted granted Critical
Publication of KR101795015B1 publication Critical patent/KR101795015B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

예컨대 앰비소닉스와 같은 사운드필드 신호는 원하는 사운드필드의 표현을 갖고 있다. 앰비소닉스 포맷은 사운드필드의 구면 고조파 분해에 바탕을 두고 있으며, 고차 앰비소닉스(HOA)는 적어도 2차의 구면 고조파를 이용한다. 그러나, 일반적으로 이용되는 확성기 설정은 불규칙적이며 디코더 설계 시에 문제가 된다. 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법은 복수의 확성기 의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하는 단계(110), 상기 확성기 위치들로부터 모드 행렬(
Figure pat00034
)을 산출하는 단계(120), 의사 역모드 행렬(
Figure pat00035
)을 산출하는 단계(130), 및 상기 오디오 사운드필드 표현을 디코딩하는 단계(140)를 포함한다. 상기 디코딩은 상기 패닝 함수(W)와 상기 의사 역모드 행렬(
Figure pat00036
)로부터 구한 디코드 행렬(D)에 기초한다.

Description

오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치{METHOD AND DEVICE FOR DECODING AN AUDIO SOUNDFIELD REPRESENTATION FOR AUDIO PLAYBACK}
본 발명은 오디오 재생을 위한 오디오 사운드필드 표현, 특히 앰비소닉스 포맷 오디오 표현을 디코딩하는 방법 및 장치에 관한 것이다.
이 절에서는 하기에서 설명 및/또는 권리청구되는 본 발명의 여러 가지 양상에 관련될 수 있는 기술의 여러 가지 양상을 독자에게 소개하고자 한다. 이 설명은 본 발명의 여러 가지 양상을 더 잘 이해할 수 있도록 하는 배경 정보를 독자에게 제공하는 데 도움이 될 것으로 생각한다. 따라서, 이 설명은 소스가 명시적으로 언급되지 않는 한, 이러한 견지에서 파악되어야 하며, 종래 기술을 인정하는 것으로 이해되어서는 안 된다는 것을 알아야 한다.
정확한 로컬라이제이션(localization)은 임의의 공간적 오디오 재생 시스템의 핵심적인 목표이다. 그와 같은 재생 시스템은 화상회의 시스템, 게임, 또는 기타 여러 가지 3D 사운드로 득을 보는 가상 환경에 매우 잘 적용될 수 있다. 3D 사운드 장면은 자연스러운 사운드필드로서 합성되거나 캡쳐될 수 있다. 예컨대 앰비소닉스와 같은 사운드필드 신호는 원하는 사운드필드의 표현을 갖고 있다. 앰비소닉스 포맷은 사운드필드의 구면 고조파 분해(spherical harmonic decomposition)에 바탕을 두고 있다. 기본 앰비소닉스 포맷, 즉 B-포맷은 차수가 제로 또는 1인 구면 고조파를 이용하지만, 소위 고차 앰비소닉스(Higher Order Ambisonics: HOA)는 또한 적어도 2차의 구면 고조파를 더 이용한다. 개별적인 확성기 신호를 얻기 위해서는 디코딩 프로세스가 필요하다. 오디오 장면을 합성하려면, 특정 사운드 소스의 공간적 로컬라이제이션을 얻기 위해서 공간적 확성기 배치를 지시하는 패닝(panning) 함수가 필요하다. 자연스러운 사운드필드가 녹화되기 위해서는 공간 정보를 캡쳐하는 마이크로폰 어레이가 필요하다. 공지의 앰비소닉스 방식은 이를 달성할 수 있는 매우 적합한 도구이다. 앰비소닉스 포맷 신호는 원하는 사운드필드의 표현을 갖고 있다. 그와 같은 앰비소닉스 포맷 신호로부터 개별적인 확성기 신호를 얻기 위해서는 디코딩 프로세스가 필요하다. 이 경우에도 패닝 함수가 디코딩 함수로부터 유도될 수 있기 때문에, 패닝 함수는 공간적 로컬라이제이션 업무를 기술하는 데 있어 핵심적인 문제이다. 확성기의 공간적 배치는 여기서는 확성기 설정이라고 한다.
일반적으로 이용되는 확성기 설정은 2개의 확성기를 이용하는 스테레오 설정, 5개의 확성기를 이용하는 표준 서라운드 설정, 5개 초과의 확성기를 이용하는 확장된 서라운드 설정이다. 이들 설정은 공지되어 있다. 그러나, 이들은 2차원(2D)에 한정된다. 예컨대, 높이 정보는 재생되지 않는다.
3차원(3D) 재생을 위한 확성기 설정은 예컨대 「"Wide listening area with exceptional spatial sound quality of a 22.2 multichannel sound system", K. Hamasaki, T. Nishiguchi, R. Okumaura, and Y. Nakayama in Audio Engineering Society Preprints, Vienna, Austria, May 2007」(이것은 22.2 format, 즉 2+2+2 arrangement of Dabringhaus(mdg-musikproduktion dabringhaus und grimm, www.mdg.de)를 가진 NHK 초고해상 TV에 대한 제안서임)과, 「10.2 setup in "Sound for Film and Television", T. Holman in 2nd ed. Boston: Focal Press, 2002」에 기재되어 있다. 공간 재생과 패닝 전략을 지시하는 몇 가지 공지의 시스템들 중 하나는 「"Virtual sound source positioning using vector base amplitude panning," Journal of Audio Engineering Society, vol. 45, no. 6, pp. 456-466, June 1997」(여기에서, Pulkki라 함)에서의 벡터 베이스 진폭 패닝(VBAP) 방식이다. Pulkki는 VBAP(Vector Base Amplitude Panning)를 이용하여 임의의 확성기 설정을 가지고 가상 음향 소스를 재생하였다. 가상 소스를 2D 평면에 배치하기 위해서는 한쌍의 확성기가 필요한 반면에, 3D 경우에는 3중의 확성기가 필요하다. 각 가상 소스에 있어서, (가상 소스의 위치에 따라서) 이득이 서로 다른 모노포닉 신호가 전체 설정 중에서 선택된 확성기에 공급된다. 그런 다음에, 모든 가상 소스에 대한 확성기 신호가 합산된다. VBAP는 확성기들 간의 패닝을 위해 확성기 신호의 이득을 산출하기 위해 기하학적 방식을 적용한다.
여기서 고려되고 새로이 제시되는 예시적인 3D 확성기 설정예는 도 2에 도시된 바와 같이 위치하는 16개의 확성기를 갖고 있다. 각각이 3개의 확성기를 가진 4개의 기둥을 가지고 이들 기둥 사이에 추가 확성기가 있는 실제 고려 사항 때문에 이러한 위치 설정이 선택되었다. 더 구체적으로 설명하면, 청취자의 머리 주위에는 8개의 확성기가 원형으로 45도 각도로 동등하게 분포되어 있다. 추가적인 4개의 확성기가 상단과 하단에 90도의 방위각으로 배치되어 있다. 앰비소닉스에 관해서는, 「"An ambisonics format for flexible playback layouts," by H. Pomberger and F. Zotter in Proceedings of the 1st Ambisonis Symposium, Graz, Austria, July 2009」에서 언급한 바와 같이, 이 설정은 불규칙적이며 디코더 설계시에 문제가 된다.
「"Three-dimensional surround sound systems based on spherical harmonics" by M. Poletti in J. Audio Eng. Soc., vol. 53, no. 11, pp. 1004-1025, Nov. 2005」에 기재되어 있는 바와 같이, 종래의 앰비소닉스 디코딩은 일반적으로 알려져 있는 모드 매칭 프로세스를 이용한다. 모드는 명확한 입사 방향에 대한 구면 고조파의 값을 포함하는 모드 벡터에 의해 기술된다. 개별 확성기에 의해 주어지는 모든 방향을 조합하면 확성기 설정의 모드 행렬이 되며, 이 모드 행렬은 확성기 위치를 나타낸다. 명확한 소스 신호의 모드를 재생하기 위해서는 개별적인 확성기의 중첩된 모드들이 원하는 모드로 합산되는 식으로 확성기 모드들이 가중된다. 필요한 가중치를 얻기 위해서는 확성기 모드 행렬의 역행렬 표현이 산출될 필요가 있다. 신호 디코딩 면에서 보면, 가중치는 확성기의 구동 신호를 형성하며, 역 확성기 모드 행렬은 앰비소닉스 포맷 신호 표현을 디코딩하는 데 적용되는 "디코딩 행렬"이라 한다. 특히, 많은 확성기 설정에 있어서, 예컨대 도 2에 도시된 설정에 있어서는 모드 행렬의 역을 구하기가 어렵다.
전술한 바와 같이, 일반적으로 이용되는 확성기 설정은 2D에 한정된다. 즉, 높이 정보는 재생되지 않는다. 수학적으로 규칙적이지 않는 공간 분포를 갖는 확성기 설정에 대한 사운드필드 표현을 디코딩하면 일반적으로 알려진 기법으로는 로컬라이제이션과 음색 변화 문제가 생긴다. 앰비소닉스 신호를 디코딩하기 위해서는 디코딩 행렬(즉, 디코딩 계수 행렬)이 이용된다. 종래의 앰비소닉스 신호, 특히 HOA 신호 디코딩에서는 적어도 2가지 문제가 발생한다. 첫째, 올바른 디코딩을 위해서는 디코딩 행렬을 얻기 위해 신호 소스 방향을 알아야 한다. 둘째, 수학적으로 올바른 디코딩의 결과 양의 확성기 진폭뿐만 아니라 일부 음의 확성기 진폭도 생길 것이라는 수학적 문제 때문에 기존의 확성기 설정에의 맵핑은 조직적으로 틀린다. 그러나, 이들은 양의 신호로서 틀리게 재생되고, 따라서 전술한 문제가 생기게 된다.
본 발명은 개선된 로컬라이제이션과 음색 변화 특성을 가진 비규칙적 공간 분포에 대한 사운드필드 표현을 디코딩하는 방법을 제공한다. 본 발명은 예컨대 앰비소닉스 포맷으로 된 사운드필드 데이터에 대한 디코딩 행렬을 구하는 다른 방법을 대표하며, 프로세스를 시스템 평가 방식으로 이용한다. 가능한 입사 방향 세트를 고려하여, 원하는 확성기와 관련된 패닝 함수가 산출된다. 패닝 함수는 앰비소닉스 디코딩 프로세스의 출력으로서 취해진다. 필요한 입력 신호는 모든 고려되는 방향의 모드 행렬이다. 그러므로, 후술하는 바와 같이, 디코딩 행렬은 다중 행렬에 입력 신호의 모드 행렬의 역행렬을 직접적으로 곱함으로써 구해진다.
전술한 두 번째 문제와 관련하여, 확성기 위치를 나타내는 소위 모드 행렬의 역과 위치 종속 가중 함수("패닝 함수") W로부터 디코딩 행렬을 구하는 것도 가능함을 알았다. 본 발명의 일 양상은 이들 패닝 함수 W가 일반적으로 이용되는 것과 다른 방법을 이용하여 도출될 수 있다는 것이다. 양호하게도 간단한 기하학적 방법이 이용된다. 그와 같은 방법은 신호 소스 방향을 몰라도 되며, 따라서 전술한 첫 번째 문제를 해결할 수 있다. 그와 같은 하나의 방법은 VBAP(Vector-Based Amplitude Panning)로 알려져 있다. 본 발명에 따라서, VBAP는 필요한 패닝 함수를 산출하는 데 이용되며, 이 패닝 함수는 앰비소닉스 디코딩 행렬을 산출하는 데 이용된다. (확성기 설정을 표현하는) 모드 행렬의 역행렬이 필요하다는 점에서 다른 문제가 발생한다. 그러나, 정확한 역행렬을 구하기는 어렵고, 이 또한 오디오 재생을 틀리게 한다. 따라서, 추가적인 양상은 디코딩 행렬을 구하기 위해 구하기 훨씬 쉬운 의사 역모드 행렬이 산출된다는 것이다.
본 발명은 2단계 방식을 이용한다. 제1 단계는 재생을 위해 이용된 확성기 설정에 의존하는 패닝 함수를 도출하는 것이다. 제2 단계에서는 모든 확성기에 대한 패닝 함수로부터 앰비소닉스 디코딩 행렬이 계산된다.
본 발명의 이점은 사운드 소스의 파라메트릭 기술(description)이 필요치 않고, 대신에 앰비소닉스와 같은 사운드필드 기술이 이용될 수 있다는 것이다.
본 발명에 따라서, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법은, 복수의 확성기 각각에 대해, 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수를 산출하는 단계, 상기 소스 방향으로부터 모드 행렬을 산출하는 단계, 상기 모드 행렬의 의사 역모드 행렬을 산출하는 단계, 및 상기 오디오 사운드필드 표현을 디코딩하는 단계를 포함하며, 상기 디코딩은 적어도 상기 패닝 함수와 상기 의사 역모드 행렬로부터 구한 디코드 행렬에 기초한다.
다른 양상에 따라서, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 장치는, 복수의 확성기 각각에 대해, 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수를 산출하기 위한 제1 산출 수단, 상기 소스 방향으로부터 모드 행렬을 산출하기 위한 제2 산출 수단, 상기 모드 행렬의 의사 역모드 행렬을 산출하기 위한 제3 산출 수단, 및 상기 사운드필드 표현을 디코딩하기 위한 디코더 수단을 포함하고, 상기 디코딩은 디코드 행렬에 기초하고, 상기 디코더 수단은 적어도 상기 패닝 함수와 상기 의사 역모드 행렬을 이용하여 상기 디코드 행렬을 구한다. 상기 제1, 제2 및 제3 산출 수단은 단일 프로세서 또는 2개 이상의 독립적인 프로세서일 수 있다.
또 다른 양상에 따라서, 컴퓨터 판독 가능 매체는, 컴퓨터에게, 복수의 확성기 각각에 대해, 확성기들의 위치와 복수의 소스 방향에 기초한 기하학적 방법을 이용하여 패닝 함수를 산출하는 단계, 상기 소스 방향으로부터 모드 행렬을 산출하는 단계, 상기 모드 행렬의 의사 역모드 행렬을 산출하는 단계, 및 상기 오디오 사운드필드 표현을 디코딩하는 단계를 포함하며, 상기 디코딩은 적어도 상기 패닝 함수와 상기 의사 역모드 행렬로부터 구한 디코드 행렬에 기초하는, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법을 수행하게 하는 실행 가능 명령어를 저장한다.
본 발명의 바람직한 실시예들은 종속항, 하기의 상세한 설명 및 도면에 개시된다.
첨부 도면을 참조로 본 발명의 예시적 실시예들에 대해 설명한다.
도 1은 본 방법의 플로우차트.
도 2는 16개의 확성기를 가진 예시적 3D 설정을 보여주는 도.
도 3은 비규칙화(non-regularized) 모드 매칭을 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도.
도 4는 규칙화 모드 행렬을 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도.
도 5는 VBAP로부터 도출된 디코딩 행렬을 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도.
도 6은 듣기 평가의 결과를 보여주는 도.
도 7은 장치의 블록도를 도시한 도.
도 1에 도시된 바와 같이, 오디오 재생을 위한 오디오 사운드필드 표현(SFc)을 디코딩하는 방법은, 복수의 확성기 각각에 대해, 확성기들의 위치(102)(L은 확성기 수)와 복수의 소스 방향(103)(S는 소스 방향 수)에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하는 단계(110), 상기 소스 방향과 상기 사운드필드 표현의 주어진 차수(N)로부터 모드 행렬
Figure pat00001
을 산출하는 단계(120), 모드 행렬
Figure pat00002
의 의사 역모드 행렬
Figure pat00003
을 산출하는 단계(130), 및 디코딩된 사운드 데이터(AUdec)를 얻도록 상기 오디오 사운드필드 표현(SFc)을 디코딩하는 단계(135, 140)를 포함한다. 이 디코딩은 적어도 패닝 함수 W와 의사 역모드 행렬
Figure pat00004
로부터 구한(135) 디코드 행렬 D에 기초한다. 일 실시예에서, 의사 역모드 행렬은
Figure pat00005
에 따라서 구해진다. 사운드필드 표현의 차수(N)는 미리 정의되거나 입력 신호(SFc)로부터 추출될(105) 수 있다.
도 7에 도시된 바와 같이, 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 장치는, 복수의 확성기 각각에 대해, 확성기들의 위치(102)와 복수의 소스 방향(103)에 기초한 기하학적 방법을 이용하여 패닝 함수(W)를 산출하기 위한 제1 산출 수단(210), 상기 소스 방향으로부터 모드 행렬
Figure pat00006
을 산출하기 위한 제2 산출 수단(220), 모드 행렬
Figure pat00007
의 의사 역모드 행렬
Figure pat00008
을 산출하기 위한 제3 산출 수단(230), 및 상기 사운드필드 표현을 디코딩하기 위한 디코더 수단(240)을 포함한다. 이 디코딩은 디코드 행렬 산출 수단(235)(예컨대 곱셈기)에 의해 적어도 패닝 함수 W와 의사 역모드 행렬
Figure pat00009
로부터 구한 디코드 행렬 D에 기초한다. 디코더 수단(240)은 디코드 행렬 D를 이용하여 디코딩된 오디오 신호(AUdec)를 얻는다. 제1, 제2 및 제3 산출 수단(210, 220, 230)은 단일 프로세서 또는 2 이상의 독립적인 프로세서일 수 있다. 사운드필드 표현의 차수(N)는 미리 정의되거나 입력 신호(SFc)로부터 그 차수를 추출하기 위한 수단(205)에 의해 구해질 수 있다.
특히 유용한 3D 확성기 설정은 16개의 확성기를 갖고 있다. 도 2에 도시된 바와 같이, 각각이 3개의 확성기를 가진 4개의 기둥이 있으며, 이들 기둥 사이에 추가 확성기가 있다. 청취자의 머리 주위에는 8개의 확성기가 원형으로 45도 각도로 동등하게 분포되어 있다. 추가적인 4개의 확성기가 상단과 하단에 90도의 방위각으로 배치되어 있다. 앰비소닉스에 관해서는 이 설정은 불규칙적이며, 보통은 디코더 설계 시에 문제가 된다.
이하에서는 VBAP(Vector Base Amplitude Panning)에 대해 상세히 설명한다. 일 실시예에서, VBAP는 확성기들이 청취 위치로부터 동일한 거리에 있다고 가정한 임의의 확성기 설정으로 가상 음향 소스들을 배치하는 데 이용된다. VBAP는 3개의 확성기를 이용하여 3D 공간에 가상 소스를 배치한다. 각 가상 소소에 대해서는, 사용될 확성기들에 이득이 서로 다른 모노포닉(monophonic) 신호가 공급된다. 이들 서로 다른 확성기의 이득은 가상 소스의 위치에 따라 달라진다. VBAP는 확성기들 간의 패닝(panning)을 위한 확성기 신호들의 이득을 산출하는 기하학적 방식이다. 3D 경우에는, 삼각형으로 배치된 3개의 확성기가 벡터 베이스를 구축한다. 각 벡터 베이스는 확성기 번호 k, m, n으로 식별되며, 확성기 위치 벡터 lk, lm, ln은 단위 길이로 정규화된 직교 좌표로 주어진다. 확성기(k, m, n)에 대한 벡터 베이스는 다음과 같이 정의된다.
Figure pat00010
가상 소스의 원하는 방향 Ω=(θ,φ)는 방위각 φ와 경사각 θ로 주어져야 한다. 그러므로 직교 좌표에서 가상 소스의 단위 길이 위치 벡터 p(Ω)는 다음과 같이 정의된다.
Figure pat00011
가상 소스 위치는 상기 벡터 베이스와 이득 계수
Figure pat00012
를 가지고 다음과 같이 표현될 수 있다.
Figure pat00013
벡터 베이스 행렬을 역변환(invert)함으로써 필요한 이득 계수는 다음과 같이 계산될 수 있다.
Figure pat00014
사용될 벡터 베이스는 Pulkki의 논문에 따라서 결정된다. 먼저, 모든 벡터 베이스에 대해 Pulkki에 따라서 이득이 산출된다. 그 다음, 각 벡터 베이스에 대해 이득 계수의 최소치가
Figure pat00015
에 따라서 구해진다. 마지막으로
Figure pat00016
가 최고치를 갖는 벡터 베이스가 이용된다. 이렇게 해서 도출되는 이득 계수는 음수이어서는 안 된다. 청취방 음향에 따라서는 이득 계수는 에너지 보존을 위해 정규화될 수 있다.
이하에서는 사운드필드 포맷의 예로서 앰비소닉스 포맷에 대해서 설명한다. 앰비소닉스 표현은 일 위치에서의 사운드필드의 수학적 근사를 이용하는 사운드필드 기술 방법이다. 구면 좌표계를 이용하여 공간 내 지점 r=(r,θ,φ)에서의 압력은 구면 푸리에 변환에 의해 다음과 같이 기술된다.
Figure pat00017
여기서, k는 파수(wave number)이다. 통상적으로 n은 유한 차수 M에 이른다. 이 급수의 계수 Am n(k)는 (소스가 유효 영역밖에 있다고 가정하면) 사운드필드를 기술하며, jn(kr)은 제1종 구면 베셀 함수이고, Ym n(θ,φ)는 구면 고조파를 나타낸다. 이와 관련하여 계수 Am n(k)는 앰비소닉스 계수로 간주된다. 구면 고조파 Ym n(θ,φ)는 경사각과 방위각에만 종속되며 단위 구면 상의 함수를 기술한다.
단순화하기 위해 사운드필드 재생에 종종 평면파가 가정된다. 평면파를 방향 Ωs로부터의 음향 소스로서 기술하는 앰비소닉스 계수는 다음과 같다.
Figure pat00018
이 계수의 파수 k에의 종속성은 이러한 특수한 경우에는 순수한 방향 종속성으로 감소한다. 한정된 차수 M에 대해서는 계수는 O = (M+1)2 원소를 유지하면서 다음과 같이 배열될 수 있는 벡터 A를 형성한다.
Figure pat00019
이 배열은 벡터
Figure pat00020
를 산출하는 구면 고조차 계수에 이용된다. 윗 첨자 H는 복소 공액 전치를 나타낸다.
사운드필드의 앰비소닉스 표현으로부터 확성기 신호를 산출하는 데는 일반적으로 모드 매칭이 이용된다. 기본 개념은 특정 앰비소닉스 사운드필드 기술(description) A(Ωs)를 확성기들의 사운드필드 기술 A(Ωl)의 가중합으로 표현하는 것이다.
Figure pat00021
여기서, Ωl은 확성기 방향을 나타내며, wl은 가중치이고, L은 확성기 수이다. 수학식 8로부터 패닝 함수를 유도하기 위해서 입사 방향 Ωs는 이미 알고 있는 것으로 가정한다. 소스와 스피커 사운드필드 모두 평면파라면 계수 4πin(수학식 6 참조)은 뺄 수 있고, 수학식 8은 "모드"라고도 하는 구면 고조파 벡터의 복소 공액에만 의존한다. 이는 행렬식으로는 다음과 같다.
Figure pat00022
여기서, Ψ는 O×L개의 원소를 가진 다음과 같은 확성기 설정의 모드 행렬이다.
Figure pat00023
원하는 가중 벡터 w를 얻기 위해, 이를 달성하는 여러 가지 전략이 알려져 있다. 만일 M=3이 선택되면, Ψ는 정방형(sqaure)이며 역변환가능(invertible)하다. 그렇지만 불규칙적인 확성기 설정으로 인해 이 행렬은 확장성이 나쁘다. 그와 같은 경우에, 대개는 의사 역행렬이 선택되며, 하기 수학식은 L×O 디코딩 행렬 D를 산출한다.
Figure pat00024
최종적으로 다음과 같은 수학식이 성립할 수 있다.
Figure pat00025
여기서, 가중치 w(Ωs)는 수학식 9에 대한 최소 에너지 해이다. 이하, 의사 역행렬을 이용하여 얻은 결과에 대해 설명한다.
이하에서는 패닝 함수와 앰비소닉스 디코딩 행렬 간의 연계에 대해 설명한다. 앰비소닉스부터 시작하여, 개별 확성기에 대한 패닝 함수는 수학식 12를 이용하여 산출될 수 있다.
Figure pat00026
이 S개의 입력 신호 방향의 모드 행렬, 예컨대, 1°에서 180°까지 1도씩 단계적으로 증가하는 경사각과 1°에서 360°까지의 방위각을 가진 구면 그리드(spherical grid)라고 하자. 이 모드 행렬은 O×S개의 원소를 갖고 있다. 수학식 12를 이용하여 도출된 행렬 W는 L×S개의 원소를 갖고 있으며, 행 l은 각자의 확성기에 대해 S개의 패닝 가중치를 갖고 있다.
Figure pat00027
대표적인 예로서, 단일 확성기(2)의 패닝 함수는 도 3에서 빔 패턴으로서 나타나 있다. 이 예에서 디코드 행렬 D의 차수 M=3이다. 도시된 바와 같이, 패닝 함수값은 확성기의 물리적 위치를 나타내지 않는다. 이는 선택된 차수에 대한 공간 샘플링 방식으로서는 충분치 않은 확성기의 수학적 불규칙적 위치 설정에 기인한다. 그러므로 디코드 행렬은 비규칙화 모드 행렬이라고 한다. 이 문제는 수학식 11에서 확성기 모드 행렬 Ψ의 규칙화에 의해 극복될 수 있다. 이 해는 디코딩 행렬의 공간 분해능을 희생하는 것이며, 따라서 보다 낮은 앰비소닉스 차수로 표현될 수 있다. 도 4는 규칙화 모드 행렬을 이용하여, 특히 규칙화를 위한 모드 행렬의 고유값들(eigenvalues)의 평균을 이용하여 디코딩한 결과로서 생긴 예시적인 빔 패턴을 보여준다. 도 3과 비교해서, 다루어진 확성기의 방향은 이제 명확히 인식된다.
배경 기술 부분에서 설명한 바와 같이, 패닝 함수가 이미 알려져 있는 경우에는 앰비소닉스 신호의 재생을 위한 디코딩 행렬 D를 얻는 다른 방법도 가능하다. 패닝 함수 W는 가상 소스 방향 Ω 세트 상에서 정의된 원하는 신호로 간주되며, 이들 방향의 모드 행렬
Figure pat00028
은 입력 신호로서 이용된다. 그러면, 디코딩 행렬은 하기 수학식을 이용하여 산출될 수 있다.
Figure pat00029
여기서,
Figure pat00030
또는 간단히
Figure pat00031
는 모드 행렬
Figure pat00032
의 의사 역행렬이다. 이 새로운 방식에서는 VBAP로부터 W 패닝 함수를 취하고 이로부터 앰비소닉스 디코딩 행렬을 산출한다.
W 패닝 함수는 다시 수학식 4를 이용해 산출된 이득값 g(Ω)로서 취해지며, Ω는 수학식 13에 따라서 선택된다. 수학식 15를 이용하는 최종적인 디코드 행렬은 VBAP 패닝 함수를 용이하게 하는 앰비소닉스 디코딩 행렬이다. VBAP로부터 도출된 디코딩 행렬를 이용하여 디코딩한 결과로서 생긴 빔 패턴을 보여주는 도 5에 일례가 도시되어 있다. 양호하게도, 사이드로브 SL은 도 4의 규칙화 모드 매칭 결과의 사이드로브 SLreg보다 훨씬 작다. 더욱이, 개별적인 확성기에 대한 VBAP 도출 빔 패턴은, VBAP 패닝 함수가 다루어진 방향의 벡터 베이스에 의존함에 따라, 확성기 설정의 기하학적 형태를 따른다. 결과적으로, 본 발명에 따른 새로운 방식은 확성기 설정의 모든 방향에 대해 더 양호한 결과를 준다.
소스 방향(103)은 상당히 자유롭게 정의될 수 있다. 소스 방향 S의 수에 대한 조건은 이것이 적어도 (N+1)2이어야 한다는 것이다. 따라서, 사운드필드 신호 SFc의 특정 차수 N을 갖는다면, S≥(N+1)2에 따라서 S를 정의하고, S 소스 방향을 단위 구면에 고르게 분포시키는 것이 가능하다. 전술한 바와 같이, 결과는 1°에서 180°까지 x(예컨대 x=1...5 또는 x=10, 20 등)도씩 단계적으로 증가하는 경사각 θ와 1°에서 360°까지의 방위각 φ를 가진 구면 그리드일 수 있으며, 각 소스 방향 Ω=(θ,φ)는 방위각 φ와 경사각 θ로 주어질 수 있다.
듣기 평가에서 양호한 효과가 확인되었다. 단일 소스의 로컬라이제이션의 평가를 위해, 가상 소스가 기준으로서의 실제 소스와 비교된다. 실제 소스에 대해서는, 원하는 위치에 있는 확성기가 사용된다. 사용된 재생 방법은 VBAP, 앰비소닉스 모드 매칭 디코딩, 그리고, 본 발명에 따라 VBAP 패닝 함수를 이용하는 새로이 제시된 앰비소닉스 디코딩이다. 후자의 2가지 방법에 있어서는 각 평가 위치와 각 평가 입력 신호에 대해 3차(third order)의 앰비소닉스 신호가 생성된다. 그 후, 이 합성 앰비소닉스 신호는 대응하는 디코딩 행렬을 이용하여 디코딩된다. 사용된 평가 신호는 광대역 핑크 노이즈와 남성 음성 신호이다. 평가 위치는 다음과 같은 방향을 가진 정면 영역에 위치한다.
Figure pat00033
듣기 평가는 대략 0.2초의 평균 잔향 시간을 가진 음향실에서 실시되었다. 이 듣기 평가에는 9명의 사람이 참여했다. 평가 대상자에게 기준과 비교한 모든 재생 방법의 공간 재생 성능에 등급을 매기도록 하였다. 단일 등급값은 가상 소스의 로컬라이제이션과 음색 변화를 나타내는 것이어야 했다. 도 5는 듣기 평가의 결과를 보여준다.
결과가 보여주듯이, 비규칙화 앰비소닉스 모드 매칭 디코딩은 평가한 다른 방법보다 지각적으로 더 나쁜 등급이 매겨져 있다. 이 결과는 도 3에 대응한다. 앰비소닉스 모드 매칭 방법은 이 듣기 평가에서 앵커(anchor) 역할을 한다. 다른 이점은 잡음 신호에 대한 신뢰 구간이 다른 방법에서보다 VBAP에서 더 크다는 것이다. 평균값은 VBAP 패닝 함수를 이용한 앰비소닉스 디코딩에서 최고치를 보여준다. 따라서, 이용된 앰비소닉스 차수로 인해 공간 분해능이 감소되기는 하나, 이 방법은 파라메트릭 VBAP 방식에 비해 이점을 보여준다. VBAP에 비해, 강건 패닝 함수와 VBAP 패닝 함수를 가진 양쪽 앰비소닉스 디코딩은 가상 소스를 렌더링하는 데 3개의 확성기만 사용되는 것은 아니라는 이점을 갖고 있다. VBAP에서는, 가상 소스 위치가 확성기의 물리적 위치들 중 하나에 가까이 있다면 단일 확성기들이 우세할 수 있다. 대부분의 평가 대상자들은 직접 적용 VBAP에서보다는 앰비소닉스 구동 VBAP에서 음색 변화가 적었다고 했다. VBAP에서의 음색 변화 문제는 Pulkki에서 이미 알려져 있다. VBAP와는 달리, 상기 새로이 제시된 방법은 가상 소스의 재생을 위해 3개 초과의 확성기를 사용하지만 놀랍게도 음색 변화가 더 적다.
결론으로서, VBAP 패닝 함수로부터 앰비소닉스 디코딩 행렬을 얻는 새로운 방법이 개시된다. 이 방법은 여러 가지 서로 다른 확성기 설정에 있어서는 모드 매칭 방식의 행렬에 비해 유리하다. 이들 디코딩 행렬의 특성과 결과에 대해서는 전술하였다. 요약하면, VBAP 패닝 함수를 이용한 새로이 제시된 앰비소닉스 디코딩은 공지의 모드 매칭 방법의 통상적인 문제를 방지한다. 듣기 평가는 VBAP 도출 앰비소닉스 디코딩이 VBAP의 직접적인 이용보다도 공간 재생 품질이 더 양호할 수 있다는 것을 보여주었다. VBAP는 렌더링될 가상 소스의 파라메트릭 기술(description)을 필요로 하지만, 이 제시된 방법은 사운드필드 기술만을 필요로 한다.
지금까지 바람직한 실시예에 적용된 본 발명의 기본적이고 신규한 특징들을 도시하고, 설명하고, 지적하였지만, 당업자라면 본 발명의 본질로부터 벗어남이 없이, 설명된 장치와 방법, 개시된 디바이스의 형태와 세부 사항, 그리고 그들의 동작에 있어 여러 가지 생략, 치환, 및 수정이 가능함을 잘 알 것이다. 동일한 결과를 달성하기 위해 실질적으로 동일한 기능을 실질적으로 동일한 방식으로 수행하는 구성요소들의 모든 조합이 본 발명의 범위 내에 속하는 것이다. 설명된 실시예들 간의 구성요소 치환도 충분히 의도하고 고려할 수 있다. 본 발명의 범위로부터 벗어남이 없이 세부 사항의 변경이 가능함을 알아야 한다. 상세한 설명 및 (적당한 경우) 청구범위 및 도면에 개시된 각 특징은 서로 독립적으로 또는 임의의 적당한 조합으로 제공될 수 있다. 특징들은 적당한 경우 하드웨어, 소프트웨어, 또는 이 둘의 조합으로 구현될 수 있다. 청구범위에 나타난 도면부호는 단지 예시적인 것이며 청구범위를 한정하는 것이 아니다.

Claims (13)

  1. 복수의 확성기를 통한 재생을 위하여 앰비소닉스(ambisonics) 오디오 사운드필드 표현을 디코딩하는 방법에 있어서,
    복수의 확성기 각각에 대하여, 상기 확성기들의 위치들과 복수의 소스 방향에 기초한 기하학적 방법을 사용하여 패닝 함수(panning function)를 획득하는 단계;
    상기 소스 방향들로부터 모드 행렬(mode matrix)과, 상기 앰비소닉스 오디오 사운드필드 표현의 차수(order)를 획득하는 단계;
    상기 모드 행렬로부터 베이스 행렬을 획득하는 단계; 및
    상기 앰비소닉스 오디오 사운드필드 표현을 디코딩 행렬로 디코딩하는 단계 - 상기 디코딩 행렬은 상기 패닝 함수 및 상기 베이스 행렬에 기초하고, 상기 소스 방향들은 단위 구면에 고르게 분포되고, 상기 소스 방향들의 수는 S이고, 상기 앰비소닉스 오디오 사운드필드 표현의 상기 차수는 N이고, S≥(N+1)2임 -
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 패닝 함수를 획득하는 단계에서 사용되는 상기 기하학적 방법은 벡터 베이스 진폭 패닝(VBAP; Vector Base Amplitude Panning)에 기초하는, 방법.
  3. 제1항에 있어서,
    상기 앰비소닉스 오디오 사운드필드 표현은 적어도 제2 차수인, 방법.
  4. 제1항에 있어서,
    상기 베이스 행렬은 상기 모드 행렬 및 전치 행렬의 곱에 기초하는, 방법.
  5. 제1항에 있어서,
    상기 패닝 함수는 행렬로서 표현되고, 상기 베이스 행렬은 상기 모드 행렬의 규칙화(regularization)인, 방법.
  6. 제1항에 있어서,
    상기 패닝 함수는 이득값들로서 표현되는, 방법.
  7. 복수의 확성기를 통한 재생을 위하여 앰비소닉스 오디오 사운드필드 표현을 디코딩하기 위한 장치로서,
    복수의 확성기 각각에 대하여, 상기 확성기들의 위치들과 복수의 소스 방향에 기초한 기하학적 방법을 사용하여 패닝 함수를 획득하기 위한 수단;
    상기 소스 방향들로부터 모드 행렬과, 상기 앰비소닉스 오디오 사운드필드 표현의 차수를 획득하기 위한 수단;
    상기 모드 행렬로부터 베이스 행렬을 획득하기 위한 수단; 및
    상기 앰비소닉스 오디오 사운드필드 표현을 디코딩 행렬로 디코딩하기 위한 수단 - 상기 디코딩 행렬은 상기 패닝 함수 및 상기 베이스 행렬에 기초하고, 상기 소스 방향들은 단위 구면에 고르게 분포되고, 상기 소스 방향들의 수는 S이고, 상기 앰비소닉스 오디오 사운드필드 표현의 상기 차수는 N이고, S≥(N+1)2임 -
    을 포함하는 장치.
  8. 제7항에 있어서,
    상기 패닝 함수를 획득하는 데 사용되는 상기 기하학적 방법은 벡터 베이스 진폭 패닝(VBAP)에 기초하는, 장치.
  9. 제7항에 있어서,
    상기 앰비소닉스 오디오 사운드필드 표현은 적어도 제2 차수인, 장치.
  10. 제7항에 있어서,
    상기 베이스 행렬은 상기 모드 행렬 및 전치 행렬의 곱에 기초하는, 장치.
  11. 제7항에 있어서,
    상기 패닝 함수는 행렬로서 표현되고, 상기 베이스 행렬은 상기 모드 행렬의 규칙화인, 장치.
  12. 제7항에 있어서,
    상기 패닝 함수는 이득값들로서 표현되는, 장치.
  13. 컴퓨터로 하여금, 오디오 재생을 위하여 앰비소닉스 오디오 사운드필드 표현을 디코딩하는 방법을 수행하도록 하는 실행가능한 명령어들을 저장하는 컴퓨터 판독가능 매체로서,
    상기 방법은,
    복수의 확성기 각각에 대하여, 상기 확성기들의 위치들과 복수의 소스 방향에 기초한 기하학적 방법을 사용하여 패닝 함수(panning function)를 획득하는 단계;
    상기 소스 방향들로부터 모드 행렬과, 상기 앰비소닉스 오디오 사운드필드 표현의 차수(order)를 획득하는 단계;
    상기 모드 행렬로부터 베이스 행렬을 획득하는 단계; 및
    상기 앰비소닉스 오디오 사운드필드 표현을 디코딩 행렬로 디코딩하는 단계 - 상기 디코딩 행렬은 상기 패닝 함수 및 상기 베이스 행렬에 기초하고, 상기 소스 방향들은 단위 구면에 고르게 분포되고, 상기 소스 방향들의 수는 S이고, 상기 앰비소닉스 오디오 사운드필드 표현의 상기 차수는 N이고, S≥(N+1)2임 -
    를 포함하는, 컴퓨터 판독가능 매체.
KR1020177018317A 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 KR101795015B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10305316 2010-03-26
EP10305316.1 2010-03-26
PCT/EP2011/054644 WO2011117399A1 (en) 2010-03-26 2011-03-25 Method and device for decoding an audio soundfield representation for audio playback

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020127025099A Division KR101755531B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020177031814A Division KR101890229B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20170084335A true KR20170084335A (ko) 2017-07-19
KR101795015B1 KR101795015B1 (ko) 2017-11-07

Family

ID=43989831

Family Applications (9)

Application Number Title Priority Date Filing Date
KR1020217026627A KR102622947B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020207008095A KR102294460B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020177031814A KR101890229B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020127025099A KR101755531B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020247000412A KR20240009530A (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197005396A KR102018824B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020187023439A KR101953279B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020177018317A KR101795015B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197025623A KR102093390B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Family Applications Before (7)

Application Number Title Priority Date Filing Date
KR1020217026627A KR102622947B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020207008095A KR102294460B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020177031814A KR101890229B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020127025099A KR101755531B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020247000412A KR20240009530A (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020197005396A KR102018824B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
KR1020187023439A KR101953279B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020197025623A KR102093390B1 (ko) 2010-03-26 2011-03-25 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치

Country Status (12)

Country Link
US (10) US9100768B2 (ko)
EP (1) EP2553947B1 (ko)
JP (8) JP5559415B2 (ko)
KR (9) KR102622947B1 (ko)
CN (1) CN102823277B (ko)
AU (1) AU2011231565B2 (ko)
BR (2) BR122020001822B1 (ko)
ES (1) ES2472456T3 (ko)
HK (1) HK1174763A1 (ko)
PL (1) PL2553947T3 (ko)
PT (1) PT2553947E (ko)
WO (1) WO2011117399A1 (ko)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT2553947E (pt) * 2010-03-26 2014-06-24 Thomson Licensing Método e dispositivo para descodificar uma representação de um campo sonoro de áudio para a reprodução de áudio
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
KR20230096147A (ko) 2011-07-01 2023-06-29 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 3d 오디오 오서링과 렌더링을 위한 시스템 및 툴들
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
EP2637427A1 (en) 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
WO2014012945A1 (en) * 2012-07-16 2014-01-23 Thomson Licensing Method and device for rendering an audio soundfield representation for audio playback
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2738962A1 (en) * 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
US9832584B2 (en) * 2013-01-16 2017-11-28 Dolby Laboratories Licensing Corporation Method for measuring HOA loudness level and device for measuring HOA loudness level
US9736609B2 (en) 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
CN105103569B (zh) 2013-03-28 2017-05-24 杜比实验室特许公司 使用被组织为任意n边形的网格的扬声器呈现音频
BR112015026504B1 (pt) * 2013-04-26 2021-12-21 Sony Corporation Aparelho e método de processamento de som, e, mídia legível por computador
EP2991383B1 (en) 2013-04-26 2021-01-27 Sony Corporation Audio processing device and audio processing system
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
BR112015030103B1 (pt) * 2013-05-29 2021-12-28 Qualcomm Incorporated Compressão de representações decomposta de campo sonoro
US9980074B2 (en) 2013-05-29 2018-05-22 Qualcomm Incorporated Quantization step sizes for compression of spatial components of a sound field
JP6377730B2 (ja) * 2013-06-05 2018-08-22 ドルビー・インターナショナル・アーベー オーディオ信号を符号化する方法及び装置並びにオーディオ信号を復号する方法及び装置
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP2866475A1 (en) * 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US9990934B2 (en) * 2014-01-08 2018-06-05 Dolby Laboratories Licensing Corporation Method and apparatus for improving the coding of side information required for coding a Higher Order Ambisonics representation of a sound field
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
JP6351748B2 (ja) 2014-03-21 2018-07-04 ドルビー・インターナショナル・アーベー 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置
US10412522B2 (en) * 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
JP6374980B2 (ja) 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
EP3143779B1 (en) 2014-05-13 2020-10-07 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for edge fading amplitude panning
US9847087B2 (en) * 2014-05-16 2017-12-19 Qualcomm Incorporated Higher order ambisonics signal compression
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
JP6641304B2 (ja) * 2014-06-27 2020-02-05 ドルビー・インターナショナル・アーベー 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置
US9910634B2 (en) * 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3073488A1 (en) 2015-03-24 2016-09-28 Thomson Licensing Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field
JP6437695B2 (ja) 2015-09-17 2018-12-12 ソノズ インコーポレイテッド オーディオ再生デバイスのキャリブレーションを容易にする方法
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
CN105392102B (zh) * 2015-11-30 2017-07-25 武汉大学 用于非球面扬声器阵列的三维音频信号生成方法及系统
JP6834985B2 (ja) * 2016-01-08 2021-02-24 ソニー株式会社 音声処理装置および方法、並びにプログラム
US10582329B2 (en) 2016-01-08 2020-03-03 Sony Corporation Audio processing device and method
US10595148B2 (en) 2016-01-08 2020-03-17 Sony Corporation Sound processing apparatus and method, and program
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
CN113923583A (zh) 2017-01-27 2022-01-11 奥罗技术公司 用于平移音频对象的处理方法和系统
US10861467B2 (en) 2017-03-01 2020-12-08 Dolby Laboratories Licensing Corporation Audio processing in adaptive intermediate spatial format
US10972859B2 (en) 2017-04-13 2021-04-06 Sony Corporation Signal processing apparatus and method as well as program
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
CN110771181B (zh) 2017-05-15 2021-09-28 杜比实验室特许公司 用于将空间音频格式转换为扬声器信号的方法、系统和设备
US10405126B2 (en) 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
US10674301B2 (en) * 2017-08-25 2020-06-02 Google Llc Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US12073842B2 (en) * 2019-06-24 2024-08-27 Qualcomm Incorporated Psychoacoustic audio coding of ambisonic audio data
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
CN112530445A (zh) * 2020-11-23 2021-03-19 雷欧尼斯(北京)信息技术有限公司 高阶Ambisonic音频的编解码方法及芯片
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications
CN117546236A (zh) * 2021-06-15 2024-02-09 北京字跳网络技术有限公司 音频渲染系统、方法和电子设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
CA2406926A1 (en) 2000-04-19 2001-11-01 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
JP2002218655A (ja) 2001-01-16 2002-08-02 Nippon Telegr & Teleph Corp <Ntt> 空港における給電システム
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
DE602005003342T2 (de) 2005-06-23 2008-09-11 Akg Acoustics Gmbh Methode zur Modellierung eines Mikrofons
JP4928177B2 (ja) * 2006-07-05 2012-05-09 日本放送協会 音像形成装置
DE102006053919A1 (de) * 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
EP2094032A1 (en) * 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
JP4922211B2 (ja) 2008-03-07 2012-04-25 日本放送協会 音響信号変換装置、その方法及びそのプログラム
ES2425814T3 (es) 2008-08-13 2013-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para determinar una señal de audio espacial convertida
JP2013500527A (ja) 2009-07-30 2013-01-07 オセ−テクノロジーズ・ベー・ヴエー 文書内の表の自動的な位置特定
PT2553947E (pt) 2010-03-26 2014-06-24 Thomson Licensing Método e dispositivo para descodificar uma representação de um campo sonoro de áudio para a reprodução de áudio
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
JP6589838B2 (ja) 2016-11-30 2019-10-16 カシオ計算機株式会社 動画像編集装置及び動画像編集方法

Also Published As

Publication number Publication date
KR20200033997A (ko) 2020-03-30
KR20170125138A (ko) 2017-11-13
US9767813B2 (en) 2017-09-19
US20130010971A1 (en) 2013-01-10
BR112012024528B1 (pt) 2021-05-11
US11948583B2 (en) 2024-04-02
US11217258B2 (en) 2022-01-04
US20180308498A1 (en) 2018-10-25
US20170372709A1 (en) 2017-12-28
JP6615936B2 (ja) 2019-12-04
KR101890229B1 (ko) 2018-08-21
US20190341062A1 (en) 2019-11-07
JP2021184611A (ja) 2021-12-02
US20220189492A1 (en) 2022-06-16
KR101953279B1 (ko) 2019-02-28
BR112012024528A8 (pt) 2017-12-05
EP2553947A1 (en) 2013-02-06
AU2011231565A1 (en) 2012-08-23
ES2472456T3 (es) 2014-07-01
JP7220749B2 (ja) 2023-02-10
JP2020039148A (ja) 2020-03-12
HK1174763A1 (en) 2013-06-14
JP6336558B2 (ja) 2018-06-06
BR122020001822B1 (pt) 2021-05-04
JP2013524564A (ja) 2013-06-17
KR101795015B1 (ko) 2017-11-07
US20200273470A1 (en) 2020-08-27
CN102823277A (zh) 2012-12-12
JP2023052781A (ja) 2023-04-12
JP2015159598A (ja) 2015-09-03
KR20180094144A (ko) 2018-08-22
US10629211B2 (en) 2020-04-21
AU2011231565B2 (en) 2014-08-28
US10134405B2 (en) 2018-11-20
JP6067773B2 (ja) 2017-01-25
PL2553947T3 (pl) 2014-08-29
US10522159B2 (en) 2019-12-31
JP7551795B2 (ja) 2024-09-17
JP5739041B2 (ja) 2015-06-24
US20240304195A1 (en) 2024-09-12
JP2014161122A (ja) 2014-09-04
US20190139555A1 (en) 2019-05-09
KR20130031823A (ko) 2013-03-29
JP6918896B2 (ja) 2021-08-11
KR20190104450A (ko) 2019-09-09
US20150294672A1 (en) 2015-10-15
US10037762B2 (en) 2018-07-31
CN102823277B (zh) 2015-07-15
KR102093390B1 (ko) 2020-03-25
JP2017085620A (ja) 2017-05-18
WO2011117399A1 (en) 2011-09-29
KR102622947B1 (ko) 2024-01-10
EP2553947B1 (en) 2014-05-07
JP2018137818A (ja) 2018-08-30
BR112012024528A2 (pt) 2016-09-06
US9460726B2 (en) 2016-10-04
KR101755531B1 (ko) 2017-07-07
KR102018824B1 (ko) 2019-09-05
US20170025127A1 (en) 2017-01-26
KR20240009530A (ko) 2024-01-22
PT2553947E (pt) 2014-06-24
KR20190022914A (ko) 2019-03-06
US9100768B2 (en) 2015-08-04
KR102294460B1 (ko) 2021-08-27
KR20210107165A (ko) 2021-08-31
JP5559415B2 (ja) 2014-07-23

Similar Documents

Publication Publication Date Title
KR101795015B1 (ko) 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
AU2014265108A1 (en) Method and device for decoding an audio soundfield representation for audio playback

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant