CN101160726B - 参数压缩单元和解码器以及相应的方法 - Google Patents
参数压缩单元和解码器以及相应的方法 Download PDFInfo
- Publication number
- CN101160726B CN101160726B CN2006800120933A CN200680012093A CN101160726B CN 101160726 B CN101160726 B CN 101160726B CN 2006800120933 A CN2006800120933 A CN 2006800120933A CN 200680012093 A CN200680012093 A CN 200680012093A CN 101160726 B CN101160726 B CN 101160726B
- Authority
- CN
- China
- Prior art keywords
- tuple
- parameter
- sequence
- parameter set
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006835 compression Effects 0.000 title claims description 41
- 238000007906 compression Methods 0.000 title claims description 41
- 238000000034 method Methods 0.000 title claims description 34
- 230000014509 gene expression Effects 0.000 claims description 60
- 238000010276 construction Methods 0.000 claims description 37
- 238000001228 spectrum Methods 0.000 claims description 16
- 230000011664 signaling Effects 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims 1
- 230000000576 supplementary effect Effects 0.000 description 27
- 230000003044 adaptive effect Effects 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 230000000153 supplemental effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 2
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明基于如下发现:当包括具有原始信号第一部分的表示的第一参数集和具有原始信号第二部分的表示的第二参数集的参数被布置在第一元组序列和第二元组序列中时,可进行有效的编码,其中,所述第一元组序列包括具有来自所述原始信号的单一部分的两个参数的参数元组,而所述第二元组序列包括具有来自所述原始信号第一部分的一个参数以及来自所述原始信号第二部分的一个参数的参数元组。使用比特估测器来估测对所述第一和第二元组序列进行编码所需的比特数,从而能够实现有效的编码,其中,仅对导致较少比特数的元组序列进行编码。
Description
技术领域
本发明涉及参数的无损编码,具体涉及针对有效参数压缩的编码规则的产生和使用。
背景技术
最近以来,多通道音频再现技术越来越显重要,这或许是因为如下事实:例如目前已为人熟知之mp3技术的音频压缩/编码技术,使得利用网络或者其它具有有限带宽的传输通道来分发音频记录成为可能。该mp3编码技术之所以会变的这么有名,系因为如下事实:它可以以立体声格式,亦即以包含第一或者左立体声通道以及第二或者右立体声通道的音频记录的数字表示,来分发记录。
然而,传统的二声道系统有其基本的缺点,因此,开发出环绕声技术。一种推荐的多通道环绕声表示除了包括两个立体声通道L以及R以外,还包括额外的中央通道C以及两个环绕声道Ls、Rs。该参考声音格式也称为三/二立体声,意谓其具有三个前端通道以及两个环绕声道。一般说来,五个传输通道是必须的。在重放环境中,至少需要把五个扬声器放在五个适当的位置,以获得距离该五个已经适当放置的扬声器特定距离的最佳甜美音点。
已经有许多为人熟知的技术,可以用来降低传输多通道音频信号所需要的数据量,这些技术称为联合立体声技术。为此目的,请参考第9图,其中显示了一联合立体声设备60。该设备可以是一个用来实行强度立体声(intensity stereo简写为IS)或者立体声提示编码(binauralcue coding简写为BCC)的设备。这样的一个设备通常会接收至少两个通道(CH1、CH2、…CHn)作为输入,并输出至少是单一载波通道以及参数数据。对该参数数据进行定义,使得在解码器中能够计算原始通道 (CH1、CH2、…CHn)的逼近(approximation)。
一般说来,该载波通道会包含子波段采样、频谱系数、时域采样等,如此一来可以提供基础(underlying)信号的比较良好的表示,而参数数据不包含该频谱系数的采样,但包括控制参数,以控制特定的重建算法,例如乘法加权、时间平移、频率平移、相位平移等。该参数数据因此仅包含该信号或者与其关连的通道的比较粗糙的表示。若以数字来表示,载波通道所需的数据量大约在60kbit/s至70kbit/s的范围内。而一个通道的参数辅助信息所需要的数据量典型地在1.5kbit/s至2.5kbit/s的范围内。几种为人熟知的参数数据包括:缩放因子、强度立体声信息或者立体声提示参数,如同下文所述。
举例而言,BCC技术在下列文章中有所叙述:AES convention paper5574,“Binaural Cue Coding applied to Stereo and Multi-ChannelAudio Compression”,C.Faller,F.Baumgarte,May 2002,Munich;IEEEWASPAA Paper“Efficient representation of spatial audio usingperceptual parametrization”,0ctober 2001,Mohonk,NY;“Binauralcue coding applied to audio compression with flexible rendering”,C.Faller and F.Baumgarte,AES 113th Convention,LosAngeles,Preprint 5686,October 2002;以及“Binaural cuecoding-Part II:Schemes and applications”,C.Faller和F.Baumgarte,IEEE Trans.on Speech and Audio Proc.,volumelevel.11,no.6,Nov.2003。
在BCC编码方式中,首先利用具有重迭窗口的基于离散傅立叶变换(Discrete Fourier Transform,简写为DFT)的变换将多个音频输入通道转换为频谱表示。由上述方法得到的均匀频谱被分为不重迭的部分,每一部分的频宽与等效矩形带宽(Equivalent Rectangular Bandwidth,简写为ERB)近似成正比。然后针对每一部分,在两个通道之间进行BCC参数的估测。一般说来,每个通道的BCC参数都相对于参考通道而给出,并且进一步被量化。该传输参数最后再根据指定的方程式(已编码的)进行计算,其也可能依赖于待处理的信号的特定部分。
多个BCC参数确实存在。举例而言,ICLD参数用来描述两个相比 较的通道所包含能量的差(比值)。通道间相干性/相关性(inter-channel coherence/correlation,简写为ICC)参数用来描述两个通道之间的相关性,其可以理解为两个通道波形的相似性。通道间时间差(inter-channel time difference,简写为ICTD)参数用来描述两个通道之间的全局时移,而通道间相位差(inter-channel phasedifference,简写为IPD)参数则是用来描述信号之间相位的差。
应当注意的是,在音频信号的框架式处理(frame-wiseprocessing)中,BCC分析也以框架式执行,也就是时变的,而且还以频率式(frequency-wise)而执行。这意味着,对于每一个频谱波段,分别获得BCC参数。这还意味着,如果用声音滤波器组(bank)将输入信号分解为例如32个带通信号,则BCC分析块获得针对此32个波段中每一个的BCC参数组。
一种相关的技术,也就是所谓的参数立体声,在下列文章中有所描述:J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers“High-Quality Parametric Spatial Audio Coding at Low Bitrates”,AES 116thConvention,Berlin,Preprint 6072,May 2004;以及E.Schuijers,J.Breebaart,H.Purnhagen,J.Engdegard,“LowComplexity Parametric Stereo Coding”,AES116thConvention,Berlin,Preprint 6073,May 2004。
总括来说,多通道音频信号参数编码的新近方法(空间音频编码以及立体声提示编码等),是借助下混合(downmix)信号(可以是单通道的,或者包括若干通道)以及参数辅助信息(空间提示)来表示多通道音频信号,所述参数辅助信息描述了感知的空间声基宽(sound stage)的特征。通常希望将辅助信息的数据率维持的尽可能低,以便将额外开销信息降至最低,并且为下混合信号的编码留出尽可能多的可用传输容量。
一种使辅助信息的比特率保持为低的方法是,例如通过向辅助信息应用熵编码算法,对空间音频方案的辅助信息进行无损编码。
无损编码已经广泛用于一般的音频编码中,以确保量化的频谱系数和辅助信息的最佳紧密表示。适当的编码方案与方法的例子可以在ISO/IEC标准MPEG1第3部分、MPEG2第7部分以及MPEG4第3部分中 找到。
这些标准以及,例如IEEE paper“Noiseless Coding of QuantizedSpectral Coefficients in MPEG-2 Advanced Audio Coding”S.R.Quackenbush,J.D.Johnston,IEEE WASPAA,Mohonk,NY,October 1997描述了现有技术状态中的技术,包含以如下手段对量化的参数进行无损编码:
●量化频谱系数的多维霍夫曼(Huffman)编码
●针对系数组,使用公共(多维)霍夫曼码本
●将值编码为一个孔(hole),或者将符号信息以及数量信息分别进行编码(即针对给定的绝对值仅具有霍夫曼码本条目,这减小了所需码本的大小,“带符号的”与“无符号的”码本的比较)
●使用具有不同的最大绝对值的替代码本,亦即在待编码的参数中具有不同的最大绝对值
●针对每一个LAV,使用具有不同统计分布的替代码本
●以辅助信息的方式把霍夫曼码本的选择发送至解码器
●使用“分区”(sections)来定义每一个所选霍夫曼码本的应用范围
●频率缩放因子的差分编码,以及随后对结果进行霍夫曼编码
在MPEG1音频标准中,提出另一种将粗略量化值以无损的方式编码为单一PCM码的技术(在该标准内被称作分组(grouping),并且用于第2层),这在ISO/IEC标准11172-3:93中有更详细的解释。
出版物“Binaural cue coding-Part II:Schemes andapplications”,C.Faller与F.Baumgarte,IEEE Trans.on Speechand Audio Proc.,volume level.11,no.6,Nov.2003提到一些有关BCC参数编码的信息.其提出以如下方式对量化的ICLD参数进行差分编码:
●在频率上进行差分编码,而且随后对结果进行霍夫曼编码(使用一维霍夫曼码)
●在时间上进行差分编码,而且随后对结果进行霍夫曼编码(使用一维霍夫曼码)
最后,选择更有效率的变体(variant)作为原始音频信号的表示。
Bosi M.等:“ISO/IEC MPEG-2Advanced audio coding”Journalof the Audio Engineering Society,voi.45,no.10,pages 789-812提出了在参数的霍夫曼编码前进行分组和交织。
美国专利US 5,528,628涉及使用多个变长码表对输入符号进行变长编码。使用不同的变长编码器或具有不同码表的霍夫曼编码器对相同的符号序列进行编码。取决于所产生的码长,最终决定待传送的编码表示。
欧洲专利申请1047198A3提出了一种类似的方法,额外仅使用绝对值码本。
Shen-Chuan Tai等:“An adaptive 3-D discrete cosine transformcoder for medical image compression”IEEE Transactions onInformation Technology in Biomedicine,vol.4,no.3,pages 259-263提出了一种使用编码算法对二维图像数据进行编码的方法,发展为对三维信息进行编码。在所提出的方法中,使用基于局部能量值的分割技术把图像子块分割为不同的能量级。然后,把具有相同能量级的子块组合在一起,以形成三维立方体。然后,采用3-DCT对三维立方体单独进行压缩。
Faller C等:“Binaural Cue Coding-Part II:Schemes andApplications”,IEEE Transactions on Speech and AudioProcessing,Vol.11,no.6,6 October 2003,pages 520-531提出在霍夫曼编码前在时间和频率方向上进行差分编码。最终,该差分表示导致选择较低的比特率。
如同前面所提到的,已经提出通过在频率上(以及可选地在时间上)进行差分编码、然后选择更有效率的变体而对压缩性能进行优化。然后,通过一些辅助信息将所选变体发信号通知(signal)给解码器。
已经做出大量努力以减小下混合音频信号及相应辅助信息的大小。然而,可实现的比特率仍旧过高,以致不能实现每种可能的应用。例如,针对移动电话的音频和视频内容的流需要最小可能的比特率,因而需要更有效率的内容编码。
发明内容
本发明的目的是提供一种改进的编码概念,能够以更高的效率对参数值进行无损压缩。
根据本发明的第一方面,该目的通过一种用于参数压缩的压缩单元而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述压缩单元包括:供给器,用于供给第一元组和第二元组,每个元组具有至少两个参数,第一元组具有来自第一参数集的两个参数,而第二元组具有来自第一参数集的一个参数以及来自第二参数集的一个参数;比特估测器,基于编码规则来估测使用包括第一元组的第一元组序列对参数集进行编码所需的比特数,以及使用包括第二元组的第二元组序列对参数集进行编码所需的比特数;以及提供器,用于提供编码块,所述提供器可以使用导致较少比特数的元组序列来提供所述编码块,并提供指示从中导出所述编码块的元组序列的序列指示。
根据本发明的第二方面,该目的通过一种用于对编码参数块进行解码并用于处理序列指示的解码器而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述解码器包括:解压缩器,所述解压缩器可使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,每一个元组具有至少两个参数;以及帧建构器,用于接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列,而且所述帧建构器还用于使用所用元组序列的信息来建构所述参数集。
根据本发明的第三方面,该目的通过一种用于参数压缩的方法而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻。
根据本发明的第四方面,该目的通过一种当在计算机上运行时执行如上方法的计算机程序而实现。
根据本发明的第五方面,该目的通过一种用于对编码参数块进行解码并用于处理序列指示的方法而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻。
根据本发明的第六方面,该目的通过一种当在计算机上运行时执行如上方法的计算机程序而实现。
根据本发明的第七方面,该目的通过一种参数的压缩表示而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述参数的压缩表示包括:表示所用元组序列的编码参数块;以及序列指示,所述序列指示指示所述编码参数块所基于的第一或第二序列中的所用元组序列,其中第一序列包括具有来自第一参数集的两个参数的第一元组,而第二序列包括具有来自第一参数集的一个参数和来自第二参数集的一个参数的第二元组。
本发明基于如下发现:当包括具有原始信号第一部分的表示的第一参数集和具有原始信号第二部分的表示的第二参数集的参数被布置在第一元组序列和第二元组序列中时,可进行有效的编码,其中,所述第一元组序列包括具有来自所述原始信号的单一部分的两个参数的参数元组,而所述第二元组序列包括具有来自所述原始信号第一部分 的一个参数以及来自所述原始信号第二部分的一个参数的参数元组。使用比特估测器来估测对所述第一和第二元组序列进行编码所需的比特数,从而能够实现有效的编码,其中,仅对导致较少比特数的元组序列进行编码。
因此,基本原理是,例如在时间和频率上对待编码的参数进行重新排列,并最终使用一种参数排列(元组序列)进行压缩,该排列导致压缩参数具有较少比特数。
在本发明的一个实施例中,以具有两个参数的对的形式,把描述原始信号两个连续时间部分的频谱表示的两个频谱参数集进行自适应分组,以提高编码效率。因此,一方面使用包括来自相同时间部分的两个相邻频率参数的参数元组而产生元组序列。另一方面,使用利用来自原始信号第一时间部分的第一参数和来自原始信号第二时间部分的相应参数而建构的元组而产生第二元组序列。然后,使用二维霍夫曼码对两个元组序列进行编码。比较两个编码后的元组序列的大小,并最终选择导致较少比特数的元组进行传送。与使用哪种元组建构编码数据有关的信息作为附加的辅助信息被传送至解码器。
先前描述的本发明的解码器的一个优点是,由于把参数分组为包括两个参数的元组,因而可以把二维霍夫曼码用于压缩,这通常会导致较低的比特率。
第二个优点是,自适应分组(即在编码过程中动态地在两种可能的分组策略中进行抉择的概念)进一步减小了辅助信息的比特率。
针对具有两个连续帧的集合,在两种分组策略之间仅做出一次抉择,这会额外地减小所需的辅助信息量,因为针对具有两个完整连续时帧的集合仅需传送一次指示,该指示指示出编码期间所使用的分组策略。
在本发明的其他实施例中,一种本发明的压缩单元额外包括差分编码器,所述差分编码器在自适应分组前在时间或频率上对参数进行差分编码。该差分编码和自适应分组以及适当的霍夫曼码本进一步减小了待传送的辅助信息的大小。两种差分编码的可能与两种分组策略导致了总共4种可能的组合,进一步增大了查找编码规则的概率,其 导致低辅助信息比特率。
在本发明的其他实施例中,本发明的概念用于解压缩单元,允许对编码参数块进行解码,并基于辅助信息而重建原始帧,所述辅助信息表明了编码参数块所基于的分组方案。在有利修改中,本发明的解码器还允许对没有进行自适应分组的数据进行解码,因而能够实现本发明的解码器与现有装置的兼容性。
附图说明
下文参考附图来描述本发明的优选实施例,其中:
图1示出了本发明的压缩单元;
图2示出了对参数进行自适应分组的两种可能;
图3示出了对参数进行自适应分组的一些额外的可能;
图4示出了不同的编码方案;
图5示出了本发明的解码器;
图6示出了现有技术的多通道编码器。
具体实施方式
图1示出了本发明的压缩单元90,包括供给器100、比特估测器102和提供器104。
供给器100在两个数据输出端供给具有元组106a的第一序列和具有元组106b的第二序列。提供器104在其两个数据输入端108a和108b上接收元组106a和106b。比特估测器在其数据输入端110a和110b上接收两个元组。
比特估测器102估测通过向两元组106a和106b施加编码规则而导致的比特数。比特估测器102选择导致较少比特数的元组,并通过信令输出112a发信号(signal)表明是元组106a还是106b将导致较少的比特数。
基于比特估测器102的决定,最终把导致较少比特数的元组编码为编码块118,经提供器104的输出端120a而提供,其中,该提供器还在其信令线路120b上发出序列指示的信号,其指示对哪个元组 (106a或106b)的原始序列进行编码而导出编码块118。
在备选实施例中,当省略供给器100和提供器104之间的虚线连接122a和122b时,可实现相同的功能。在该备选方案中,比特估测器102会把元组106a和106b的序列进行编码,且会把两个不同的编码块124a和124b传送至提供器104,其中,提供器额外地发出信号,以表明编码块124a和124b从元组106a和106b的原始序列中的哪个序列导出。对此,可以使用比特估测器102的信令输出端112a,或该信令可由提供器104隐式地导出。
在该备选实施例中,提供器104仅把具有较少比特数的编码块转送至其输出端120a,并附带地提供序列指示。
图2示出了用于导出待编码元组序列的两种自适应分组方案的示例。为了解释本发明的自适应分组的原理,示出了原始信号中的4个后续(subsequent)时帧130a至130d,其中每一个帧具有包括5个频谱参数132a至132e的集合。
根据本发明,两个连续帧的频谱参数要么在频率上进行分组(如元组134a和134b所示),要么在时间上进行分组(如元组136a和136b所示),从而建构元组序列。时间上的分组导致第一元组序列138,而频率上的分组导致第二元组序列140。
例如,使用霍夫曼码本对元组序列138和140进行编码,形成两个不同的码字序列142和144。根据本发明,最终把需要较少比特数的码字序列传输至解码器,该解码器必须额外地接收序列指示,该指示表明码字序列的基础是时间分组还是频率分组。从图2中可以看出,对于所示出的参数对(二维)自适应分组的示例,该序列指示可以仅包含1个单一比特。
图3示出了可用于实现本发明的自适应分组的一些备选的分组策略,其允许大于二维的霍夫曼码。
图3示出了二维霍夫曼码146a、三维霍夫曼码146b和四维霍夫曼码146c的分组策略。对于每一种策略,示出了两个连续的时帧,其中,相同的大写字母代表属于相同元组的参数。
图2已经示出了二维霍夫曼码情况下的分组,在频率和时间上建构二维元组148a和148b。在建构包括3个参数的元组的情况下,频率元组158a是这样的元组:一帧内的三个相邻频率参数被分组到一起以形成元组。以如下方式建构时间元组150b:来自一帧的两个相邻参数与来自另一帧的一个参数进行组合,如图3所示。
通过把一个帧的四个相邻参数分组为一个元组,与其他频率元组相对应地建构四维频率分组元组152a。以如下方式建构时间分组元组152b:把一帧的两个相邻参数与另一帧的两个相邻参数进行组合,其中单一帧的参数对描述两个连续时帧的相同频谱特性。
如图3中所示,允许不同的分组方案可明显降低辅助信息的比特率,例如,如果使用具有不同维度的多个预定霍夫曼码本,可在编码过程中改变分组的维度,使得在编码过程中的任意时间都可使用导致最低比特率的表示。
图4示出了如何通过在霍夫曼编码过程前应用一些差分编码,从而使用本发明的压缩单元(额外地包括差分编码器)进一步减少辅助信息。
为了说明时间和频率上的差分编码,使用已经在图2中示出的参数的相同的绝对表示160作为各种差分编码步骤的基础。第一种可能是,在频率上对参数的绝对表示160进行差分编码,形成差分编码参数162。从图4中可以看到,为了对绝对表示160进行差分编码,使每个时帧的第一参数不变,而第二参数则被绝对表示160的第二参数与第一参数的差而取代。依照相同规则建构差分编码表示内的其它参数。
另一种可能是时间上的差分编码,产生表示164。从图4中可以看出,该表示以如下方式建构:使整个第一帧不变,而随后的帧的参数被绝对表示的参数与先前帧的相同参数之差而取代。
第三种可能是,先在频率上进行差分编码,然后在时间上进行差分编码,或者相反,两种情况下均形成在时间和频率上进行差分编码的相同的编码表示166。
要注意的是,有机会使用原始信号的这4种不同的表示作为自适应分组的输入。看一看给定参数示例的不同表示160至166,能清楚地看出差分编码怎样对辅助信息的传输率产生影响。看一看绝对表示160,可以看出时间上的分组和频率上的分组均不会形成具有相同内容的元组。因此,无法建构向最频繁出现的元组分配最短码字的合适的霍夫曼码本。
情况不同的是,看一看频率上的差分编码表示162,可以建构只需具有4个条目以覆盖全部表示的霍夫曼码本,而且会向元组(1,1)或元组(2,2)分配最小长度的码字,从而实现紧密的辅助信息。
该优点在时间上的差分编码表示164中较不明显。然而,此处亦能得到频率上的分组并利用多个元组(5,5)和(10,10)。
对于时间和频率上的差分编码表示166来说,甚至可能实现比表示162中更小的辅助信息比特率,这是因为时间上的分组会形成高重复性(multiplicity)的元组(1,0),如图中所示,而这允许建构向先前元组分配最短码字的霍夫曼码本。
从图4中可以清楚地看到,利用自适应分组和差分编码的本发明概念的高灵活性允许选择最为适合原始音频信号的策略,因而允许保持辅助信息比特率为低。
总之,在一个优选实施例中,对量化参数值首先在时间上进行差分编码(变体1),并在频率上进行差分编码(变体2)。然后,把形成的参数在时间上(变体a)和频率上(变体b)进行自适应分组。结果,产生四种可能的组合(1a、1b、2a、2b),从中选取最佳者并发信号通知解码器。这可以由仅为2比特的信息来完成,例如比特组合00、01、10、11表示变体1a、1b、2a、2b。
图5示出了根据本发明的解码器,用于对编码参数块进行解码,其中,该参数块包括具有第一频谱参数集的第一帧以及具有第二频谱参数集的第二帧。
解码器200包括解压缩器202与帧建构器204。解压缩器在输入端上接收编码参数块206。解压缩器使用解码规则从编码参数块206中导出参数元组序列208。该参数元组序列208被输入帧建构器204。
帧建构器额外地接收序列指示210,其指示编码器使用哪个元组序列来建构编码参数块。
然后,帧建构器204对序列指示210所指引的元组序列208进行重新排列,从参数元组序列208中重建第一帧112a和第二帧112b。
上文所述的本发明的优选实施例通过向待使用多维霍夫曼码进行编码的数值引入自适应分组,进一步提高了编码效率。做为示例,可进行频率上的二维数值分组以及时间上的二维数值分组。然后,编码方案会进行两种类型的编码,并选择更有利的一种(即需要较少比特的变体)。该决策通过辅助信息而发信号通知给解码器。
如图3中所示,在其他示例中,还可以建构更高维度的霍夫曼码,应用不同的分组策略以建构元组。假定的示例示出了通过仅把来自两个连续帧的参数分组到一起以建构元组的分组策略。还可能使用来自三个或更多个连续帧的参数而进行分组,以直接方式(straightforward way)进行分组。
在本发明的编码器的修改中,还可能使用不同的霍夫曼码本,把差分分组和差分编码策略进行组合,以导出辅助信息的最短可能表示。这可以进一步减小编码音频信号的辅助信息比特率,其代价是需要额外的辅助信息参数,发信号通知用于编码的霍夫曼码本。
所述的本发明优选实施例以示例的方式示出了本发明的概念,其中分组策略在两个连续时帧内不发生变化。在本发明的修改中,当然还可能使两个帧的集合内的时间和频率上的分组之间存在多个变化,这意味着帧内还提供序列指示,以发信号通知分组策略的变化。
在给定的示例中,在霍夫曼编码前对该参数进行差分编码。当然,在参数的霍夫曼编码前还可以使用每种其它的无损编码规则,该编码的目标是导出尽可能多的相同内容的元组。
图4中给出了4种不同的可能的参数表示,即绝对表示、频率上的差分表示、时间上的差分表示以及时间和频率上的差分表示。为了在4个表示中进行选择,如图4所示,发信号通知使用哪个表示的辅助信息在大小上必须至少为2个比特。为了平衡可能获得的编码效率与附加的频谱表示指示的关系,在原理上当然还可以决定仅允许两种可能的表示,把频谱表示指示的长度减小至单一比特。
作为本发明解码器的示例,图5示出了除接收编码参数块206之 外还接收某些辅助信息的解码器200。在给定的示例中,指引帧建构器204的辅助信息仅包括序列指示210。根据本发明的解码器当然可以处理所需的任意其它辅助信息,特别是频谱表示指示,其指示已被用于对原始帧进行编码的频谱表示。
取决于本发明的方法的特定实现要求,本发明的方法可以以硬件或者软件实现。该实现可以使用数字储存媒介来执行,特别是其上存储有电可读控制信号的盘、DVD或CD,其与可编程计算机系统一同操作,从而执行本发明的方法。因此大体上说,本发明是在机器可读载体上存储有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可以用于执行本发明的方法。换句话说,本发明的方法是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,该程序代码可用于执行本发明的方法中至少一种方法。
虽然在上文中参考特定实施例进行了特定的示出与描述,本领域的技术人员可以理解,在不背离本发明的精神和范围的前提下,可以在形式和细节上做出各种其他的改变。应当理解的是,在不背离这里所公开的以及由所附权利要求所包括的更宽的概念的前提下,可做出各种改变以适应不同的实施例。
Claims (29)
1.一种用于参数压缩的压缩单元,所述参数包括表示原始信号第一部分的第一参数集,所述参数还包括表示原始信号第二部分的第二参数集,所述第二部分与所述第一部分相邻,所述压缩单元包括:
供给器,供给第一元组序列,该元组序列包括所述第一元组序列的第一元组和所有余下的元组,其中,所述第一元组序列的所述第一元组和所有余下的元组仅包括来自所述第一参数集或所述第二参数集的参数,以及供给第二元组序列,所述第二元组序列包括所述第二元组序列的第一元组以及所有余下的元组,其中,所述第二元组序列的所述第一元组和所有余下的元组包括来自所述第一参数集的至少一个参数和来自所述第二参数集的至少一个参数,其中,所述第一部分是频率范围或时帧,以及所述第二部分是频率范围或时帧;
比特估测器,基于编码规则,使用第一元组序列来估测对所述第一参数集和所述第二参数集进行编码所需的比特数,以及基于所述编码规则,使用第二元组序列来估测对所述第一参数集和所述第二参数集进行编码所需的比特数;以及
提供器,用于提供编码块,所述提供器使用由所述比特估测器确定的导致较少比特数的元组序列来提供所述编码块,并提供针对一个编码块的单一序列指示,该单一序列指示指示了从哪个元组序列导出所述编码块。
2.如权利要求1所述的压缩单元,其中,第一参数集包括原始信号的第一部分的频谱表示,以及第二参数集包括原始信号的第二部分的频谱表示。
3.如权利要求1所述的压缩单元,其中,原始信号的第一部分和第二部分在时间或空间上相邻。
4.如权利要求1所述的压缩单元,其中,第一参数集包括原始音频或视频信号的第一帧的表示,而第二参数集包括原始音频或视频信号的第二帧的表示。
5.如权利要求1所述的压缩单元,其中,所述供给器供给:
由来自第一参数集或第二参数集的两个参数所组成的第一元组序列的第一元组,所述两个参数是原始信号的表示内的相邻参数;以及
由来自第一参数集的第一参数和来自第二参数集的第二参数所组成的第二元组序列的第二元组,所述第一参数和所述第二参数描述了所述表示中的原始信号的相同特性。
6.如权利要求1所述的压缩单元,其中,所述供给器供给:
第一元组序列的第一元组,由整数倍个数的来自第一参数集或第二参数集的两个参数组成,所述参数是原始信号的表示内的相邻参数;以及
第二元组序列的第二元组,由来自第一参数集的两个或更多个参数以及来自第二参数集的相同个数的参数组成,所述参数在原始信号的表示内相邻,来自第一参数集和第二参数集的参数描述了所述表示内的原始信号的相同特性。
7.如权利要求1所述的压缩单元,其中,所述供给器供给:
第一元组序列的第一元组,由来自一个参数集的原始信号的表示的奇数个相邻参数组成;以及
第二元组序列的第二元组,由大部分来自一个参数集的原始信号表示的相邻参数以及小部分来自另一参数集的原始信号的表示的相邻参数组成,对于第二元组序列的连续元组,所述大部分参数从第一和第二参数集中交替获取。
8.如权利要求1所述的压缩单元,
其中,所述比特估测器使用编码规则,对第一元组序列进行编码以导出第一编码块,对第二元组序列进行编码以导出第二编码块,并通过对第一和第二编码块的比特进行计数来估测所需比特数;以及
所述提供器转送第一或第二编码块,其选择具有较少比特数的块。
9.如权利要求1所述的压缩单元,
其中,所述提供器对元组序列进行编码,提供具有较少比特数的编码块。
10.如权利要求1所述的压缩单元,其中,所述参数集包括视频信号或音频信号的参数表示。
11.如权利要求1所述的压缩单元,其中,所述编码规则为:对长度相同但参数不同的元组进行编码会导致具有不同长度的码字。
12.如权利要求1所述的压缩单元,其中,所述参数包括描述第一和第二原始音频通道之间的空间相互关系的BCC参数,而且该BCC参数从如下BCC参数列表中选择:
通道间相干性/相关性(ICC)
通道间电平差(ICLD)
通道间时间差(ICTD)
通道间相位差(IPD)。
13.如权利要求1所述的压缩单元,还包括差分编码器,所述差分编码器用于处理原始信号,使得第一参数集和第二参数集包括参数的差别表示,所述差别是时间、频率或时间和频率上的差别。
14.如权利要求13所述的压缩单元,
其中,所述供给器供给第一元组序列和第二元组序列,所述元组序列内的元组具有来自如下表示中的一种表示的参数:
时间上的差分表示、频率上的差分表示、时间和频率上的差分表示以及绝对表示,
第一元组序列的元组仅具有来自第一参数集的两个参数,且述第一元组序列包括所述第一元组序列的第一元组和所有余下的元组,而第二元组序列仅具有来自第一参数集的一个参数和来自第二参数集的一个参数,且所述第二元组序列包括所述第二元组序列的第二元组和所有余下的元组;以及
所述比特估测器估测对至少八个元组序列的元组序列进行编码所需的比特数,每一个序列具有元组序列中的一个元组;以及
除了所述序列指示以外,所述提供器发信号表明表示指示,该表示指示指示了由所述比特估测器确定的导致较低比特数的表示。
15.如权利要求14所述的压缩单元,其中,所述提供器操作用于:使用具有至少三个比特的二进制数据字来发信号表明序列指示和表示指示。
16.如权利要求1所述的压缩单元,其中,所述编码规则为:每个元组具有与其相关联的不同码字分组中的单一码字。
17.如权利要求1所述的压缩单元,其中,所述编码规则包含霍夫曼码本。
18.一种用于对编码参数块进行解码并用于处理序列指示的解码器,所述参数包括表示原始信号第一部分的第一参数集,所述参数还包括表示原始信号第二部分的第二参数集,所述第二部分与所述第一部分相邻,其中,所述编码参数块是通过使用两个元组序列之一来进行编码的,第一元组序列包括所述第一元组序列的第一元组和所有余下的元组,其中,所述第一元组序列的所述第一元组和所有余下的元组仅包括来自所述第一参数集或所述第二参数集的参数,以及第二元组序列包括所述第二元组序列的第一元组以及所有余下的元组,其中,所述第二元组序列的所述第一元组和所有余下的元组包括来自所述第一参数集的至少一个参数和来自所述第二参数集的至少一个参数,以及其中所述第一部分是频率范围或时帧,以及所述第二部分是频率范围或时帧,所述解码器包括:
解压缩器,所述解压缩器使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,所述元组序列的每一个元组具有至少两个参数;以及
帧建构器,用于接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列,而且所述帧建构器还用于根据序列指示来建构所述第一参数集和所述第二参数集。
19.如权利要求18所述的解码器,其中,第一和第二参数集包括原始信号的第一和第二部分的频谱表示。
20.如权利要求18所述的解码器,其中,原始信号的第一部分和第二部分在时间或空间上相邻。
21.如权利要求18所述的解码器,其中,第一参数集包括原始音频或视频信号的第一帧的表示,而第二参数集包括原始音频或视频信号的第二帧的表示。
22.如权利要求18所述的解码器,其中,所述帧建构器接收针对一个编码参数块的单一序列指示,并使用仅包括由所述序列指示所指示类型的元组的元组序列来建构参数集。
23.如权利要求18所述的解码器,其中,所述帧建构器建构包括视频信号或音频信号的参数表示的参数集。
24.如权利要求18所述的解码器,其中,所述帧建构器建构包括BCC参数的参数集,该BCC参数描述了第一和第二音频通道之间的空间相互关系,而且该BCC参数从如下BCC参数列表中选择:
通道间相干性/相关性(ICC)
通道间电平差(ICLD)
通道间时间差(ICTD)
通道间相位差(IPD)。
25.如权利要求18所述的解码器,还包括差分解码器,所述差分解码器用于接收表示指示并对所述帧建构器获得的参数集进行处理,使得从差别表示中导出参数,所述差别是时间、频率或时间和频率上的差别,其中,所述差分解码器取决于所述表示指示而处理第一和第二参数集。
26.如权利要求25所述的解码器,其中,所述帧建构器和所述差分解码器接收序列指示和表示指示,所述序列指示和表示指示包括具有至少三个比特的二进制数据字的形式。
27.如权利要求18所述的解码器,其中,所述解码规则为:编码参数块内的每一个码字具有与其相关联的不同元组分组中的单一元组。
28.一种用于参数压缩的方法,所述参数包括表示原始信号第一部分的第一参数集,所述参数还包括表示原始信号第二部分的第二参数集,所述第二部分与所述第一部分相邻,所述方法包括:
供给第一元组序列,该元组序列包括所述第一元组序列的第一元组和所有余下的元组,其中,所述第一元组序列的所述第一元组和所有余下的元组仅包括来自所述第一参数集或所述第二参数集的参数;
供给第二元组序列,所述第二元组序列包括所述第二元组序列的第一元组以及所有余下的元组,其中,所述第二元组序列的所述第一元组和所有余下的元组包括来自所述第一参数集的至少一个参数和来自所述第二参数集的至少一个参数,
其中,所述第一部分是频率范围或时帧,以及所述第二部分是频率范围或时帧;
基于编码规则,使用第一元组序列来估测对参数集进行编码所需的比特数,
基于编码规则,使用第二元组序列来估测对参数集进行编码所需的比特数;
使用由估测步骤确定的导致较少比特数的元组序列来提供编码块;以及
提供针对一个编码块的单一序列指示,该单一序列指示指示了从哪个元组序列导出所述编码块。
29.一种用于对编码参数块进行解码并用于处理序列指示的方法,所述参数包括表示原始信号第一部分的第一参数集,所述参数还包括表示原始信号第二部分的第二参数集,所述第二部分与所述第一部分相邻,其中,所述编码参数块是通过使用两个元组序列之一来进行编码的,第一元组序列包括所述第一元组序列的第一元组和所有余下的元组,其中,所述第一元组序列的所述第一元组和所有余下的元组仅包括来自所述第一参数集或所述第二参数集的参数,以及第二元组序列包括所述第二元组序列的第一元组以及所有余下的元组,其中,所述第二元组序列的所述第一元组和所有余下的元组包括来自所述第一参数集的至少一个参数和来自所述第二参数集的至少一个参数,以及其中所述第一部分是频率范围或时帧,以及所述第二部分是频率范围或时帧,所述方法包括:
使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,所述元组序列的每一个元组具有至少两个参数;
接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列;以及
根据序列指示,建构所述第一参数集和所述第二参数集。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67099305P | 2005-04-13 | 2005-04-13 | |
US60/670,993 | 2005-04-13 | ||
US11/243,915 US7991610B2 (en) | 2005-04-13 | 2005-10-05 | Adaptive grouping of parameters for enhanced coding efficiency |
US11/243,915 | 2005-10-05 | ||
PCT/EP2006/001295 WO2006108464A1 (en) | 2005-04-13 | 2006-02-13 | Adaptive grouping of parameters for enhanced coding efficiency |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101160726A CN101160726A (zh) | 2008-04-09 |
CN101160726B true CN101160726B (zh) | 2013-05-22 |
Family
ID=36581385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800120933A Active CN101160726B (zh) | 2005-04-13 | 2006-02-13 | 参数压缩单元和解码器以及相应的方法 |
Country Status (19)
Country | Link |
---|---|
US (2) | US7991610B2 (zh) |
EP (2) | EP1869774B1 (zh) |
JP (1) | JP5027799B2 (zh) |
KR (1) | KR100954181B1 (zh) |
CN (1) | CN101160726B (zh) |
AU (1) | AU2006233512C1 (zh) |
BR (3) | BRPI0612356B1 (zh) |
CA (1) | CA2607460C (zh) |
ES (1) | ES2739531T3 (zh) |
FI (1) | FI3503409T3 (zh) |
IL (1) | IL186315A (zh) |
MX (1) | MX2007012663A (zh) |
MY (1) | MY141958A (zh) |
NO (1) | NO343207B1 (zh) |
PL (1) | PL1869774T3 (zh) |
PT (1) | PT1869774T (zh) |
RU (1) | RU2368074C2 (zh) |
TW (1) | TWI321316B (zh) |
WO (1) | WO2006108464A1 (zh) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8214220B2 (en) | 2005-05-26 | 2012-07-03 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
JP5227794B2 (ja) | 2005-06-30 | 2013-07-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
MX2008000122A (es) | 2005-06-30 | 2008-03-18 | Lg Electronics Inc | Metodo y aparato para codificar y descodificar una senal de audio. |
US8073702B2 (en) | 2005-06-30 | 2011-12-06 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
EP1941497B1 (en) | 2005-08-30 | 2019-01-16 | LG Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
KR100880642B1 (ko) | 2005-08-30 | 2009-01-30 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
KR100857117B1 (ko) | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7660358B2 (en) | 2005-10-05 | 2010-02-09 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7672379B2 (en) | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7761289B2 (en) | 2005-10-24 | 2010-07-20 | Lg Electronics Inc. | Removing time delays in signal paths |
US7752053B2 (en) | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
US20080004729A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Direct encoding into a directional audio coding format |
CN101529504B (zh) * | 2006-10-16 | 2012-08-22 | 弗劳恩霍夫应用研究促进协会 | 多通道参数转换的装置和方法 |
KR101103987B1 (ko) * | 2006-10-16 | 2012-01-06 | 돌비 인터네셔널 에이비 | 멀티채널 다운믹스된 객체 코딩의 개선된 코딩 및 파라미터 표현 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8065166B2 (en) | 2007-10-30 | 2011-11-22 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US9760677B2 (en) | 2009-04-29 | 2017-09-12 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US9171344B2 (en) | 2007-10-30 | 2015-10-27 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
KR20100131467A (ko) * | 2008-03-03 | 2010-12-15 | 노키아 코포레이션 | 복수의 오디오 채널들을 캡쳐하고 렌더링하는 장치 |
PL3300076T3 (pl) | 2008-07-11 | 2019-11-29 | Fraunhofer Ges Forschung | Koder audio i dekoder audio |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
KR101646650B1 (ko) * | 2009-10-15 | 2016-08-08 | 오렌지 | 최적의 저-스루풋 파라메트릭 코딩/디코딩 |
MY153845A (en) * | 2010-01-12 | 2015-03-31 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
JP2013005204A (ja) * | 2011-06-16 | 2013-01-07 | Sony Corp | ビデオ送信装置、ビデオ受信装置、およびビデオ送信方法 |
US8400335B2 (en) | 2011-07-21 | 2013-03-19 | International Business Machines Corporation | Using variable length code tables to compress an input data stream to a compressed output data stream |
US8669889B2 (en) | 2011-07-21 | 2014-03-11 | International Business Machines Corporation | Using variable length code tables to compress an input data stream to a compressed output data stream |
US8692696B2 (en) | 2012-01-03 | 2014-04-08 | International Business Machines Corporation | Generating a code alphabet of symbols to generate codewords for words used with a program |
US10616581B2 (en) | 2012-01-19 | 2020-04-07 | Huawei Technologies Co., Ltd. | Modified coding for a transform skipped block for CABAC in HEVC |
US20130188736A1 (en) | 2012-01-19 | 2013-07-25 | Sharp Laboratories Of America, Inc. | High throughput significance map processing for cabac in hevc |
US9743116B2 (en) | 2012-01-19 | 2017-08-22 | Huawei Technologies Co., Ltd. | High throughput coding for CABAC in HEVC |
US9654139B2 (en) | 2012-01-19 | 2017-05-16 | Huawei Technologies Co., Ltd. | High throughput binarization (HTB) method for CABAC in HEVC |
US8552890B2 (en) * | 2012-01-19 | 2013-10-08 | Sharp Laboratories Of America, Inc. | Lossless coding with different parameter selection technique for CABAC in HEVC |
US9860527B2 (en) | 2012-01-19 | 2018-01-02 | Huawei Technologies Co., Ltd. | High throughput residual coding for a transform skipped block for CABAC in HEVC |
US8581753B2 (en) | 2012-01-19 | 2013-11-12 | Sharp Laboratories Of America, Inc. | Lossless coding technique for CABAC in HEVC |
US9558566B2 (en) | 2012-08-21 | 2017-01-31 | EMC IP Holding Company LLC | Lossless compression of fragmented image data |
US9659569B2 (en) | 2013-04-26 | 2017-05-23 | Nokia Technologies Oy | Audio signal encoder |
WO2014191793A1 (en) * | 2013-05-28 | 2014-12-04 | Nokia Corporation | Audio signal encoder |
WO2015059154A1 (en) * | 2013-10-21 | 2015-04-30 | Dolby International Ab | Audio encoder and decoder |
EP3095117B1 (en) | 2014-01-13 | 2018-08-22 | Nokia Technologies Oy | Multi-channel audio signal classifier |
MY186155A (en) * | 2014-03-25 | 2021-06-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
GB2567427B (en) * | 2017-10-06 | 2020-10-07 | Imagination Tech Ltd | Data compression |
GB2576769A (en) | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
WO2021035437A1 (en) * | 2019-08-23 | 2021-03-04 | Lenovo (Beijing) Limited | Method and apparatus for determining harq-ack codebook |
CN116762127A (zh) * | 2020-12-15 | 2023-09-15 | 诺基亚技术有限公司 | 量化空间音频参数 |
GB2624874A (en) * | 2022-11-29 | 2024-06-05 | Nokia Technologies Oy | Parametric spatial audio encoding |
CN115865099B (zh) * | 2022-12-01 | 2024-04-16 | 河南大学 | 基于霍夫曼编码的多类型数据分段压缩方法及系统 |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63284974A (ja) | 1987-05-15 | 1988-11-22 | Matsushita Electric Works Ltd | 画像圧縮方式 |
SU1711331A1 (ru) | 1987-05-28 | 1992-02-07 | Всесоюзный научно-исследовательский институт радиовещательного приема и акустики им.А.С.Попова | Устройство кодировани и декодировани сигналов звукового вещани |
US5225904A (en) * | 1987-10-05 | 1993-07-06 | Intel Corporation | Adaptive digital video compression system |
US5532694A (en) * | 1989-01-13 | 1996-07-02 | Stac Electronics, Inc. | Data compression apparatus and method using matching string searching and Huffman encoding |
JPH0773249B2 (ja) | 1989-06-29 | 1995-08-02 | 富士通株式会社 | 音声符号化・復号化伝送方式 |
US5325091A (en) * | 1992-08-13 | 1994-06-28 | Xerox Corporation | Text-compression technique using frequency-ordered array of word-number mappers |
US5550540A (en) * | 1992-11-12 | 1996-08-27 | Internatioal Business Machines Corporation | Distributed coding and prediction by use of contexts |
US5717394A (en) * | 1993-02-10 | 1998-02-10 | Ricoh Company Ltd. | Method and apparatus for encoding and decoding data |
JPH07203441A (ja) | 1993-12-28 | 1995-08-04 | Matsushita Graphic Commun Syst Inc | 符号化装置及び復号化装置 |
US5550541A (en) | 1994-04-01 | 1996-08-27 | Dolby Laboratories Licensing Corporation | Compact source coding tables for encoder/decoder system |
CA2156889C (en) | 1994-09-30 | 1999-11-02 | Edward L. Schwartz | Method and apparatus for encoding and decoding data |
KR100209877B1 (ko) | 1994-11-26 | 1999-07-15 | 윤종용 | 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치 |
JPH08179794A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | サブバンド符号化方法及び装置 |
US5721720A (en) * | 1994-12-28 | 1998-02-24 | Kabushiki Kaisha Toshiba | Optical recording medium recording pixel data as a compressed unit data block |
US5819215A (en) * | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
CN1158050A (zh) | 1995-12-27 | 1997-08-27 | 汤姆森消费电子有限公司 | 图像数据压缩系统和方法 |
US5870436A (en) | 1997-01-02 | 1999-02-09 | Raytheon Company | Uniform discrete fourier transform filter parameter encoder |
US6237496B1 (en) * | 1997-02-26 | 2001-05-29 | Northrop Grumman Corporation | GPS guided munition |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
RU2214047C2 (ru) | 1997-11-19 | 2003-10-10 | Самсунг Электроникс Ко., Лтд. | Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов |
US6862278B1 (en) * | 1998-06-18 | 2005-03-01 | Microsoft Corporation | System and method using a packetized encoded bitstream for parallel compression and decompression |
US6166664A (en) * | 1998-08-26 | 2000-12-26 | Intel Corporation | Efficient data structure for entropy encoding used in a DWT-based high performance image compression |
US6546049B1 (en) * | 1998-10-05 | 2003-04-08 | Sarnoff Corporation | Parameterized quantization matrix adaptation for video encoding |
JP2000151413A (ja) * | 1998-11-10 | 2000-05-30 | Matsushita Electric Ind Co Ltd | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 |
US6624761B2 (en) | 1998-12-11 | 2003-09-23 | Realtime Data, Llc | Content independent data compression method and system |
SE9903552D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching |
JP3323175B2 (ja) | 1999-04-20 | 2002-09-09 | 松下電器産業株式会社 | 符号化装置 |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
SE9903191D0 (sv) | 1999-09-08 | 1999-09-08 | Pacesetter Ab | Compression and decompression coding scheme and apparatus |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
RU2159507C1 (ru) | 1999-10-29 | 2000-11-20 | Аликов Сергей Владимирович | Узел кодирования и/или декодирования информации, система передачи информации с уплотнением каналов, система передачи информации в телекоммуникационной сети |
JP2001151413A (ja) | 1999-11-29 | 2001-06-05 | Shinkawa Ltd | ワイヤボンダにおけるスプールホルダ構造 |
JP3609323B2 (ja) * | 2000-05-08 | 2005-01-12 | 日本電信電話株式会社 | 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 |
JP2001339311A (ja) | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
US6813438B1 (en) * | 2000-09-06 | 2004-11-02 | International Business Machines Corporation | Method to customize the playback of compact and digital versatile disks |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
JP4125565B2 (ja) | 2001-08-31 | 2008-07-30 | 松下電器産業株式会社 | 画像符号化方法、画像復号化方法及びその装置 |
US20030081685A1 (en) * | 2001-10-31 | 2003-05-01 | Montgomery Dennis L. | Method and apparatus for determining patterns within adjacent blocks of data |
JP2005510925A (ja) * | 2001-11-30 | 2005-04-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号コード化 |
CN102316320B (zh) * | 2001-12-17 | 2014-07-09 | 微软公司 | 处理视频图像的方法 |
JP4714415B2 (ja) * | 2002-04-22 | 2011-06-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメータによるマルチチャンネルオーディオ表示 |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4369140B2 (ja) | 2003-02-17 | 2009-11-18 | パナソニック株式会社 | オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体 |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7617166B2 (en) * | 2004-04-14 | 2009-11-10 | The Boeing Company | Neural network for aeroelastic analysis |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
DE602004028171D1 (de) * | 2004-05-28 | 2010-08-26 | Nokia Corp | Mehrkanalige audio-erweiterung |
DE102004063950B4 (de) * | 2004-08-07 | 2009-02-19 | Tropf, Hermann | Kanalcodiervorrichtung |
US7161507B2 (en) * | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
KR100857117B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
PL3300076T3 (pl) * | 2008-07-11 | 2019-11-29 | Fraunhofer Ges Forschung | Koder audio i dekoder audio |
-
2005
- 2005-10-05 US US11/243,915 patent/US7991610B2/en active Active
-
2006
- 2006-02-13 WO PCT/EP2006/001295 patent/WO2006108464A1/en active Application Filing
- 2006-02-13 CN CN2006800120933A patent/CN101160726B/zh active Active
- 2006-02-13 ES ES06723036T patent/ES2739531T3/es active Active
- 2006-02-13 BR BRPI0612356-2A patent/BRPI0612356B1/pt active IP Right Grant
- 2006-02-13 FI FIEP19156694.2T patent/FI3503409T3/fi active
- 2006-02-13 PT PT06723036T patent/PT1869774T/pt unknown
- 2006-02-13 MX MX2007012663A patent/MX2007012663A/es active IP Right Grant
- 2006-02-13 BR BR122019014976-3A patent/BR122019014976B1/pt not_active IP Right Cessation
- 2006-02-13 AU AU2006233512A patent/AU2006233512C1/en active Active
- 2006-02-13 EP EP06723036.7A patent/EP1869774B1/en active Active
- 2006-02-13 KR KR1020077022723A patent/KR100954181B1/ko active IP Right Grant
- 2006-02-13 BR BR122019014628-4A patent/BR122019014628B1/pt active IP Right Grant
- 2006-02-13 CA CA2607460A patent/CA2607460C/en active Active
- 2006-02-13 PL PL06723036T patent/PL1869774T3/pl unknown
- 2006-02-13 EP EP19156694.2A patent/EP3503409B1/en active Active
- 2006-02-13 RU RU2007141934/09A patent/RU2368074C2/ru active
- 2006-02-13 JP JP2008505744A patent/JP5027799B2/ja active Active
- 2006-02-15 MY MYPI20060645A patent/MY141958A/en unknown
- 2006-04-11 TW TW095112773A patent/TWI321316B/zh active
-
2007
- 2007-09-25 IL IL186315A patent/IL186315A/en active IP Right Grant
- 2007-11-12 NO NO20075796A patent/NO343207B1/no unknown
-
2010
- 2010-11-17 US US12/948,417 patent/US9043200B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101160726B (zh) | 参数压缩单元和解码器以及相应的方法 | |
RU2197776C2 (ru) | Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты) | |
EP1869775B1 (en) | Entropy coding with compact codebooks | |
US20020049586A1 (en) | Audio encoder, audio decoder, and broadcasting system | |
CA2601821A1 (en) | Planar multiband antenna | |
CA2604521C (en) | Lossless encoding of information with guaranteed maximum bitrate | |
CN101160725A (zh) | 确保最大比特率的无损信息编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |