RU2705052C2 - Bit allocation, audio encoding and decoding - Google Patents
Bit allocation, audio encoding and decoding Download PDFInfo
- Publication number
- RU2705052C2 RU2705052C2 RU2018108586A RU2018108586A RU2705052C2 RU 2705052 C2 RU2705052 C2 RU 2705052C2 RU 2018108586 A RU2018108586 A RU 2018108586A RU 2018108586 A RU2018108586 A RU 2018108586A RU 2705052 C2 RU2705052 C2 RU 2705052C2
- Authority
- RU
- Russia
- Prior art keywords
- bits
- subband
- spectrum
- unit
- distributed
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 107
- 230000003595 spectral effect Effects 0.000 claims description 48
- 238000000034 method Methods 0.000 claims description 38
- 230000000670 limiting effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 6
- 239000000126 substance Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 36
- 230000005236 sound signal Effects 0.000 description 31
- 230000000873 masking effect Effects 0.000 description 25
- 230000008447 perception Effects 0.000 description 15
- 230000001052 transient effect Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000013139 quantization Methods 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 238000007493 shaping process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000005303 weighing Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
Область техникиTechnical field
Устройства, приспособления и изделия в соответствии с настоящим изобретением относятся к кодированию и декодированию аудио и, в частности, к способу и устройству для эффективного распределения битов в область частот, важную для восприятия, на основании поддиапазонов, способу и устройству кодирования аудио, способу и устройству декодирования аудио, регистрирующей среде и мультимедийному устройству, в котором это используется.Devices, devices and products in accordance with the present invention relate to encoding and decoding of audio and, in particular, to a method and apparatus for efficiently distributing bits in a frequency domain important for perception, based on subbands, of an audio encoding method and apparatus, method and apparatus decoding audio, recording medium and multimedia device in which it is used.
Уровень техникиState of the art
При кодировании или декодировании аудиосигнала требуется эффективно использовать ограниченное число битов для восстановления аудиосигнала, имеющего наилучшее качество звучания, в диапазоне ограниченного числа битов. В частности, при низкой скорости передачи требуется, чтобы метод кодирования и декодирования аудиосигнала равномерно распределял биты в спектральные компоненты важные для восприятия вместо сосредоточения битов в конкретной частотной области.When encoding or decoding an audio signal, it is required to efficiently use a limited number of bits to restore an audio signal having the best sound quality in a range of a limited number of bits. In particular, at a low transmission speed, it is required that the method of encoding and decoding an audio signal evenly distributes the bits into spectral components important for perception, instead of concentrating the bits in a particular frequency domain.
В частности, при низкой скорости передачи в тех случаях, когда кодирование выполняется с использованием битов, распределяемых каждому диапазону частот, например, поддиапазону, может образоваться спектральный провал из-за частотной компоненты, которая не кодируется ввиду недостаточного числа битов, тем самым приводя к ухудшению качества звучания.In particular, at a low transmission rate, in cases where encoding is performed using the bits allocated to each frequency range, for example, a subband, a spectral dip may occur due to the frequency component, which is not encoded due to the insufficient number of bits, thereby leading to degradation sound quality.
Cущность изобретенияSUMMARY OF THE INVENTION
Техническая задачаTechnical challenge
Аспектом является создание способа и устройства для эффективного распределения битов в области частот, важной для восприятия, на основании поддиапазонов, способа и устройства кодирования аудио, способа и устройства декодирования аудио, регистрирующей среды и мультимедийного устройства, в котором это используется.An aspect is to provide a method and apparatus for efficiently distributing bits in a frequency domain important for perception based on subbands, an audio encoding method and apparatus, an audio decoding method and apparatus, a recording medium, and a multimedia device in which it is used.
Аспектом является создание способа и устройства для эффективного распределения битов в области частот, важной для восприятия, с низкой сложностью на основании поддиапазонов, способа и устройства кодирования аудио, способа и устройства декодирования аудио, регистрирующей среды и мультимедийного устройства, в котором это используется.An aspect is to provide a method and apparatus for efficiently distributing bits in a frequency region important for perception, with low complexity based on subbands, an audio encoding method and apparatus, an audio decoding method and apparatus, a recording medium, and a multimedia device in which it is used.
Решение задачиThe solution of the problem
В соответствии с одним аспектом одного или более примерных вариантов осуществления предлагается способ распределения битов, включающий в себя: определение распределяемого числа битов в единицах с десятичной запятой на основании каждого диапазона частот таким образом, что Отношение сигнал-шум (SNR) спектра, имеющегося в заданном диапазоне частот, доводится до максимума в пределах диапазона допустимого числа битов для конкретного кадра; и корректировку распределяемого числа битов на основании каждого диапазона частот.In accordance with one aspect of one or more exemplary embodiments, a bit allocation method is provided, including: determining a distributed number of bits in decimal units based on each frequency band such that a Signal-to-Noise Ratio (SNR) of a spectrum available in a given frequency range, is maximized within the range of the allowable number of bits for a particular frame; and adjusting the allocated number of bits based on each frequency range.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство распределения битов, включающее в себя: блок преобразования, который преобразует аудиосигнал во временной области в спектр звуковых частот в частотной области; и блок распределения битов, который оценивает допустимое число битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр в спектре звуковых частот, оценивает распределяемое число битов в единицах с десятичной запятой путем использования спектральной энергии и корректирует распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов.In accordance with another aspect of one or more exemplary embodiments, there is provided a bit distribution device including: a conversion unit that converts an audio signal in the time domain to a spectrum of audio frequencies in the frequency domain; and a bit allocation unit, which estimates the allowable number of bits in decimal point units by using a masking threshold based on frequency ranges included in a particular frame in the audio frequency spectrum, estimates the distributed number of bits in decimal point units by using spectral energy and adjusts the distributed number bits so that it does not exceed the allowable number of bits.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство кодирования аудио, включающее в себя: блок преобразования, который преобразует аудиосигнал во временной области в спектр звуковых частот в частотной области; блок распределения битов, который определяет распределяемое число битов в единицах с десятичной запятой на основании каждого диапазона частот таким образом, что Отношение сигнал-шум (SNR) спектра, имеющегося в заданном диапазоне частот, доводится до максимума в пределах диапазона допустимого числа битов для конкретного кадра спектра звуковых частот, и корректирует распределяемое число битов, определяемых на основании каждого диапазона частот; и блок кодирования, который кодирует спектр звуковых частот путем использования числа битов, скорректированных на основании каждого диапазона частот и спектральной энергии.In accordance with another aspect of one or more exemplary embodiments, an audio encoding device is provided, including: a conversion unit that converts an audio signal in the time domain to a spectrum of audio frequencies in the frequency domain; a bit allocation unit that determines the number of bits to be distributed in units of decimal point based on each frequency range so that the signal-to-noise ratio (SNR) of the spectrum available in a given frequency range is maximized within the range of the allowable number of bits for a particular frame spectrum of sound frequencies, and adjusts the distributed number of bits determined on the basis of each frequency range; and a coding unit that encodes a spectrum of audio frequencies by using the number of bits corrected based on each frequency range and spectral energy.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство декодирования аудио, включающее в себя: блок преобразования, который преобразует аудиосигнал во временной области в спектр звуковых частот в частотной области; блок распределения битов, который определяет распределяемое число битов в единицах с десятичной запятой на основании каждого диапазона частот таким образом, что Отношение сигнал-шум (SNR) спектра, имеющегося в заданном диапазоне частот, доводится до максимума в пределах диапазона допустимого числа битов для конкретного кадра спектра звуковых частот, и корректирует распределяемое число битов, определяемых на основании каждого диапазона частот; и блок кодирования, который кодирует спектр звуковых частот путем использования числа битов, скорректированных на основании каждого диапазона частот и спектральной энергии.In accordance with another aspect of one or more exemplary embodiments, an audio decoding apparatus is provided, including: a conversion unit that converts an audio signal in the time domain to a spectrum of audio frequencies in the frequency domain; a bit allocation unit that determines the number of bits to be distributed in units of decimal point based on each frequency range so that the signal-to-noise ratio (SNR) of the spectrum available in a given frequency range is maximized within the range of the allowable number of bits for a particular frame spectrum of sound frequencies, and adjusts the distributed number of bits determined on the basis of each frequency range; and a coding unit that encodes a spectrum of audio frequencies by using the number of bits corrected based on each frequency range and spectral energy.
В соответствии с еще одним аспектом одного или более примерных вариантов осуществления предлагается устройство декодирования аудио, включающее в себя: блок распределения битов, который оценивает допустимое число битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр, оценивает распределяемое число битов в единицах с десятичной запятой путем использования спектральной энергии и корректирует распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов; блок декодирования, который декодирует спектр звуковых частот, входящий в битовый поток, путем использования числа битов, скорректированных на основании каждого диапазона частот и спектральной энергии; и блок обратного преобразования, который преобразует декодированный спектр звуковых частот в аудиосигнал во временной области.In accordance with yet another aspect of one or more exemplary embodiments, an audio decoding apparatus is provided, including: a bit allocation unit that estimates a valid number of bits in decimal units by using a masking threshold based on frequency ranges included in a particular frame, estimates the distributed number of bits in decimal units by using spectral energy and adjusts the distributed number of bits so that it does not exceed lo allowable number of bits; a decoding unit that decodes the audio frequency spectrum included in the bitstream by using the number of bits corrected based on each frequency range and spectral energy; and an inverse transform unit that converts the decoded spectrum of the audio frequencies into an audio signal in the time domain.
Краткое описание чертежейBrief Description of the Drawings
Вышеизложенные и другие варианты станут более понятными благодаря подробному описанию их примеров осуществления со ссылкой на прилагаемые чертежи, на которых:The foregoing and other embodiments will become more apparent through a detailed description of their exemplary embodiments with reference to the accompanying drawings, in which:
фиг. 1 представляет собой блок-схему устройства кодирования аудио в соответствии с примерным вариантом осуществления;FIG. 1 is a block diagram of an audio encoding apparatus in accordance with an exemplary embodiment;
фиг. 2 представляет собой блок-схему блока распределения битов в устройстве кодирования аудио на фиг. 1 в соответствии с примерным вариантом осуществления;FIG. 2 is a block diagram of a bit allocation unit in the audio encoding apparatus of FIG. 1 in accordance with an exemplary embodiment;
фиг. 3 представляет собой блок-схему блока распределения битов в устройстве кодирования аудио на фиг. 1 в соответствии с еще одним примерным вариантом осуществления;FIG. 3 is a block diagram of a bit allocation unit in the audio encoding apparatus of FIG. 1 in accordance with another exemplary embodiment;
фиг. 4 представляет собой блок-схему блока распределения битов в устройстве кодирования аудио на фиг. 1 в соответствии с еще одним примерным вариантом осуществления;FIG. 4 is a block diagram of a bit allocation unit in the audio encoding apparatus of FIG. 1 in accordance with another exemplary embodiment;
фиг. 5 представляет собой блок-схему блока кодирования в устройстве кодирования аудио на фиг. 1 в соответствии с примерным вариантом осуществления;FIG. 5 is a block diagram of an encoding unit in the audio encoding device of FIG. 1 in accordance with an exemplary embodiment;
фиг. 6 представляет собой блок-схему устройства кодирования аудио в соответствии с еще одним примерным вариантом осуществления;FIG. 6 is a block diagram of an audio encoding apparatus in accordance with yet another exemplary embodiment;
фиг. 7 представляет собой блок-схему устройства декодирования аудио в соответствии с примерным вариантом осуществления;FIG. 7 is a block diagram of an audio decoding apparatus in accordance with an exemplary embodiment;
фиг. 8 представляет собой блок-схему блока распределения битов в устройстве декодирования аудио на фиг. 7 в соответствии с примерным вариантом осуществления;FIG. 8 is a block diagram of a bit allocation unit in the audio decoding apparatus of FIG. 7 in accordance with an exemplary embodiment;
фиг. 9 представляет собой блок-схему блока декодирования в устройстве декодирования аудио на фиг. 7 в соответствии с примерным вариантом осуществления;FIG. 9 is a block diagram of a decoding unit in the audio decoding apparatus of FIG. 7 in accordance with an exemplary embodiment;
фиг. 10 представляет собой блок-схему блока декодирования в устройстве декодирования аудио на фиг. 7 в соответствии с еще одним примерным вариантом осуществления;FIG. 10 is a block diagram of a decoding unit in the audio decoding apparatus of FIG. 7 in accordance with another exemplary embodiment;
фиг. 11 представляет собой блок-схему блока декодирования в устройстве декодирования аудио на фиг. 7 в соответствии с еще одним примерным вариантом осуществления;FIG. 11 is a block diagram of a decoding unit in the audio decoding apparatus of FIG. 7 in accordance with another exemplary embodiment;
фиг. 12 представляет собой блок-схему устройства декодирования аудио в соответствии с еще одним примерным вариантом осуществления;FIG. 12 is a block diagram of an audio decoding apparatus in accordance with another exemplary embodiment;
фиг. 13 представляет собой блок-схему устройства декодирования аудио в соответствии с еще одним примерным вариантом осуществления;FIG. 13 is a block diagram of an audio decoding apparatus in accordance with another exemplary embodiment;
фиг. 14 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;FIG. 14 is a structural diagram illustrating a method for allocating bits in accordance with another exemplary embodiment;
фиг. 15 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;FIG. 15 is a structural diagram illustrating a method for allocating bits in accordance with another exemplary embodiment;
фиг. 16 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;FIG. 16 is a structural diagram illustrating a method for allocating bits in accordance with another exemplary embodiment;
фиг. 17 представляет собой структурную схему, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления;FIG. 17 is a structural diagram illustrating a method for allocating bits in accordance with another exemplary embodiment;
фиг. 18 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования, в соответствии с примерным вариантом осуществления;FIG. 18 is a block diagram of a multimedia device comprising an encoding module in accordance with an exemplary embodiment;
фиг. 19 представляет собой блок-схему мультимедийного устройства, содержащего модуль декодирования, в соответствии с примерным вариантом осуществления;FIG. 19 is a block diagram of a multimedia device comprising a decoding module in accordance with an exemplary embodiment;
фиг. 20 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования и модуль декодирования, в соответствии с примерным вариантом осуществления.FIG. 20 is a block diagram of a multimedia device comprising an encoding module and a decoding module, in accordance with an exemplary embodiment.
Вариант осуществления изобретенияAn embodiment of the invention
Настоящая идея изобретения может допускать различного рода изменения или модификации и различные изменения формы, и в описании будут проиллюстрированы на чертежах и подробно описаны конкретные примерные варианты осуществления. Однако следует понимать, что конкретные примерные варианты осуществления не ограничивают настоящую идею изобретения определенной формой описания, а включают в себя любую модифицированную, эквивалентную или замененную форму в пределах сущности и технического объема настоящей идеи изобретения. В нижеследующем описании хорошо известные функции или конструкции не описываются подробно, поскольку они могут затруднить понимание изобретения из-за ненужных деталей.The present idea of the invention may allow various kinds of changes or modifications and various changes in form, and the specific examples of embodiments will be illustrated and described in detail in the drawings. However, it should be understood that specific exemplary embodiments of the invention do not limit the present idea of the invention to a specific description form, but include any modified, equivalent, or substituted form within the spirit and technical scope of the present idea of the invention. In the following description, well-known functions or constructions are not described in detail since they may complicate the understanding of the invention due to unnecessary details.
Хотя для описания различных элементов могут использоваться такие термины как «первый» и «второй», элементы не могут ограничиваться этими терминами. Эти термины могут использоваться, чтобы отличать некоторый элемент от другого элемента.Although terms such as “first” and “second” may be used to describe various elements, elements cannot be limited to these terms. These terms can be used to distinguish some element from another element.
Используемая в данной заявке терминология используется лишь для описания конкретных примерных вариантов осуществления и не имеет целью ограничивать настоящую идею изобретения. Хотя общие термины, в настоящее время применяемые наиболее широко, выбраны в качестве терминов, используемых в настоящей идее изобретения на основании функций в настоящей идее изобретения, они могут варьироваться в соответствии с намерением специалистов, судебных прецедентов или появлением новой технологии. Кроме того, в отдельных случаях могут использоваться термины, специально выбираемые заявителем, и в этом случае значение терминов будет приведено в соответствующем описании изобретения. В связи с этим во всей настоящей идее изобретения термины, применяемые в настоящей идее изобретения, должны определяться не простыми названиями терминов, а значением терминов и смыслом.The terminology used in this application is used only to describe specific exemplary embodiments and is not intended to limit the present idea of the invention. Although the general terms that are currently used most widely are selected as terms used in the present idea of the invention based on the functions in the present idea of the invention, they can vary in accordance with the intention of specialists, judicial precedents or the advent of new technology. In addition, in some cases, terms specially selected by the applicant may be used, in which case the meaning of the terms will be given in the corresponding description of the invention. In this regard, in the entire present idea of the invention, the terms used in this idea of the invention should not be determined by simple names of terms, but by the meaning of the terms and meaning.
Выражение в единственном числе включает в себя выражение во множественном числе кроме тех случаев, когда они явно отличаются друг от друга в некотором контексте. Следует понимать, что в данной заявке такие термины как «включать в себя» и «иметь» используются для указания на наличие реализованного признака, числа, этапа, операции, элемента, детали или их совокупности без исключения заранее возможности наличия или добавления одного или более иных признаков, чисел, этапов, операций, элементов, деталей или их совокупностей.An expression in the singular includes the expression in the plural except in those cases where they are clearly different from each other in some context. It should be understood that in this application, terms such as “include” and “have” are used to indicate the presence of an implemented attribute, number, stage, operation, element, part or combination thereof without exception in advance the possibility of the presence or addition of one or more other signs, numbers, steps, operations, elements, parts or their combination.
В дальнейшем в этом документе идея изобретения будет описываться более полно со ссылкой на прилагаемые чертежи, на которых изображены примерные варианты осуществления. Одинаковые условные обозначения на чертежах обозначают одинаковые элементы, и, следовательно, их повторное описание приводиться не будет.Hereinafter, the idea of the invention will be described more fully with reference to the accompanying drawings, in which exemplary embodiments are shown. The same symbols in the drawings indicate the same elements, and therefore, their re-description will not be given.
Используемые в настоящем документе выражения, такие как «по меньшей мере, один из», если они предшествуют перечню элементов, изменяют весь перечень элементов и не изменяют отдельных элементов перечня.Expressions used herein, such as “at least one of,” if preceded by a list of items, modify the entire list of items and do not change individual items in the list.
Фиг. 1 представляет собой блок-схему устройства 100 кодирования аудио в соответствии с примерным вариантом осуществления.FIG. 1 is a block diagram of an
Устройство 100 кодирования аудио на фиг. 1 может содержать блок 130 преобразования, блок 150 распределения битов, блок 170 кодирования и блок 190 мультиплексирования. Компоненты устройства 100 кодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора (например, центрального процессора (ЦП)). При этом аудио может означать аудиосигнал, речевой сигнал или сигнал, полученный путем их синтезирования, но в дальнейшем в этом документе для удобства описания аудио, как правило, означает аудиосигнал.The
В соответствии с фиг. 1 блок 130 преобразования может генерировать спектр звуковых частот путем преобразования аудиосигнала во временной области в аудиосигнал в частотной области. Преобразование из временной области в частотную область может выполняться путем использования различных хорошо известных способов, таких как Дискретное косинусное преобразование (DCT).In accordance with FIG. 1, a
Блок 150 распределения битов может определять порог маскирования, получаемый путем использования спектральной энергии или психоакустической модели в отношении спектра звуковых частот и числа битов, распределяемых на основании каждого поддиапазона путем использования спектральной энергии. При этом поддиапазон представляет собой блок группированных выборок спектра звуковых частот и может иметь постоянную или непостоянную длину за счет соответствия пороговому диапазону. В тех случаях, когда поддиапазоны имеют непостоянную длину, поддиапазоны могут определяться таким образом, что число выборок от начальной выборки до последней выборки, входящих в каждый поддиапазон, на кадр постепенно увеличивается. При этом число поддиапазонов или число выборок, входящих в каждый подкадр, может определяться заранее. В соответствии с другим вариантом после того, как один кадр делится на предварительно заданное число поддиапазонов, имеющих постоянную длину, постоянная длина может корректироваться в соответствии с распределением спектральных коэффициентов. Распределение спектральных коэффициентов может определяться с использованием показателя спектральной неравномерности, разности между максимальным значением и минимальным значением или дифференциальной величины максимального значения.The
В соответствии с примерным вариантом осуществления блок 150 распределения битов может оценивать допустимое число битов путем использования величины Нормы, полученной на основании каждого поддиапазона, т.е., средней спектральной энергии, распределять биты на основе средней спектральной энергии и ограничивать распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов.According to an exemplary embodiment, the
В соответствии с примерным вариантом осуществления блок 150 распределения битов может оценивать допустимое число битов путем использования психоакустической модели на основании каждого поддиапазона, распределять биты на основе средней спектральной энергии и ограничивать распределяемое число битов таким образом, чтобы оно не превышало допустимое число битов.According to an exemplary embodiment, the
Блок 170 кодирования может генерировать информацию в отношении кодированного спектра путем квантования спектра звуковых частот и его кодирования без потерь на основе распределяемого числа битов, окончательно определяемых на основании каждого поддиапазона.The
Блок 190 мультиплексирования генерирует битовый поток путем мультиплексирования кодированной величины Нормы, выдаваемой с блока 150 распределения битов, и информации, относящейся к кодированному спектру, выдаваемому с блока 170 кодирования.The multiplexing unit 190 generates a bitstream by multiplexing the encoded Norm value output from the
Устройство 100 кодирования аудио может генерировать уровень шума для факультативного поддиапазона и выдавать этот уровень шума в устройство декодирования аудио (700 на фиг. 7, 1200 на фиг. 12 или 1300 на фиг. 13).The
Фиг. 2 представляет собой блок-схему блока 200 распределения битов, соответствующего блоку 150 распределения битов в устройстве 100 кодирования аудио на фиг. 1, в соответствии с примерным вариантом осуществления.FIG. 2 is a block diagram of a
Блок 200 распределения битов на фиг. 2 может содержать блок 210 оценки Нормы, кодер 230 Нормы и блок 250 оценки и распределения битов. Компоненты блока 200 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы, по меньшей мере, с помощью одного процессора.The
В соответствии с фиг. 2, блок 210 оценки Нормы может получать величину Нормы, соответствующую средней спектральной энергии, на основании каждого поддиапазона. Например, величина Нормы может быть вычислена с помощью Уравнения 1, применяемого в ITU-T G.719, но не ограничивается им.In accordance with FIG. 2, the
Мат. фиг. 1Mat. FIG. one
[Мат. 1][Mat. one]
В Уравнении 1 в тех случаях, когда в одном кадре имеется Р поддиапазонов или подсекторов, N(P) означает величину Нормы р-го поддиапазона или подсектора, Lp означает длину р-го поддиапазона или подсектора, т.е. количество выборок или спектральных коэффициентов, sp и ep означают начальную выборку и последнюю выборку р-го поддиапазона соответственно, а y(k) означает размер выборки или спектральный коэффициент (т.е. энергию).In Equation 1, when there are P subbands or sub-sectors in one frame, N (P) is the Norm of the p-th sub-band or subsector, L p is the length of the p-th sub-band or subsector, i.e. the number of samples or spectral coefficients, s p and e p mean the initial sample and the last sample of the p-th subband, respectively, and y (k) means the sample size or spectral coefficient (i.e. energy).
Величина Нормы, получаемая на основании каждого поддиапазона, может выдаваться в блок кодирования (170 на фиг. 1).The Norm value obtained on the basis of each subband may be output to the coding unit (170 in FIG. 1).
Кодер 230 Нормы может квантовать и кодировать без потерь величину Нормы, получаемую на основании каждого поддиапазона. Величина Нормы, квантуемая на основании каждого поддиапазона, или величина Нормы, получаемая путем деквантования квантованной величины Нормы, может выдаваться в блок 250 оценки и распределения битов. Величина Нормы, квантованная и кодированная без потерь на основании каждого поддиапазона, может выдаваться в блок мультиплексирования (190 на фиг. 1).The
Блок 250 оценки и распределения битов может оценивать и распределять требуемое число битов путем использования величины Нормы. Предпочтительно деквантованная величина Нормы может использоваться таким образом, что кодирующая часть и декодирующая часть могут использовать один и тот же процесс оценки и распределения битов. В этом случае может использоваться величина Нормы, скорректированная с учетом маскирующего эффекта. Например, величина Нормы может корректироваться с помощью психоакустического взвешивания, применяемого в ITU-T G.719, как в Уравнении 2, но не ограничивается им.Block 250 evaluation and allocation of bits can evaluate and distribute the required number of bits by using the value of the Norm. Preferably, the dequantified Norm value may be used in such a way that the encoding part and the decoding part can use the same process of estimating and allocating bits. In this case, the Norm value adjusted for the masking effect can be used. For example, the Norm value can be adjusted using the psycho-acoustic weighing used in ITU-T G.719, as in Equation 2, but is not limited to it.
Мат. фиг. 2Mat. FIG. 2
[Мат. 2][Mat. 2]
В Уравнении 2In Equation 2
означает показатель квантованной величины Нормы р-го поддиапазона,means the indicator of the quantized value of the Norm of the r-th sub-range,
означает показатель скорректированной величины Нормы р-го поддиапазона, аmeans the indicator of the adjusted value of the Norm of the r-th sub-range, and
WSpe(p)WSpe (p)
означает спектр смещения для корректировки величины Нормы.means the offset spectrum for adjusting the rate.
Блок 250 оценки и распределения битов может вычислять порог маскирования путем использования величины Нормы на основании каждого поддиапазона и оценивать требуемое для восприятия число битов путем использования порога маскирования. С этой целью величина Нормы, получаемая на основании каждого поддиапазона, в равной степени может быть представлена в виде спектральной энергии в единицах дБ, как показано в Уравнении 3.The bit estimator and
Мат. фиг. 3Mat. FIG. 3
[Мат. 3][Mat. 3]
В качестве способа получения порога маскирования могут использоваться различные хорошо известные способы. То есть, порог маскирования является величиной, соответствующей минимальному различимому искажению (JND), при этом когда шум квантования ниже порога маскирования, перцептуальный шум не может восприниматься. Таким образом, минимальное число битов, требуемое для того, чтобы перцептуальный шум не воспринимался, может вычисляться с помощью порога маскирования. Например, Отношение сигнал-маска (SMR) может вычисляться путем использования отношения величины Нормы к порогу маскирования на основании каждого поддиапазона, а число битов, удовлетворяющее порогу маскирования, может оцениваться путем использования отношения 6,025 дБAs a method of obtaining a masking threshold, various well-known methods can be used. That is, the masking threshold is a value corresponding to the minimum perceptible distortion (JND), while when the quantization noise is below the masking threshold, perceptual noise cannot be perceived. Thus, the minimum number of bits required so that perceptual noise is not perceived can be calculated using a masking threshold. For example, the Signal-to-Mask Ratio (SMR) can be calculated by using the ratio of the Norm value to the masking threshold based on each subband, and the number of bits satisfying the masking threshold can be estimated by using the 6.025 dB ratio
1 бит относительно вычисленного SMR. Хотя расчетное число битов представляет собой минимальное число битов, требуемое для того, чтобы перцептуальный шум не воспринимался, поскольку с точки зрения сжатия нет необходимости в использовании числа битов, превышающего расчетное, расчетное число битов может рассматриваться как максимальное число битов, допустимое на основании каждого поддиапазона (в дальнейшем в этом документе - допустимое число битов). Допустимое число битов каждого поддиапазона может быть представлено в единицах с десятичной запятой.1 bit relative to the calculated SMR. Although the estimated number of bits is the minimum number of bits required so that perceptual noise is not perceived, since from the point of view of compression there is no need to use the number of bits that exceeds the calculated one, the estimated number of bits can be considered as the maximum number of bits allowed based on each subband (hereinafter referred to as the allowable number of bits). The permissible number of bits of each subband may be represented in units of decimal point.
Блок 250 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования величины Нормы на основании каждого поддиапазона. В этом случае биты последовательно распределяются из поддиапазона, имеющего большую величину Нормы, чем другие, и можно скорректировать, чтобы больше битов распределялось в важный для восприятия поддиапазон путем взвешивания в соответствии с важностью для восприятия каждого поддиапазона в отношении величины Нормы на основании каждого поддиапазона. Важность для восприятия может определяться, например, посредством психоакустического взвешивания, как в ITU-T G.719.The bit estimator and
Блок 250 оценки и распределения битов может последовательно распределять биты в выборки из поддиапазона, имеющего большую величину Нормы, чем другие. Иными словами, в первую очередь биты на выборку распределяются для поддиапазона, имеющего максимальную величину Нормы, при этом приоритет поддиапазона, имеющего максимальную величину Нормы, изменяется путем уменьшения величины Нормы поддиапазона на предварительно заданные единицы таким образом, что биты распределяются в другой поддиапазон. Этот процесс циклически выполняется до тех пор, пока не будет явно распределено общее число В битов, допустимое в конкретном кадре.The bit estimator and
Блок 250 оценки и распределения битов может окончательно определять распределяемое число битов путем ограничения распределяемого числа битов таким образом, чтобы оно не превышало расчетное число битов, т.е. допустимое число битов для каждого поддиапазона. Для всех поддиапазонов распределяемое число битов сравнивается с расчетным числом битов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.The bit evaluation and
Поскольку число битов, распределяемых в каждый поддиапазон, может определяться в единицах с десятичной запятой и ограничивается допустимым числом битов, общее число битов конкретного кадра может быть распределено эффективно.Since the number of bits allocated to each subband can be determined in units of decimal point and limited by the allowable number of bits, the total number of bits of a particular frame can be allocated efficiently.
В соответствии с примерным вариантом осуществления развернутый способ оценки и распределения числа битов, требуемого для каждого поддиапазона, состоит в следующем. В соответствии с этим способом ввиду того, что число битов, распределяемых в каждый поддиапазон, может определяться немедленно без повторения в течение нескольких раз, сложность может быть понижена.According to an exemplary embodiment, a detailed method for estimating and distributing the number of bits required for each subband is as follows. According to this method, since the number of bits allocated to each subband can be determined immediately without repeating several times, the complexity can be reduced.
Например, решение, которое может оптимизировать искажение за счет квантования и число битов, распределяемых в каждый поддиапазон, может быть получено применением функции Лагранжа, представленной Уравнением 4.For example, a solution that can optimize the quantization distortion and the number of bits allocated to each subband can be obtained by applying the Lagrange function represented by Equation 4.
Мат. фиг. 4Mat. FIG. four
[Мат. 4][Mat. four]
В Уравнении 4 L обозначает функцию Лагранжа, D обозначает искажение квантования, B обозначает общее число битов, допустимое в конкретном кадре, Nb обозначает число выборок b-го поддиапазона, а Lb обозначает число битов, допустимое в b-м поддиапазоне. То есть, NbLb обозначает число битов, распределяемых в b-й поддиапазон.In Equation 4, L stands for the Lagrange function, D stands for quantization distortion, B stands for the total number of bits allowed in a particular frame, N b stands for the number of samples of the bth subband, and L b stands for the number of bits allowed in the bth subband. That is, N b L b denotes the number of bits allocated to the bth subband.
λλ
обозначает множитель Лагранжа, являющийся коэффициентом оптимизации.denotes the Lagrange multiplier, which is the optimization coefficient.
Путем использования Уравнения 4 может быть определено Lb для минимизации разности между общим числом битов, распределяемых в поддиапазоны, входящие в конкретный кадр, и допустимым числом битов для конкретного кадра на основании искажения квантования.By using Equation 4, L b can be determined to minimize the difference between the total number of bits allocated to the subbands within a particular frame and the allowable number of bits for a specific frame based on quantization distortion.
Искажение D квантования может быть определено с помощью Уравнения 5.The quantization distortion D can be determined using Equation 5.
Мат. фиг. 5Mat. FIG. 5
[Мат. 5][Mat. 5]
В уравнении 5In equation 5
означает входной спектр, аmeans the input spectrum, and
означает декодированный спектр. То есть, искажение D квантования может быть определено как Среднеквадратическая ошибка (MSE) в отношении входного спектраmeans decoded spectrum. That is, the quantization distortion D can be defined as the mean square error (MSE) with respect to the input spectrum
и декодированного спектраand decoded spectrum
в произвольном кадре.in an arbitrary frame.
Знаменатель в Уравнении 5 является постоянной величиной, определяемой конкретным входным спектром, и в связи с этим ввиду того, что знаменатель в Уравнении 5 не влияет на оптимизацию, Уравнение 7 можно упростить с помощью Уравнения 6.The denominator in Equation 5 is a constant determined by the specific input spectrum, and therefore, since the denominator in Equation 5 does not affect optimization, Equation 7 can be simplified using Equation 6.
Мат. фиг. 6Mat. FIG. 6
[Мат. 6][Mat. 6]
Величина НормыNorm Value
, ,
которая является средней спектральной энергией b-го поддиапазона в отношении входного спектраwhich is the average spectral energy of the bth subband with respect to the input spectrum
, ,
может быть определена с помощью Уравнения 7, величина Нормыcan be determined using Equation 7, the norm value
, ,
квантованной по логарифмической шкале, может быть определена с помощью Уравнения 8, а деквантованная величина Нормыquantized on a logarithmic scale can be determined using Equation 8, and the dequantized norm value
может быть определена с помощью Уравнения 9.can be determined using Equation 9.
Мат. фиг. 7Mat. FIG. 7
[Мат. 7][Mat. 7]
Мат. фиг. 8Mat. FIG. 8
[Мат. 8][Mat. 8]
Мат. фиг. 9Mat. FIG. 9
[Мат. 9][Mat. 9]
В уравнении 7 sb и eb обозначают начальную выборку и последнюю выборку b-го поддиапазона соответственно.In Equation 7, s b and e b denote the initial sample and the last sample of the bth subband, respectively.
Нормированный спектр yi генерируется делением входного спектраThe normalized spectrum y i is generated by dividing the input spectrum
, ,
на деквантованную величину Нормыdequantized
, ,
как в Уравнении 10, а декодированный спектрas in Equation 10, and the decoded spectrum
генерируется умножением восстановленного нормированного спектраgenerated by multiplying the restored normalized spectrum
на деквантованную величину Нормыdequantized
, ,
как в Уравнении 11.as in Equation 11.
Мат. фиг. 10Mat. FIG. 10
[Мат. 10][Mat. 10]
Мат. фиг. 11Mat. FIG. eleven
[Мат. 11][Mat. eleven]
Член искажения квантования может быть изменен с помощью Уравнения 12 путем использования Уравнений 9-11.The quantization distortion term can be modified using Equation 12 by using Equations 9-11.
Мат. фиг. 12Mat. FIG. 12
[Мат. 12][Mat. 12]
Обычно из соотношения между искажением квантования и распределяемым числом битов определяется, что Отношение сигнал-шум (SNR) увеличивается на 6,02 дБ всякий раз, когда добавляется 1 бит на выборку, и путем использования этого искажение квантования нормированного спектра может описываться Уравнением 13.Typically, from the relationship between quantization distortion and the distributed number of bits, it is determined that the Signal to Noise Ratio (SNR) is increased by 6.02 dB whenever 1 bit is added to the sample, and by using this quantization distortion of the normalized spectrum can be described by Equation 13.
Мат. фиг. 13Mat. FIG. 13
[Мат. 13][Mat. 13]
В случае реального кодирования аудио Уравнение 14 может быть определено применением величины С по шкале в дБ, которая может варьироваться в соответствии с характеристиками сигнала без фиксации соотношения 1 бит/выборкуIn the case of real audio coding, Equation 14 can be determined by applying the C value on a scale in dB, which can vary according to the characteristics of the signal without fixing the ratio of 1 bit / sample
6,025 дБ.6.025 dB
Мат. фиг. 14Mat. FIG. fourteen
[Мат. 14][Mat. fourteen]
В Уравнении 14 в тех случаях, когда С составляет 2, 1 бит/выборку соответствует 6,02 дБ, а когда С составляет 3, 1 бит/выборку соответствует 9,03 дБ.In Equation 14, in cases where C is 2, 1 bit / sample corresponds to 6.02 dB, and when C is 3, 1 bit / sample corresponds to 9.03 dB.
Таким образом, Уравнение 6 может быть представлено Уравнением 15 по Уравнениям 12 и 14.Thus, Equation 6 can be represented by Equation 15 by Equations 12 and 14.
Мат. фиг. 15Mat. FIG. fifteen
[Мат. 15][Mat. fifteen]
Для получения оптимальных Lb и Λ из Уравнения 15 для Lb и Λ выполняется частный дифференциал, как в Уравнении 16.To obtain the optimal L b and Λ from Equation 15, a partial differential is satisfied for L b and Λ, as in Equation 16.
Мат. фиг. 16Mat. FIG. 16
[Мат. 16][Mat. 16]
При упорядочивании членов Уравнения 16 Lb может быть представлено Уравнением 17.When ordering the terms of Equation 16, L b can be represented by Equation 17.
Мат. фиг. 17Mat. FIG. 17
[Мат. 17][Mat. 17]
Путем использования Уравнения 17 распределяемое число Lb битов на выборку каждого поддиапазона, которое может максимизировать SNR входного спектра, может оцениваться в диапазоне общего числа В битов, допустимого в конкретном кадре.By using Equation 17, the allocated number of L b bits per sample of each subband that can maximize the SNR of the input spectrum can be estimated in the range of the total number of B bits allowed in a particular frame.
Распределяемое число битов на основании каждого поддиапазона, которое определяется блоком 250 оценки и распределения битов, может выдаваться в блок кодирования (170 на фиг. 1).A distributed number of bits based on each subband, which is determined by the bit estimator and
Фиг. 3 представляет собой блок-схему блока 300 распределения битов, соответствующего блоку 150 распределения битов в устройстве 100 кодирования аудио на фиг. 1, в соответствии с еще одним примерным вариантом осуществления.FIG. 3 is a block diagram of a
Блок 300 распределения битов на фиг. 3 может включать в себя психоакустическую модель 310, блок 330 оценки и распределения битов, блок 350 оценки масштабного коэффициента и кодер 370 масштабного коэффициента. Компоненты блока 300 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
В соответствии с фиг. 3, психоакустическая модель 310 может получать порог маскирования для каждого поддиапазона путем приема спектра звуковых частот из блока преобразования (130 на фиг. 1).In accordance with FIG. 3, the
Блок 330 оценки и распределения битов может оценивать требуемое для восприятия число битов путем использования порога маскирования на основании каждого поддиапазона. То есть, SMR может вычисляться на основании каждого поддиапазона, а число битов, удовлетворяющее порогу маскирования, может оцениваться путем использования отношения 6,025 дБBlock 330 evaluation and distribution of bits can estimate the number of bits required for perception by using a masking threshold based on each subband. That is, the SMR can be calculated based on each subband, and the number of bits satisfying the masking threshold can be estimated using the ratio of 6.025 dB
1 бит относительно вычисленного SMR. Хотя расчетное число битов представляет собой минимальное число битов, требуемое для того, чтобы перцептуальный шум не воспринимался, поскольку с точки зрения сжатия нет необходимости в использовании числа битов, превышающего расчетное, расчетное число битов может рассматриваться как максимальное число битов, допустимое на основании каждого поддиапазона (в дальнейшем в этом документе - допустимое число битов). Допустимое число битов каждого поддиапазона может быть представлено в единицах с десятичной запятой.1 bit relative to the calculated SMR. Although the estimated number of bits is the minimum number of bits required so that perceptual noise is not perceived, since from the point of view of compression there is no need to use the number of bits that exceeds the calculated one, the estimated number of bits can be considered as the maximum number of bits allowed based on each subband (hereinafter referred to as the allowable number of bits). The permissible number of bits of each subband may be represented in units of decimal point.
Блок 330 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования спектральной энергии на основании каждого поддиапазона. В этом случае, например, может использоваться способ распределения битов с помощью Уравнений 7-20.
Блок 330 оценки и распределения битов сравнивает распределяемое число битов с расчетным числом битов для всех поддиапазонов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.Block 330 evaluation and allocation of bits compares the distributed number of bits with the estimated number of bits for all subbands, and if the distributed number of bits is greater than the estimated number of bits, the distributed number of bits is limited by the estimated number of bits. If the distributed number of bits of all subbands in a particular frame, which is obtained by limiting the number of bits, is less than the total number of B bits allowed in a particular frame, the number of bits corresponding to the difference can be evenly distributed over all subbands or unevenly distributed in accordance with importance for perception .
Блок 350 оценки масштабного коэффициента может оценивать масштабный коэффициент путем использования распределяемого числа битов, окончательно определяемого на основании каждого поддиапазона. Масштабный коэффициент, оцениваемый на основании каждого поддиапазона, может выдаваться в блок кодирования (170 на фиг. 1).The
Кодер 370 масштабного коэффициента может квантовать и без потерь кодировать масштабный коэффициент, оцениваемый на основании каждого поддиапазона. Масштабный коэффициент, кодированный на основании каждого поддиапазона, может выдаваться в блок мультиплексирования (190 на фиг. 1).A
Фиг. 4 представляет собой блок-схему блока 400 распределения битов, соответствующего блоку 150 распределения битов в устройстве 100 кодирования аудио на фиг. 1, в соответствии с еще одним примерным вариантом осуществления.FIG. 4 is a block diagram of a
Блок 400 распределения битов на фиг. 4 может содержать блок 410 оценки Нормы, блок 430 оценки и распределения битов, блок 450 оценки масштабного коэффициента и кодер 470 масштабного коэффициента. Компоненты блока 400 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
В соответствии с фиг. 4, блок 410 оценки Нормы может получать величину Нормы, соответствующую средней спектральной энергии, на основании каждого поддиапазона.In accordance with FIG. 4, the norm estimation unit 410 may obtain a norm value corresponding to the average spectral energy based on each subband.
Блок 430 оценки и распределения битов может получать порог маскирования путем использования спектральной энергии на основании каждого поддиапазона и оценивать требуемое для восприятия число битов, т.е. допустимое число битов путем использования порога маскирования.The bit estimator and bit allocation unit 430 may obtain a masking threshold by using spectral energy based on each subband and estimate the number of bits required for perception, i.e. allowable number of bits by using a masking threshold.
Блок 430 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования спектральной энергии на основании каждого поддиапазона. В этом случае, например, может использоваться способ распределения битов с помощью Уравнений 7-20.Block 430 evaluation and distribution of bits can perform the distribution of bits in units of decimal point by using spectral energy based on each subband. In this case, for example, a bit allocation method using Equations 7-20 can be used.
Блок 430 оценки и распределения битов сравнивает распределяемое число битов с расчетным числом битов для всех поддиапазонов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.The bit estimation and allocation unit 430 compares the distributed number of bits with the estimated number of bits for all subbands, and if the distributed number of bits is greater than the estimated number of bits, the distributed number of bits is limited by the estimated number of bits. If the distributed number of bits of all subbands in a particular frame, which is obtained by limiting the number of bits, is less than the total number of B bits allowed in a particular frame, the number of bits corresponding to the difference can be evenly distributed over all subbands or unevenly distributed in accordance with importance for perception .
Блок 450 оценки масштабного коэффициента может оценивать масштабный коэффициент путем использования распределяемого числа битов, окончательно определяемого на основании каждого поддиапазона. Масштабный коэффициент, оцениваемый на основании каждого поддиапазона, может выдаваться в блок кодирования (170 на фиг. 1).The scale factor estimator 450 may estimate the scale factor by using a distributable number of bits finally determined based on each subband. A scale factor estimated based on each subband may be provided to a coding unit (170 in FIG. 1).
Кодер 470 масштабного коэффициента может квантовать и кодировать без потерь масштабный коэффициент, оцениваемый на основании каждого поддиапазона. Масштабный коэффициент, кодированный на основании каждого поддиапазона, может выдаваться в блок мультиплексирования (190 на фиг. 1).A scale factor encoder 470 can quantize and code losslessly a scale factor estimated based on each subband. A scale factor encoded based on each subband may be provided to the multiplexing unit (190 in FIG. 1).
Фиг. 5 представляет собой блок-схему блока 500 кодирования, соответствующего блоку 170 кодирования в устройстве 100 кодирования аудио на фиг. 1, в соответствии с примерным вариантом осуществления.FIG. 5 is a block diagram of an encoding unit 500 corresponding to an
Блок 500 кодирования на фиг. 5 может содержать блок 510 нормирования спектра и кодер 530 спектра. Компоненты блока 500 кодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The coding unit 500 of FIG. 5 may comprise a
В соответствии с фиг. 5 блок 510 нормирования спектра может нормировать спектр путем использования величины Нормы, выдаваемой с блока распределения битов (150 на фиг. 1).In accordance with FIG. 5, the
Кодер 530 спектра может квантовать нормированный спектр путем использования распределяемого числа битов каждого поддиапазона и без потерь кодировать результат квантования. Например, для спектрального кодирования может использоваться факторное импульсное кодирование, но оно этим не ограничивается. В соответствии с факторным импульсным кодированием такая информация, как положение импульса, амплитуда импульса и знак импульса может быть представлена в факторной форме в пределах диапазона распределяемого числа битов.
Информация, относящаяся к спектру, кодированному с помощью кодера 530 спектра, может выдаваться в блок мультиплексирования (190 на фиг. 1).Information related to the spectrum encoded by the
Фиг. 6 представляет собой блок-схему устройства 600 кодирования аудио в соответствии с еще одним примерным вариантом осуществления.FIG. 6 is a block diagram of an
Устройство 600 кодирования аудио на фиг. 6 может содержать блок 610 обнаружения переходных процессов, блок 630 преобразования, блок 650 распределения битов, блок 670 кодирования и блок 690 мультиплексирования. Компоненты блока 600 кодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора. Поскольку имеется отличие, состоящее в том, что при сравнении устройства 600 кодирования аудио на фиг. 6 с устройством 100 кодирования аудио на фиг. 1 устройство 600 кодирования аудио на фиг. 6 дополнительно содержит блок 610 обнаружения переходных процессов, подробное описание общих компонентов в данном случае не приводится.The
В соответствии с фиг. 6 блок 610 обнаружения переходных процессов может обнаруживать интервал, указывающий характеристику переходного процесса путем анализа аудиосигнала. Для обнаружения интервала переходного процесса могут использоваться различные хорошо известные способы. Сигнальная информация о переходном процессе, выдаваемая с блока 610 обнаружения переходных процессов, может быть включена в битовый поток с помощью блока 690 мультиплексирования.In accordance with FIG. 6, a
Блок 630 преобразования может определять размер окна, используемого для преобразования, в соответствии с результатом обнаружения интервала переходного процесса и выполнять преобразование из временной области в частотную область на основе определенного размера окна. Например, короткое окно может применяться к поддиапазону, из которого обнаруживается интервал переходного процесса, а длинное окно может применяться к поддиапазону, из которого интервал переходного процесса не обнаруживается.
Блок 650 распределения битов может быть реализован с помощью одного из блоков 200, 300 и 400 распределения битов на фиг. 2, 3 и 4 соответственно.A
Блок 670 кодирования может определять размер окна, используемого для кодирования, в соответствии с результатом обнаружения интервала переходного процесса.Block 670 encoding may determine the size of the window used for encoding, in accordance with the result of detecting a transient interval.
Устройство 600 кодирования аудио может генерировать уровень шума для факультативного поддиапазона и выдавать этот уровень шума в устройство декодирования аудио (700 на фиг. 7, 1200 на фиг. 12 или 1300 на фиг. 13).An
Фиг. 7 представляет собой блок-схему устройства 700 декодирования аудио в соответствии с примерным вариантом осуществления.FIG. 7 is a block diagram of an
Устройство 700 декодирования аудио на фиг. 7 может содержать блок 710 демультиплексирования, блок 730 распределения битов, блок 750 декодирования и блок 770 обратного преобразования. Компоненты устройства декодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
В соответствии с фиг. 7 блок 710 демультиплексирования может демультиплексировать битовый поток для извлечения квантованной и кодированной без потерь величины Нормы и информации, относящейся к кодированному спектру.In accordance with FIG. 7, a
Блок 730 распределения битов может получать деквантованную величину Нормы из квантованной и кодированной без потерь величины Нормы на основании каждого поддиапазона и определять распределяемое число битов путем использования деквантованной величины Нормы. Блок 730 распределения битов может работать по существу так же, как блок 150 или 650 распределения битов устройства 100 или 600 кодирования аудио. В тех случаях, когда величина Нормы корректируется с помощью психоакустического взвешивания в устройстве 100 или 600 кодирования аудио, деквантованная величина Нормы может корректироваться с помощью устройства 700 кодирования аудио аналогичным образом.The
Блок 750 декодирования может без потерь кодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока 710 демультиплексирования. Например, для декодирования спектра может использоваться импульсное декодирование.The
Блок 770 обратного преобразования может генерировать восстановленный аудиосигнал путем преобразования декодированного спектра во временную область.The
Фиг. 8 представляет собой блок-схему блока 800 распределения битов в устройстве 700 декодирования аудио на фиг. 7 в соответствии с примерным вариантом осуществления.FIG. 8 is a block diagram of a
Блок 800 распределения битов на фиг. 8 может содержать декодер 810 Нормы и блок 830 оценки и распределения битов. Компоненты блока 800 распределения битов могут быть встроены, по меньшей мере, в один модуль и реализованы, по меньшей мере, с помощью одного процессора.The
В соответствии с фиг. 8 декодер 810 Нормы может получать деквантованную величину Нормы из квантованной и кодированной без потерь величины Нормы, выдаваемой с блока демультиплексирования (710 на фиг. 7).In accordance with FIG. 8, a
Блок 830 оценки и распределения битов может определять распределяемое число битов путем использования деквантованной величины Нормы. А именно, блок 830 оценки и распределения битов может получать порог маскирования путем использования спектральной энергии, т.е. величины Нормы на основании каждого поддиапазона и оценивать требуемое для восприятия число битов, т.е., допустимое число битов путем использования порога маскирования.An estimator and
Блок 830 оценки и распределения битов может выполнять распределение битов в единицах с десятичной запятой путем использования спектральной энергии, т.е. величины Нормы на основании каждого поддиапазона. В этом случае, например, может использоваться способ распределения битов с помощью Уравнений 7-20.Block 830 evaluation and distribution of bits can perform the distribution of bits in units of decimal point by using spectral energy, i.e. Norm values based on each subrange. In this case, for example, a bit allocation method using Equations 7-20 can be used.
Блок 830 оценки и распределения битов сравнивает распределяемое число битов с расчетным числом битов для всех поддиапазонов, и если распределяемое число битов больше расчетного числа битов, распределяемое число битов ограничивается расчетным числом битов. Если распределяемое число битов всех поддиапазонов в конкретном кадре, которое получается в результате ограничения числа битов, меньше общего числа В битов, допустимого в конкретном кадре, число битов, соответствующее разности, может равномерно распределяться во все поддиапазоны или неравномерно распределяться в соответствии с важностью для восприятия.Block 830 evaluation and allocation of bits compares the distributed number of bits with the estimated number of bits for all subbands, and if the distributed number of bits is greater than the estimated number of bits, the distributed number of bits is limited by the estimated number of bits. If the distributed number of bits of all subbands in a particular frame, which is obtained by limiting the number of bits, is less than the total number of B bits allowed in a particular frame, the number of bits corresponding to the difference can be evenly distributed over all subbands or unevenly distributed in accordance with importance for perception .
Фиг. 9 представляет собой блок-схему блока 900 декодирования, соответствующего блоку 750 декодирования в устройстве 700 декодирования аудио на фиг. 7, в соответствии с примерным вариантом осуществления.FIG. 9 is a block diagram of a
Блок 900 декодирования на фиг. 9 может содержать декодер 910 спектра и блок 930 формирования огибающей. Компоненты блока 900 декодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
В соответствии с фиг. 9 декодер 910 спектра может без потерь декодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока демультиплексирования (710 на фиг. 7), и распределяемого числа битов, выдаваемого с блока распределения битов (730 на фиг. 7). Декодированный спектр с декодера 910 спектра представляет собой нормированный спектр.In accordance with FIG. 9, the
Блок 930 формирования огибающей может восстанавливать спектр перед нормированием посредством выполнения формирования огибающей по нормированному спектру, выдаваемому с декодера 910 спектра, путем использования деквантованной величины Нормы, выдаваемой с блока распределения битов (730 на фиг. 7).
Фиг. 10 представляет собой блок-схему блока 1000 декодирования, соответствующего блоку 750 декодирования в устройстве 700 декодирования аудио на фиг. 7 в соответствии с еще одним примерным вариантом осуществления.FIG. 10 is a block diagram of a
Блок 1000 декодирования на фиг. 10 может содержать декодер 1010 спектра, блок 1030 формирования огибающей и блок 1050 заполнения спектра. Компоненты блока 1000 декодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
В соответствии с фиг. 10 декодер 1010 спектра может без потерь декодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока демультиплексирования (710 на фиг. 7), и распределяемого числа битов, выдаваемого с блока распределения битов (730 на фиг. 7). Декодированный спектр с декодера 1010 спектра представляет собой нормированный спектр.In accordance with FIG. 10, the
Блок 1030 формирования огибающей может восстанавливать спектр перед нормированием посредством выполнения формирования огибающей по нормированному спектру, выдаваемому с декодера 1010 спектра, путем использования деквантованной величины Нормы, выдаваемой с блока распределения битов (730 на фиг. 7).The
В тех случаях, когда в спектре, выдаваемом с блока 1030 формирования огибающей, имеется поддиапазон, содержащий деквантованный до 0 элемент, блок 1050 заполнения спектра может заполнять составляющую шума в деквантованном до 0 элементе в этом поддиапазоне. В соответствии с примерным вариантом осуществления составляющая шума может генерироваться случайным образом или генерироваться путем копирования спектра поддиапазона, деквантованного до величины, не равной 0, который расположен рядом с поддиапазоном, содержащим деквантованный до 0 элемент, либо спектра поддиапазона, деквантованного до величины, не равной 0. В соответствии с еще одним примерным вариантом осуществления энергия составляющей шума может корректироваться путем генерирования составляющей шума для поддиапазона, содержащего деквантованный до 0 элемент, и с использованием отношения энергии составляющей шума к деквантованной величине Нормы, выдаваемой с блока распределения битов (730 на фиг. 7), т.е. спектральной энергии. В соответствии с еще одним примерным вариантом осуществления может генерироваться составляющая шума для поддиапазона, содержащего деквантованный до 0 элемент, при этом средняя энергия составляющей шума может корректироваться до 0.In cases where the spectrum outputted from the
Фиг. 11 представляет собой блок-схему блока 1100 декодирования, соответствующего блоку 750 декодирования в устройстве 700 декодирования аудио на фиг. 7, в соответствии с еще одним примерным вариантом осуществления.FIG. 11 is a block diagram of a
Блок 1100 декодирования на фиг. 11 может содержать декодер 1110 спектра, блок 1130 заполнения спектра и блок 1150 формирования огибающей. Компоненты блока 1100 декодирования могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора. Поскольку имеется отличие, состоящее в том, что при сравнении блока 1100 декодирования на фиг. 11 с устройством 1000 декодирования на фиг. 10 компоновка блока 1130 заполнения спектра и блока 1150 формирования огибающей различаются, подробное описание общих компонентов в данном случае не приводится.The
В соответствии с фиг. 11 в тех случаях, когда в нормированном спектре, выдаваемом с декодера 1110 спектра, имеется поддиапазон, содержащий деквантованный до 0 элемент, блок 1130 заполнения спектра может заполнять составляющую шума в деквантованном до 0 элементе в этом поддиапазоне. В этом случае могут использоваться различные способы заполнения шума, применимые к блоку 1050 заполнения шума на фиг. 10. Предпочтительно может генерироваться составляющая шума для поддиапазона, содержащего деквантованный до 0 элемент, при этом средняя энергия составляющей шума может корректироваться до 1.In accordance with FIG. 11 in cases where the normalized spectrum output from the spectrum decoder 1110 has a subband containing the element de-quantized to 0, the
Блок 1150 формирования огибающей может восстанавливать спектр перед нормированием для спектра, содержащего поддиапазон, в котором заполняется составляющая шума, путем использования деквантованной величины Нормы, выдаваемой с блока распределения битов (730 на фиг. 7).
Фиг. 12 представляет собой блок-схему устройства 1200 декодирования аудио в соответствии с еще одним примерным вариантом осуществления.FIG. 12 is a block diagram of an
Устройство 1200 декодирования аудио на фиг. 12 может содержать блок 1210 демультиплексирования, декодер 1230 масштабного коэффициента, декодер 1250 спектра и блок 1270 обратного преобразования. Компоненты устройства 1200 декодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
В соответствии с фиг. 12 блок 1210 демультиплексирования может демультиплексировать битовый поток для извлечения квантованного и кодированного без потерь масштабного коэффициента и информации, относящейся к кодированному спектру.In accordance with FIG. 12, a
Декодер 1230 масштабного коэффициента может без потерь кодировать и деквантовать квантованный и кодированный без потерь масштабный коэффициент на основании каждого поддиапазона.A
Декодер 1250 спектра может без потерь декодировать и деквантовать кодированный спектр путем использования информации, относящейся к кодированному спектру, и деквантованного масштабного коэффициента, выдаваемых с блока 1210 демультиплексирования. Блок 1250 декодирования спектра может содержать те же компоненты, что и блок 1000 декодирования на фиг. 10.The
Блок 1270 обратного преобразования может генерировать восстановленный аудиосигнал путем преобразования спектра, декодированного декодером 1250 спектра, во временную область.The
Фиг. 13 представляет собой блок-схему устройства 1300 декодирования аудио в соответствии с еще одним примерным вариантом осуществления.FIG. 13 is a block diagram of an
Устройство 1300 декодирования аудио на фиг. 13 может содержать блок 1310 демультиплексирования, блок 1330 распределения битов, блок 1350 декодирования и блок 1370 обратного преобразования. Компоненты устройства 1300 декодирования аудио могут быть встроены, по меньшей мере, в один модуль и реализованы с помощью, по меньшей мере, одного процессора.The
Поскольку имеется отличие, состоящее в том, что при сравнении устройства 1300 декодирования аудио на фиг. 13 с устройством 700 декодирования аудио на фиг. 7 сигнальная информация о переходном процессе выдается в блок 1350 декодирования и блок 1370 обратного преобразования, подробное описание общих компонентов в данном случае не приводится.Since there is a difference in that when comparing the
В соответствии с фиг. 13 блок 1350 декодирования может декодировать спектр путем использования информации, относящейся к кодированному спектру и выдаваемой с блока 1310 мультиплексирования. В этом случае размер окна может варьироваться в соответствии с сигнальной информацией о переходном процессе.In accordance with FIG. 13,
Блок 1370 обратного преобразования может генерировать восстановленный аудиосигнал путем преобразования декодированного спектра во временную область. В этом случае размер окна может варьироваться в соответствии с сигнальной информацией о переходном процессе.The
Фиг. 14 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.FIG. 14 is a flowchart illustrating a bit allocation method in accordance with yet another exemplary embodiment.
В соответствии с фиг. 14 при выполнении операции 1410 извлекается спектральная энергия каждого поддиапазона. Спектральная энергия может являться величиной Нормы.In accordance with FIG. 14, in
При выполнении операции 1420 извлекается порог маскирования путем использования спектральной энергии на основании каждого поддиапазона.In
При выполнении операции 1430 оценивается допустимое число битов в единицах с десятичной запятой путем использования порога маскирования на основании каждого поддиапазона.In
При выполнении операции 1440 биты распределяются в единицах с десятичной запятой на основе спектральной энергии на основании каждого поддиапазона.In
При выполнении операции 1450 допустимое число битов сравнивается с распределяемым числом битов на основании каждого поддиапазона.In
При выполнении операции 1460 в том случае, если в результате сравнения при выполнении операции 1450 распределяемое число битов больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов ограничивается допустимым числом битов.In
При выполнении операции 1470 в том случае, если в результате сравнения при выполнении операции 1450 распределяемое число битов не больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов используется, как оно есть, либо окончательное распределяемое число битов определяется для каждого поддиапазона путем использования распределяемого числа битов, ограниченного при выполнении операции 1460.In
Хотя это и не показано, если сумма распределяемого числа битов, определяемого при выполнении операции 1470 для всех поддиапазонов в конкретном кадре, больше или меньше общего числа битов, допустимого в конкретном кадре, число битов, соответствующее разности, может быть равномерно распределено во все поддиапазоны или неравномерно распределено в соответствии с важностью для восприятия.Although not shown, if the sum of the distributed number of bits determined in
Фиг. 15 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.FIG. 15 is a flowchart illustrating a method for allocating bits in accordance with another exemplary embodiment.
В соответствии с фиг. 15 при выполнении операции 1500 извлекается деквантованная величина Нормы каждого поддиапазона.In accordance with FIG. 15, in
При выполнении операции 1510 извлекается порог маскирования путем использования деквантованной величины Нормы на основании каждого поддиапазона.In
При выполнении операции 1520 извлекается SMR путем использования порога маскирования на основании каждого поддиапазона.In
При выполнении операции 1530 допустимое число битов оценивается в единицах с десятичной запятой путем использования SMR на основании каждого диапазона частот.In
При выполнении операции 1540 биты распределяются в единицах с десятичной запятой на основе спектральной энергии (или деквантованной величины Нормы) на основании каждого поддиапазона.In
При выполнении операции 1550 допустимое число битов сравнивается с распределяемым числом битов на основании каждого поддиапазона.In
При выполнении операции 1560 в том случае, если в результате сравнения при выполнении операции 1550 распределяемое число битов больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов ограничивается допустимым числом битов.In
При выполнении операции 1570 в том случае, если в результате сравнения при выполнении операции 1550 распределяемое число битов не больше допустимого числа битов для конкретного поддиапазона, распределяемое число битов используется, как оно есть, либо окончательное распределяемое число битов определяется для каждого поддиапазона путем использования распределяемого числа битов, ограниченного при выполнении операции 1560.In
Хотя это и не показано, если сумма распределяемого числа битов, определяемого при выполнении операции 1570 для всех поддиапазонов в конкретном кадре, меньше или больше общего числа битов, допустимого в конкретном кадре, число битов, соответствующее разности, может быть равномерно распределено во все поддиапазоны или неравномерно распределено в соответствии с перцептуальной важностью.Although not shown, if the sum of the distributed number of bits determined in
Фиг. 16 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.FIG. 16 is a flowchart illustrating a bit allocation method in accordance with yet another exemplary embodiment.
В соответствии с фиг. 16 при выполнении операции 1610 выполняется инициализация. В качестве примера инициализации, когда распределяемое число битов для каждого поддиапазона оценивается путем использования Уравнения 20, общая сложность может быть уменьшена путем вычисления постоянной величины:In accordance with FIG. 16, in
для всех поддиапазонов.for all subbands.
При выполнении операции 1620 распределяемое число битов для каждого поддиапазона оценивается в единицах с десятичной запятой путем использования Уравнения 17. Распределяемое число битов для каждого поддиапазона может быть получено умножением распределяемого числа Lb битов на выборку на число выборок на каждый поддиапазон. В тех случаях, когда распределяемое число Lb битов на выборку каждого поддиапазона вычисляется путем использования Уравнения 17, Lb может иметь значение менее 0. В этом случае 0 распределяется в число Lb, имеющее значение менее 0, как в Уравнении 18.In
Мат. фиг. 18Mat. FIG. eighteen
[Мат. 18][Mat. eighteen]
В результате сумма распределяемого числа битов, оцениваемых для всех поддиапазонов, входящих в конкретный кадр, может быть больше, чем число В битов, допустимое в конкретном кадре.As a result, the sum of the distributed number of bits estimated for all subbands included in a particular frame may be greater than the number of B bits allowed in a particular frame.
При выполнении операции 1630 сумма распределяемого числа битов, оцениваемых для всех поддиапазонов, входящих в конкретный кадр, сравнивается с числом В битов, допустимым в конкретном кадре.In
При выполнении операции 1640 биты перераспределяются для каждого поддиапазона с помощью Уравнения 19 до тех пор, пока сумма распределяемого числа битов, оцениваемого для всех поддиапазонов, входящих в конкретный кадр, не будет такой же, как число В битов, допустимое в конкретном кадре.In
Мат. фиг. 19Mat. FIG. 19
[Мат. 19][Mat. 19]
В Уравнении 19In Equation 19
означает число битов, определяемое (k-1)-м повторением, аmeans the number of bits determined by the (k-1) th repetition, and
означает число битов, определяемое k-м повторением. Число битов, определяемое каждым повторением, должно быть не менее 0, и, соответственно, операция 1640 выполняется для всех поддиапазонов, имеющих число битов, большее 0.means the number of bits determined by the kth repetition. The number of bits determined by each repetition must be at least 0, and accordingly,
При выполнении операции 1650 в том случае, если в результате сравнения при выполнении операции 1630 сумма распределяемого числа битов, оцениваемого для всех поддиапазонов, входящих в конкретный кадр, является той же, что и число В битов, допустимое в конкретном кадре, распределяемое число битов каждого поддиапазона используется, как оно есть, либо окончательное распределяемое число битов определяется для каждого поддиапазона путем использования распределяемого числа битов каждого поддиапазона, которое получено в результате перераспределения при выполнении операции 1640.In
Фиг. 17 представляет собой блок-схему алгоритма, иллюстрирующую способ распределения битов в соответствии с еще одним примерным вариантом осуществления.FIG. 17 is a flowchart illustrating a bit allocation method in accordance with yet another exemplary embodiment.
В соответствии с фиг. 17 так же, как и при выполнении операции 1610 на фиг. 16, при выполнении операции 1710 выполняется инициализация. Так же, как и при выполнении операции 1620 на фиг. 16, при выполнении операции 1720 распределяемое число битов для каждого поддиапазона оценивается в единицах с десятичной запятой, а когда распределяемое число Lb битов на выборку для каждого поддиапазона меньше 0, 0 распределяется в число Lb, имеющее значение меньше 0, как в Уравнении 18.In accordance with FIG. 17 as in
При выполнении операции 1730 минимальное число битов, требуемое для каждого поддиапазона, определяется с точки зрения SNR, а распределяемое число битов при выполнении операции 1720, большее 0 и меньшее минимального числа битов, корректируется путем ограничения распределяемого числа битов минимальным числом битов. В связи с этим, благодаря ограничению распределяемого числа битов каждого поддиапазона минимальным числом битов может быть уменьшена возможность снижения качества звучания. Например, минимальное число битов, требуемое для каждого поддиапазона, определяется как минимальное число битов, требуемое для импульсного кодирования при факторном импульсном кодировании. Факторное импульсное кодирование представляет сигнал путем использования всех комбинаций положения импульса, не равного 0, амплитуды импульса и знака импульса. В этом случае случайное число N всех комбинаций, которые могут представлять импульс, может быть представлено Уравнением 20.In
Мат. фиг. 20Mat. FIG. twenty
[Мат. 20][Mat. twenty]
В Уравнении 20 2i означает случайное число знаков, представимое с помощью +/- для сигналов в i ненулевых положениях.In Equation 20 2 i means a random number of characters represented by +/- for signals in i non-zero positions.
В Уравнении 20 F(n,i) может быть определено с помощью Уравнения 21 и означает случайное число для выбора i ненулевых положений для конкретных n выборок, т.е. положений.In Equation 20, F (n, i) can be determined using Equation 21 and means a random number for choosing i non-zero positions for specific n samples, i.e. provisions.
Мат. фиг. 21Mat. FIG. 21
[Мат. 21][Mat. 21]
В Уравнении 20 D(m,i) может быть представлено с помощью Уравнения 22 и означает случайное число для представления сигналов, выбираемых в i ненулевых положениях с помощью m амплитуд.In Equation 20, D (m, i) can be represented using Equation 22 and means a random number to represent signals selected at i non-zero positions using m amplitudes.
Мат. фиг. 22Mat. FIG. 22
[Мат. 22][Mat. 22]
Число М битов, требуемое для представления N комбинаций, может быть представлено с помощью Уравнения 23.The number of M bits required to represent N combinations can be represented using Equation 23.
Мат. фиг. 23Mat. FIG. 23
[Мат. 23][Mat. 23]
M=[log2 N] M = [log 2 N ]
В результате минимальное числоAs a result, the minimum number
битов, требуемое для кодирования не менее 1 импульса для Nb выборок в конкретном b-м поддиапазоне, может быть представлено Уравнением 24.the bits required to encode at least 1 pulse for N b samples in a particular bth subband may be represented by Equation 24.
Мат. фиг. 24Mat. FIG. 24
[Мат. 24][Mat. 24]
В этом случае число битов, используемое для передачи величины коэффициента усиления, требуемой для квантования, может быть добавлено к минимальному числу битов, требуемому при факторном импульсном кодировании, и может варьироваться в соответствии со скоростью передачи битов. Минимальное число битов, требуемое на основании каждого поддиапазона, может определяться большей величиной из минимального числа битов, требуемого при факторном импульсном кодировании, и числа Nb выборок конкретного поддиапазона, как в Уравнении 25. Например, минимальное число битов, требуемое на основании каждого поддиапазона, может быть установлено равным 1 биту на выборку.In this case, the number of bits used to transmit the magnitude of the gain required for quantization can be added to the minimum number of bits required by factorial pulse coding, and can vary in accordance with the bit rate. The minimum number of bits required based on each subband may be determined by a larger value from the minimum number of bits required by factorization coding and the number N b of samples of a particular subband, as in Equation 25. For example, the minimum number of bits required based on each subband, can be set to 1 bit per sample.
Мат. фиг. 25Mat. FIG. 25
[Мат. 25][Mat. 25]
В тех случаях, когда при выполнении операции 1730 используемых битов недостаточно, поскольку целевая скорость передачи битов мала, для диапазона, для которого распределяемое число битов больше 0 и меньше минимального числа битов, распределяемое число битов удаляется и устанавливается на 0. Кроме того, для поддиапазона, для которого распределяемое число битов меньше, чем в Уравнении 24, распределяемое число битов может быть удалено, а для поддиапазона, для которого распределяемое число битов больше, чем в Уравнении 24, и меньше, чем минимальное число битов в Уравнении 25, может быть распределено минимальное число битов.In cases where, in
При выполнении операции 1740 сумма распределяемого числа битов, оцениваемая для всех поддиапазонов в конкретном кадре, сравнивается с числом битов, допустимым в конкретном кадре.In
При выполнении операции 1750 биты перераспределяются для поддиапазона, в который распределяется более чем минимальное число битов, до тех пор, пока сумма распределяемого числа битов, оцениваемых для всех поддиапазонов в конкретном кадре, не будет такой же, как число битов, допустимое в конкретном кадре.In
При выполнении операции 1760 определяется, изменяется ли распределяемое число битов каждого поддиапазона между предыдущим повторением и текущим повторением для перераспределения битов. Если распределяемое число битов каждого поддиапазона не изменяется между предыдущим повторением и текущим повторением для перераспределения битов либо до тех пор, пока сумма распределяемого числа битов, оцениваемая для всех поддиапазонов в конкретном кадре, не станет такой же, как число битов, допустимое в конкретном кадре, выполняются операции 1740-1760.In
При выполнении операции 1770 в том случае, если в результате определения при выполнении операции 1760 распределяемое число битов каждого поддиапазона не изменяется между предыдущим повторением и текущим повторением для перераспределения битов, биты последовательно удаляются от верхнего поддиапазона до нижнего поддиапазона, и операции 1740 - 1760 выполняются до тех пор, пока число битов, допустимое в конкретном кадре не будет приемлемым. Кроме того, если распределяемое число битов не больше минимального числа битов в Уравнении 25 для всех поддиапазонов, а сумма распределяемого числа битов больше числа битов, допустимого в конкретном кадре, распределяемое число битов может быть удалено из высокочастотного диапазона в низкочастотный диапазон.In step 1770, if, as a result of the determination in
В соответствии со способами распределения битов на фиг. 16 и 17 для распределения битов в каждый поддиапазон после того, как начальные биты распределены в каждый поддиапазон в порядке спектральной энергии или взвешенной спектральной энергии, число битов, требуемое для каждого поддиапазона, может оцениваться немедленно без повторения операции поиска спектральной энергии или взвешенной спектральной энергии в течение нескольких раз. Кроме того, благодаря перераспределению битов в каждый поддиапазон до тех пор, пока сумма распределяемого числа битов, оцениваемая для всех поддиапазонов в конкретном кадре, не станет такой же, как число битов, допустимое в конкретном кадре, возможно эффективное распределение битов. Кроме того, благодаря обеспечению минимального числа битов в произвольном поддиапазоне может быть предотвращено образование спектрального провала, возникающего из-за того, что ввиду распределения малого числа битов достаточное число спектральных выборок или импульсов не может кодироваться.In accordance with the bit allocation methods of FIG. 16 and 17 for distributing bits to each subband after the initial bits are allocated to each subband in order of spectral energy or weighted spectral energy, the number of bits required for each subband can be estimated immediately without repeating the operation of searching for spectral energy or weighted spectral energy in for several times. In addition, by redistributing the bits into each subband until the sum of the allocated number of bits estimated for all subbands in a particular frame becomes the same as the number of bits allowed in a particular frame, an efficient bit allocation is possible. In addition, by ensuring a minimum number of bits in an arbitrary subband, the formation of a spectral dip can be prevented due to the fact that, due to the distribution of a small number of bits, a sufficient number of spectral samples or pulses cannot be encoded.
Способы на фиг. 14-17 могут программироваться и могут осуществляться с помощью, по меньшей мере, одного устройства обработки, например, центрального процессора (ЦП).The methods of FIG. 14-17 may be programmed and may be implemented using at least one processing device, for example, a central processing unit (CPU).
Фиг. 18 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования, в соответствии с примерным вариантом осуществления.FIG. 18 is a block diagram of a multimedia device comprising an encoding module in accordance with an exemplary embodiment.
В соответствии с фиг. 18 мультимедийное устройство 1800 может содержать блок 1810 связи и модуль 1830 кодирования. Кроме того, мультимедийное устройство 1800 может дополнительно содержать блок 1850 памяти для хранения битового потока аудио, получаемого в результате кодирования в соответствии с применением битового потока аудио. Кроме того, мультимедийное устройство 1800 может дополнительно содержать микрофон 1870. То есть, блок 1850 памяти и микрофон 1870 могут содержаться факультативно. Мультимедийное устройство 1800 может дополнительно содержать произвольный модуль декодирования (не показан), например, модуль декодирования для выполнения общей функции декодирования или модуль декодирования в соответствии с примерным вариантом осуществления. Модуль 1830 кодирования может быть реализован с помощью, по меньшей мере, одного процессора, например, центрального процессора (не показан) посредством объединения с другими компонентами (не показаны), входящими в состав мультимедийного устройства 1800 как единого целого.In accordance with FIG. 18,
Блок 1810 связи может принимать, по меньшей мере, один из аудиосигнала или кодированного битового потока извне или передавать, по меньшей мере, один из восстановленного аудиосигнала или кодированного битового потока, получаемого в результате кодирования с помощью модуля 1830 кодирования.The
Блок 1810 связи выполнен с возможностью передачи и приема данных на внешнее мультимедийное устройство и с него с помощью беспроводной сети, такой как беспроводной Интернет, беспроводной интранет, беспроводная телефонная сеть, беспроводная Локальная сеть (LAN), Wi-Fi, Wi-Fi Direct (WFD), третье поколение (3G), четвертое поколение (4G), Bluetooth, Ассоциация по инфракрасной технологии передачи данных (IrDA), Радиочастотная идентификация (RFID), Сверхширокая полоса пропускания (UWB), Zigbee, либо Беспроводной связи ближнего радиуса действия (NFC), либо проводной сети, такой как проводная телефонная сеть или проводной Интернет.The
В соответствии с примерным вариантом осуществления, модуль 1830 кодирования может генерировать битовый поток путем преобразования аудиосигнала во временной области, который создается посредством блока 1810 связи или микрофона 1870, в спектр звуковых частот в частотной области, определения распределяемого числа битов в единицах с десятичной запятой на основании диапазонов частот таким образом, что SNR спектра, имеющегося в заданном диапазоне частот, максимизируется в пределах диапазона числа битов, допустимого в конкретном кадре спектра звуковых частот, корректировки распределяемого числа битов, определяемого на основании диапазонов частот, и кодирования спектра звуковых частот путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии.According to an exemplary embodiment, the encoding module 1830 can generate a bitstream by converting the audio signal in the time domain, which is generated by the
В соответствии с примерным вариантом осуществления, модуль 1830 кодирования может генерировать битовый поток путем преобразования аудиосигнала во временной области, который создается посредством блока 1810 связи или микрофона 1870, в спектр звуковых частот в частотной области, оценки допустимого числа битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр спектра звуковых частот, оценки распределяемого числа битов в единицах с десятичной запятой путем использования спектральной энергии, корректировки распределяемого числа битов таким образом, чтобы оно не превышало допустимое число битов, и кодирования спектра звуковых частот путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии.According to an exemplary embodiment, the encoding module 1830 can generate a bitstream by converting an audio signal in the time domain, which is generated by the
Блок 1850 памяти может хранить кодированный звуковой поток, генерируемый модулем 1830 кодирования. Кроме того, блок 1850 памяти может хранить различные программы, требуемые для работы мультимедийного устройства 1800.The
Микрофон 1870 может выдавать аудиосигнал от пользователя или внешней среды в модуль 1830 кодирования.
Фиг. 19 представляет собой блок-схему мультимедийного устройства, содержащего модуль декодирования, в соответствии с примерным вариантом осуществления.FIG. 19 is a block diagram of a multimedia device comprising a decoding module in accordance with an exemplary embodiment.
Мультимедийное устройство 1900 на фиг. 19 может содержать блок 1910 связи и модуль 1930 декодирования. Кроме того, в соответствии с использованием восстановленного аудиосигнала, получаемого в качестве результата декодирования, мультимедийное устройство 1900 на фиг. 19 может дополнительно содержать блок 1950 памяти для хранения восстановленного аудиосигнала. Кроме того, мультимедийное устройство 1800 может дополнительно содержать громкоговоритель 1970. То есть, блок 1950 памяти и громкоговоритель 1970 являются факультативными. Мультимедийное устройство 1900 на фиг. 19 может дополнительно содержать модуль кодирования (не показан), например, модуль кодирования для выполнения общей функции кодирования или модуль кодирования в соответствии с примерным вариантом осуществления. Модуль 1930 декодирования может быть объединен с другими компонентами (не показаны), входить в состав мультимедийного устройства 1900 и реализован с помощью, по меньшей мере, одного процессора, например, центрального процессора (ЦП).The
В соответствии с фиг. 19 блок 1910 связи может принимать, по меньшей мере, один из аудиосигнала или кодированного битового потока извне или может передавать, по меньшей мере, один из восстановленного аудиосигнала, получаемого в результате декодирования модулем 1930 декодирования, или битового потока аудио, получаемого в результате кодирования. Блок 1910 связи может быть реализован по существу аналогично блоку 1810 связи на фиг. 18.In accordance with FIG. 19, the
В соответствии с примерным вариантом осуществления модуль 1930 декодирования может генерировать восстановленный аудиосигнал путем приема битового потока, создаваемого посредством блока 1910 связи, определения распределяемого числа битов в единицах с десятичной запятой на основании диапазонов частот таким образом, что SNR спектра, имеющегося в каждом диапазоне частот, максимизируется в пределах диапазона допустимого числа битов в конкретном кадре, корректировки распределяемого числа битов, определяемого на основании диапазонов частот, декодирования спектра звуковых частот, входящего в битовый поток, путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии, и преобразования декодированного спектра звуковых частот в аудиосигнал во временной области.According to an exemplary embodiment, the
В соответствии с еще одним примерным вариантом осуществления, модуль 1930 декодирования может генерировать битовый поток путем приема битового потока, создаваемого посредством блока 1910 связи, оценки допустимого числа битов в единицах с десятичной запятой путем использования порога маскирования на основании диапазонов частот, входящих в конкретный кадр, оценки распределяемого числа битов в единицах с десятичной запятой путем использования спектральной энергии, корректировки распределяемого числа битов таким образом, чтобы оно не превышало допустимое число битов, декодирования спектра звуковых частот, входящего в битовый поток, путем использования числа битов, корректируемого на основании диапазонов частот и спектральной энергии, и преобразования декодированного спектра звуковых частот в аудиосигнал во временной области.According to another exemplary embodiment, the
Блок 1950 памяти может хранить восстановленный аудиосигнал, генерируемый модулем 1930 декодирования. Кроме того, блок 1950 памяти может хранить различные программы, требуемые для работы мультимедийного устройства 1900.The
Громкоговоритель 1970 может выдавать восстановленный аудиосигнал, генерируемый модулем 1930 декодирования, во внешнюю среду.
Фиг. 20 представляет собой блок-схему мультимедийного устройства, содержащего модуль кодирования и модуль декодирования, в соответствии с примерным вариантом осуществления.FIG. 20 is a block diagram of a multimedia device comprising an encoding module and a decoding module, in accordance with an exemplary embodiment.
Мультимедийное устройство 2000, изображенное на фиг. 20, может содержать блок 2010 связи, модуль 2020 кодирования и модуль 2030 декодирования. Кроме того, мультимедийное устройство 2000 может дополнительно содержать блок 2040 памяти для хранения битового потока аудио, получаемого в результате кодирования, или восстановленного аудиосигнала, получаемого в результате декодирования, в соответствии с применением битового потока аудио или восстановленного аудиосигнала. Кроме того, мультимедийное устройство 2000 может дополнительно содержать микрофон 2050 и/или громкоговоритель 2060. Модуль 2020 кодирования и модуль 2030 декодирования могут быть реализованы с помощью, по меньшей мере, одного процессора, например, центрального процессора (ЦП) (не показан) посредством объединения с другими компонентами (не показаны), входящими в состав мультимедийного устройства 2000 как единого целого.The
Поскольку компоненты мультимедийного устройства 2000, изображенного на фиг. 20, соответствуют компонентам мультимедийного устройства 1800, изображенного на фиг. 18, или компонентам мультимедийного устройства 1900, изображенного на фиг. 19, их подробное описание не приводится.Since the components of the
Каждое из мультимедийных устройств 1800, 1900 и 2000, изображенных на фиг. 18, 19 и 20, может содержать оконечное устройство только речевой связи, такое как телефон или мобильный телефон, устройство только широковещания или передачи музыки, такое как телевизор или MP3-проигрыватель, либо гибридное оконечное устройство из оконечного устройства только речевой связи и устройства только широковещания или передачи, но не ограничивается перечисленным. Кроме того, каждое из мультимедийных устройств 1800, 1900 и 2000 может использоваться в качестве клиента, сервера или преобразователя, расположенного между клиентом и сервером.Each of the
В тех случаях, когда мультимедийное устройство 1800, 1900 или 2000 является, например, мобильным телефоном, хотя он и не показан, мультимедийное устройство 1800, 1900 или 2000 может дополнительно содержать блок ввода пользователя, такой как клавиатура, блок отображения для отображения информации, обрабатываемой пользовательским интерфейсом или мобильным телефоном, и процессор для управления функциями мобильного телефона. Кроме того, мобильный телефон может дополнительно содержать блок камеры, имеющий функцию формирования изображений, и, по меньшей мере, один компонент для выполнения функции, требуемой для мобильного телефона.In cases where the
В тех случаях, когда мультимедийное устройство 1800, 1900 или 2000 является, например, телевизором, хотя он и не показан, мультимедийное устройство 1800, 1900 или 2000 может дополнительно содержать блок ввода пользователя, такой как клавиатура, блок отображения для отображения принимаемой широковещательной информации и процессор для управления всеми функциями телевизора. Кроме того, телевизор может дополнительно содержать, по меньшей мере, один компонент для выполнения функции телевизора.In cases where the
Способы в соответствии с этими примерами осуществления могут быть записаны в виде компьютерных программ и могут быть реализованы в универсальных цифровых компьютерах, которые исполняют программы с помощью машиночитаемого носителя записи. Кроме того, структуры данных, программные команды или массивы данных, применимые в этих примерных вариантах осуществления, могут быть записаны на машиночитаемом носителе записи различными способами. Машиночитаемый носитель записи представляет собой любое устройство хранения данных, способное хранить данные, которые могут после этого считываться вычислительной системой. К примерам машиночитаемого носителя записи относятся магнитные носители, такие как жесткие диски, гибкие диски и магнитные ленты, оптические носители, такие как CD-ROM и DVD, и магнитооптические носители, такие как флоптические диски, и аппаратные устройства, такие как постоянное запоминающее устройство (ПЗУ), оперативное запоминающее устройство (ОЗУ) и флэш-память, в частности, выполненные с возможностью хранения и исполнения программных команд. Кроме того, машиночитаемый носитель записи может представлять собой передающую среду для передачи сигнала, в котором предусматриваются программная команда и структура данных. Программные команды могут содержать машинные коды, редактируемые компилятором, и коды на языке высокого уровня, исполнимые компьютером с помощью интерпретатора.The methods in accordance with these embodiments may be recorded in the form of computer programs and may be implemented in universal digital computers that execute programs using a computer-readable recording medium. In addition, data structures, program instructions, or data arrays applicable in these exemplary embodiments may be recorded on a computer-readable recording medium in various ways. A computer-readable recording medium is any data storage device capable of storing data that can then be read by a computing system. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magneto-optical media such as floppy disks, and hardware devices such as read-only memory ( ROM), random access memory (RAM) and flash memory, in particular, configured to store and execute program instructions. In addition, the computer-readable recording medium may be a transmission medium for transmitting a signal in which a program instruction and data structure are provided. Program instructions may contain machine codes edited by the compiler and high-level language codes executed by a computer using an interpreter.
Несмотря на то, что настоящая идея изобретения подробно изображена и описана со ссылкой на ее примерные варианты осуществления, специалистам должно быть ясно, что в ней возможны различные изменения в форме и деталях в пределах сущности и объема настоящей идеи изобретения, определяемой нижеследующей формулой изобретения.Despite the fact that the present idea of the invention is depicted and described in detail with reference to its exemplary embodiments, it should be clear to those skilled in the art that various changes in form and detail are possible within the spirit and scope of the present invention as defined by the following claims.
Claims (18)
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161485741P | 2011-05-13 | 2011-05-13 | |
US61/485,741 | 2011-05-13 | ||
US201161495014P | 2011-06-09 | 2011-06-09 | |
US61/495,014 | 2011-06-09 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013155482A Division RU2648595C2 (en) | 2011-05-13 | 2012-05-14 | Bit distribution, audio encoding and decoding |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018108586A RU2018108586A (en) | 2019-02-26 |
RU2018108586A3 RU2018108586A3 (en) | 2019-04-24 |
RU2705052C2 true RU2705052C2 (en) | 2019-11-01 |
Family
ID=47141906
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018108586A RU2705052C2 (en) | 2011-05-13 | 2012-05-14 | Bit allocation, audio encoding and decoding |
RU2013155482A RU2648595C2 (en) | 2011-05-13 | 2012-05-14 | Bit distribution, audio encoding and decoding |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013155482A RU2648595C2 (en) | 2011-05-13 | 2012-05-14 | Bit distribution, audio encoding and decoding |
Country Status (15)
Country | Link |
---|---|
US (7) | US9236057B2 (en) |
EP (5) | EP2707875A4 (en) |
JP (3) | JP6189831B2 (en) |
KR (7) | KR102053900B1 (en) |
CN (3) | CN105825859B (en) |
AU (3) | AU2012256550B2 (en) |
BR (1) | BR112013029347B1 (en) |
CA (1) | CA2836122C (en) |
MX (3) | MX2013013261A (en) |
MY (2) | MY186720A (en) |
RU (2) | RU2705052C2 (en) |
SG (1) | SG194945A1 (en) |
TW (5) | TWI576829B (en) |
WO (2) | WO2012157931A2 (en) |
ZA (1) | ZA201309406B (en) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100266989A1 (en) | 2006-11-09 | 2010-10-21 | Klox Technologies Inc. | Teeth whitening compositions and methods |
RU2705052C2 (en) | 2011-05-13 | 2019-11-01 | Самсунг Электроникс Ко., Лтд. | Bit allocation, audio encoding and decoding |
AU2012276367B2 (en) | 2011-06-30 | 2016-02-04 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
US8586847B2 (en) * | 2011-12-02 | 2013-11-19 | The Echo Nest Corporation | Musical fingerprinting based on onset intervals |
US11116841B2 (en) | 2012-04-20 | 2021-09-14 | Klox Technologies Inc. | Biophotonic compositions, kits and methods |
CN103854653B (en) | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | The method and apparatus of signal decoding |
WO2014091694A1 (en) | 2012-12-13 | 2014-06-19 | パナソニック株式会社 | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method |
CN103107863B (en) * | 2013-01-22 | 2016-01-20 | 深圳广晟信源技术有限公司 | Digital audio source coding method and device with segmented average code rate |
EP3761312B1 (en) * | 2013-01-29 | 2024-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in perceptual transform audio coding |
US20140276354A1 (en) | 2013-03-14 | 2014-09-18 | Klox Technologies Inc. | Biophotonic materials and uses thereof |
CN108198564B (en) | 2013-07-01 | 2021-02-26 | 华为技术有限公司 | Signal encoding and decoding method and apparatus |
EP3614381A1 (en) * | 2013-09-16 | 2020-02-26 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
MX355452B (en) * | 2013-10-31 | 2018-04-18 | Fraunhofer Ges Forschung | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain. |
WO2015129165A1 (en) * | 2014-02-28 | 2015-09-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device |
CN104934034B (en) | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | Method and apparatus for signal processing |
PL3550563T3 (en) | 2014-03-31 | 2024-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, encoding method, decoding method, and associated programs |
CN105336339B (en) | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | A kind for the treatment of method and apparatus of voice frequency signal |
US9361899B2 (en) * | 2014-07-02 | 2016-06-07 | Nuance Communications, Inc. | System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal |
EP3176780A4 (en) | 2014-07-28 | 2018-01-17 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus and signal decoding method and apparatus |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
CN105957533B (en) * | 2016-04-22 | 2020-11-10 | 杭州微纳科技股份有限公司 | Voice compression method, voice decompression method, audio encoder and audio decoder |
CN106782608B (en) * | 2016-12-10 | 2019-11-05 | 广州酷狗计算机科技有限公司 | Noise detecting method and device |
CN108174031B (en) * | 2017-12-26 | 2020-12-01 | 上海展扬通信技术有限公司 | Volume adjusting method, terminal equipment and computer readable storage medium |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
US10580424B2 (en) * | 2018-06-01 | 2020-03-03 | Qualcomm Incorporated | Perceptual audio coding as sequential decision-making problems |
CN108833324B (en) * | 2018-06-08 | 2020-11-27 | 天津大学 | HACO-OFDM system receiving method based on time domain amplitude limiting noise elimination |
CN108922556B (en) * | 2018-07-16 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | Sound processing method, device and equipment |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
CN110265043B (en) * | 2019-06-03 | 2021-06-01 | 同响科技股份有限公司 | Adaptive lossy or lossless audio compression and decompression calculation method |
CN114514575A (en) | 2019-11-01 | 2022-05-17 | 三星电子株式会社 | Hub device, multi-device system including hub device and plurality of devices, and operation method of hub device and multi-device system |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0591061A (en) * | 1991-09-30 | 1993-04-09 | Sony Corp | Audio signal processing meth0d |
JPH05114863A (en) * | 1991-08-27 | 1993-05-07 | Sony Corp | High-efficiency encoding device and decoding device |
JPH09214355A (en) * | 1996-01-30 | 1997-08-15 | Sony Corp | Signal coding method |
RU2224302C2 (en) * | 1997-04-02 | 2004-02-20 | Самсунг Электроникс Ко., Лтд. | Method and device for scalable audio-signal coding/decoding |
JP2005265865A (en) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | Method and device for bit allocation for audio encoding |
RU2289858C2 (en) * | 2002-06-27 | 2006-12-20 | Самсунг Электроникс Ко., Лтд. | Method and device for encoding an audio signal with usage of harmonics extraction |
US7457742B2 (en) * | 2003-01-08 | 2008-11-25 | France Telecom | Variable rate audio encoder via scalable coding and enhancement layers and appertaining method |
US7734053B2 (en) * | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
US7752041B2 (en) * | 2004-05-28 | 2010-07-06 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding digital signal |
JP5114863B2 (en) * | 2006-04-11 | 2013-01-09 | 横浜ゴム株式会社 | Pneumatic tire and method for assembling pneumatic tire |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
JPH03181232A (en) * | 1989-12-11 | 1991-08-07 | Toshiba Corp | Variable rate encoding system |
JP2560873B2 (en) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | Orthogonal transform coding Decoding method |
JPH0414355A (en) | 1990-05-08 | 1992-01-20 | Matsushita Electric Ind Co Ltd | Ringer signal transmission method for private branch of exchange |
JPH04168500A (en) * | 1990-10-31 | 1992-06-16 | Sanyo Electric Co Ltd | Signal coding method |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
JP3153933B2 (en) * | 1992-06-16 | 2001-04-09 | ソニー株式会社 | Data encoding device and method and data decoding device and method |
JPH06348294A (en) * | 1993-06-04 | 1994-12-22 | Sanyo Electric Co Ltd | Band dividing and coding device |
TW271524B (en) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5893065A (en) * | 1994-08-05 | 1999-04-06 | Nippon Steel Corporation | Apparatus for compressing audio data |
KR0144011B1 (en) * | 1994-12-31 | 1998-07-15 | 김주용 | Mpeg audio data high speed bit allocation and appropriate bit allocation method |
DE19638997B4 (en) * | 1995-09-22 | 2009-12-10 | Samsung Electronics Co., Ltd., Suwon | Digital audio coding method and digital audio coding device |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3181232B2 (en) | 1996-12-19 | 2001-07-03 | 立川ブラインド工業株式会社 | Roll blind screen mounting device |
JP3328532B2 (en) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | Digital data encoding method |
JP3802219B2 (en) * | 1998-02-18 | 2006-07-26 | 富士通株式会社 | Speech encoding device |
JP3515903B2 (en) * | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | Dynamic bit allocation method and apparatus for audio coding |
JP4168500B2 (en) | 1998-11-04 | 2008-10-22 | 株式会社デンソー | Semiconductor device and mounting method thereof |
JP2000148191A (en) * | 1998-11-06 | 2000-05-26 | Matsushita Electric Ind Co Ltd | Coding device for digital audio signal |
TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
JP2000293199A (en) * | 1999-04-05 | 2000-10-20 | Nippon Columbia Co Ltd | Voice coding method and recording and reproducing device |
US6687663B1 (en) * | 1999-06-25 | 2004-02-03 | Lake Technology Limited | Audio processing method and apparatus |
US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP2002006895A (en) * | 2000-06-20 | 2002-01-11 | Fujitsu Ltd | Method and device for bit assignment |
JP4055336B2 (en) * | 2000-07-05 | 2008-03-05 | 日本電気株式会社 | Speech coding apparatus and speech coding method used therefor |
JP4190742B2 (en) * | 2001-02-09 | 2008-12-03 | ソニー株式会社 | Signal processing apparatus and method |
JP2004522198A (en) | 2001-05-08 | 2004-07-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Audio coding method |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7272566B2 (en) * | 2003-01-02 | 2007-09-18 | Dolby Laboratories Licensing Corporation | Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique |
JP2005202248A (en) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | Audio encoding device and frame region allocating circuit of audio encoding device |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
US7979721B2 (en) * | 2004-11-15 | 2011-07-12 | Microsoft Corporation | Enhanced packaging for PC security |
CN1780278A (en) * | 2004-11-19 | 2006-05-31 | 松下电器产业株式会社 | Self adaptable modification and encode method and apparatus in sub-carrier communication system |
KR100657948B1 (en) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | Speech enhancement apparatus and method |
DE202005010080U1 (en) | 2005-06-27 | 2006-11-09 | Pfeifer Holding Gmbh & Co. Kg | Connector for connecting concrete parts with transverse strength has floor profiled with groups of projections and recesses alternating in longitudinal direction, whereby each group has at least one projection and/or at least one recess |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
JP2007264154A (en) * | 2006-03-28 | 2007-10-11 | Sony Corp | Audio signal coding method, program of audio signal coding method, recording medium in which program of audio signal coding method is recorded, and audio signal coding device |
SG136836A1 (en) * | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
JP4823001B2 (en) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | Audio encoding device |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
KR101291672B1 (en) * | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | Apparatus and method for encoding and decoding noise signal |
PL3591650T3 (en) * | 2007-08-27 | 2021-07-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and device for filling of spectral holes |
WO2009029035A1 (en) * | 2007-08-27 | 2009-03-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Improved transform coding of speech and audio signals |
CN101239368A (en) | 2007-09-27 | 2008-08-13 | 骆立波 | Special-shaped cover leveling mold and leveling method thereby |
CN101849257B (en) * | 2007-10-17 | 2016-03-30 | 弗劳恩霍夫应用研究促进协会 | Use the audio coding of lower mixing |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
ATE518224T1 (en) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | AUDIO ENCODERS AND DECODERS |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
CN102222505B (en) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | Hierarchical audio coding and decoding methods and systems and transient signal hierarchical coding and decoding methods |
JP5575977B2 (en) * | 2010-04-22 | 2014-08-20 | クゥアルコム・インコーポレイテッド | Voice activity detection |
CN101957398B (en) | 2010-09-16 | 2012-11-28 | 河北省电力研究院 | Method for detecting and calculating primary time constant of power grid based on electromechanical and electromagnetic transient hybrid simulation technology |
JP5609591B2 (en) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | Audio encoding apparatus, audio encoding method, and audio encoding computer program |
FR2969805A1 (en) * | 2010-12-23 | 2012-06-29 | France Telecom | LOW ALTERNATE CUSTOM CODING PREDICTIVE CODING AND TRANSFORMED CODING |
ES2559040T3 (en) * | 2011-03-10 | 2016-02-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Filling of subcodes not encoded in audio signals encoded by transform |
JP5648123B2 (en) * | 2011-04-20 | 2015-01-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | Speech acoustic coding apparatus, speech acoustic decoding apparatus, and methods thereof |
RU2705052C2 (en) * | 2011-05-13 | 2019-11-01 | Самсунг Электроникс Ко., Лтд. | Bit allocation, audio encoding and decoding |
DE102011106033A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method for estimating noise level of audio signal, involves obtaining noise level of a zero-bit encoding sub-band audio signal by calculating power spectrum corresponding to noise level, when decoding the energy ratio of noise |
RU2505921C2 (en) * | 2012-02-02 | 2014-01-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Method and apparatus for encoding and decoding audio signals (versions) |
-
2012
- 2012-05-14 RU RU2018108586A patent/RU2705052C2/en active
- 2012-05-14 TW TW105133789A patent/TWI576829B/en active
- 2012-05-14 CA CA2836122A patent/CA2836122C/en active Active
- 2012-05-14 EP EP12786182.1A patent/EP2707875A4/en not_active Ceased
- 2012-05-14 TW TW105133790A patent/TWI606441B/en active
- 2012-05-14 EP EP12785222.6A patent/EP2707874A4/en not_active Ceased
- 2012-05-14 CN CN201610341675.1A patent/CN105825859B/en active Active
- 2012-05-14 KR KR1020120051071A patent/KR102053900B1/en active IP Right Grant
- 2012-05-14 MY MYPI2017001633A patent/MY186720A/en unknown
- 2012-05-14 AU AU2012256550A patent/AU2012256550B2/en active Active
- 2012-05-14 BR BR112013029347-0A patent/BR112013029347B1/en active IP Right Grant
- 2012-05-14 JP JP2014511291A patent/JP6189831B2/en active Active
- 2012-05-14 CN CN201610341124.5A patent/CN105825858B/en active Active
- 2012-05-14 WO PCT/KR2012/003776 patent/WO2012157931A2/en active Application Filing
- 2012-05-14 EP EP18170208.5A patent/EP3385949A1/en active Pending
- 2012-05-14 RU RU2013155482A patent/RU2648595C2/en active
- 2012-05-14 TW TW101117139A patent/TWI562133B/en active
- 2012-05-14 WO PCT/KR2012/003777 patent/WO2012157932A2/en active Application Filing
- 2012-05-14 TW TW101117138A patent/TWI562132B/en active
- 2012-05-14 MX MX2013013261A patent/MX2013013261A/en active IP Right Grant
- 2012-05-14 MX MX2016003429A patent/MX345963B/en unknown
- 2012-05-14 CN CN201280034734.0A patent/CN103650038B/en active Active
- 2012-05-14 US US13/471,020 patent/US9236057B2/en active Active
- 2012-05-14 US US13/471,046 patent/US9159331B2/en active Active
- 2012-05-14 SG SG2013084173A patent/SG194945A1/en unknown
- 2012-05-14 MX MX2015005615A patent/MX337772B/en unknown
- 2012-05-14 KR KR1020120051070A patent/KR102053899B1/en active IP Right Grant
- 2012-05-14 MY MYPI2013004216A patent/MY164164A/en unknown
- 2012-05-14 EP EP18158653.8A patent/EP3346465A1/en not_active Ceased
- 2012-05-14 EP EP21193627.3A patent/EP3937168A1/en active Pending
- 2012-05-14 TW TW106103488A patent/TWI604437B/en active
-
2013
- 2013-12-12 ZA ZA2013/09406A patent/ZA201309406B/en unknown
-
2015
- 2015-10-09 US US14/879,739 patent/US9489960B2/en active Active
- 2015-12-11 US US14/966,043 patent/US9711155B2/en active Active
-
2016
- 2016-11-07 US US15/330,779 patent/US9773502B2/en active Active
- 2016-11-23 AU AU2016262702A patent/AU2016262702B2/en active Active
-
2017
- 2017-05-10 JP JP2017094252A patent/JP2017194690A/en not_active Ceased
- 2017-07-17 US US15/651,764 patent/US10276171B2/en active Active
- 2017-09-25 US US15/714,428 patent/US10109283B2/en active Active
-
2018
- 2018-01-16 AU AU2018200360A patent/AU2018200360B2/en active Active
-
2019
- 2019-04-18 JP JP2019079583A patent/JP6726785B2/en active Active
- 2019-12-03 KR KR1020190159364A patent/KR102193621B1/en active IP Right Grant
- 2019-12-03 KR KR1020190159358A patent/KR102209073B1/en active IP Right Grant
-
2020
- 2020-12-15 KR KR1020200175854A patent/KR102284106B1/en active IP Right Grant
-
2021
- 2021-01-22 KR KR1020210009642A patent/KR102409305B1/en active IP Right Grant
-
2022
- 2022-01-03 KR KR1020220000533A patent/KR102491547B1/en active IP Right Grant
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05114863A (en) * | 1991-08-27 | 1993-05-07 | Sony Corp | High-efficiency encoding device and decoding device |
JPH0591061A (en) * | 1991-09-30 | 1993-04-09 | Sony Corp | Audio signal processing meth0d |
JPH09214355A (en) * | 1996-01-30 | 1997-08-15 | Sony Corp | Signal coding method |
RU2224302C2 (en) * | 1997-04-02 | 2004-02-20 | Самсунг Электроникс Ко., Лтд. | Method and device for scalable audio-signal coding/decoding |
RU2289858C2 (en) * | 2002-06-27 | 2006-12-20 | Самсунг Электроникс Ко., Лтд. | Method and device for encoding an audio signal with usage of harmonics extraction |
US7457742B2 (en) * | 2003-01-08 | 2008-11-25 | France Telecom | Variable rate audio encoder via scalable coding and enhancement layers and appertaining method |
JP2005265865A (en) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | Method and device for bit allocation for audio encoding |
US7752041B2 (en) * | 2004-05-28 | 2010-07-06 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding digital signal |
US7734053B2 (en) * | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
JP5114863B2 (en) * | 2006-04-11 | 2013-01-09 | 横浜ゴム株式会社 | Pneumatic tire and method for assembling pneumatic tire |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2705052C2 (en) | Bit allocation, audio encoding and decoding |