WO1999038157A1 - Method and device for coding lag parameter and code book preparing method - Google Patents

Method and device for coding lag parameter and code book preparing method Download PDF

Info

Publication number
WO1999038157A1
WO1999038157A1 PCT/JP1999/000294 JP9900294W WO9938157A1 WO 1999038157 A1 WO1999038157 A1 WO 1999038157A1 JP 9900294 W JP9900294 W JP 9900294W WO 9938157 A1 WO9938157 A1 WO 9938157A1
Authority
WO
WIPO (PCT)
Prior art keywords
lag parameter
codebook
decoding
encoding
value
Prior art date
Application number
PCT/JP1999/000294
Other languages
French (fr)
Japanese (ja)
Inventor
Koji Yoshida
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to CA002283203A priority Critical patent/CA2283203A1/en
Priority to AU20751/99A priority patent/AU2075199A/en
Priority to KR1019997008737A priority patent/KR20010005669A/en
Priority to EP99901171A priority patent/EP0971338A1/en
Publication of WO1999038157A1 publication Critical patent/WO1999038157A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Definitions

  • the present invention relates to a lag parameter encoding method and apparatus, and a codebook creating method.
  • the present invention relates to a sound processing device applicable to a digital cellular phone, a personal computer, and the like, and more particularly, to a lag parameter including a pitch period, which is one of parameters representing characteristics of a sound signal, or a parameter related thereto.
  • the present invention relates to a method and an apparatus for encoding a lag parameter to be encoded, and a method for creating a codebook used for these.
  • Important parameters that express the characteristics of the audio signal include the pitch period and lag parameter of the audio signal. These parameters are used as coding parameters in voice coding processing for coding voice signals with high efficiency, and as synthesis parameters in voice synthesis. When transmitting or storing a lag parameter, the parameter value must be encoded into a code corresponding to the value according to a specific rule.
  • the coding method of the lag parameter in voice coding is described in Recommendation G.729 (8 kbps CS-ACELP voice coding method) of International Organization ITU-T.
  • the lag parameters coded according to the recommendation are transmitted with the codes of the other coding parameters.
  • the lag parameter in this conventional example has a codebook called an adaptive codebook when generating the excitation signal used for the synthesis of decoded speech in the CS-ACELP system, which is the speech coding system of this conventional example. It is a value (lag value) that indicates which section of the signal to use.
  • decoding is performed by the decryption device based on the decoding lag value T 1, frac and code P according to the inverse rule of equation (1).
  • the lag parameter is a delay amount from a certain time t1 of the audio signal to a time t0 before the time t1 and similar to the waveform at the time t1. That is, the lag parameter is typically a parameter representing a pitch cycle in a periodic waveform, and is the pitch cycle of the voice itself. However, lag parameter is a broad concept that includes the pitch period, in the sense that it also includes the amount of delay to a position where the waveform is similar in a non-periodic voice waveform, such as a rising section of voice. .
  • the lag parameter code obtained by the conventional lag parameter coding method described above if a bit error occurs during transmission or storage, the decoded lag value is significantly different from the correct lag value without error, and There is a possibility that large deterioration will occur.
  • the present invention has been made in view of the above-described circumstances, and has an excellent lag parameter that can suppress deterioration of audio quality due to the error when a bit error occurs in the lag parameter code. It is an object of the present invention to provide an encoding method and apparatus thereof and a codebook creating method. Disclosure of the invention
  • the present invention encodes a lag parameter using a codebook defined as follows.
  • the codebook uses an integer multiple (including 1) or 1 / integer value of the decoding lag parameter value when the decoding lag parameter value has no bit error. It is set to increase the error rate in the vicinity.
  • the codebook sets the sum of decoded value distortion between codes having a Hamming distance within a specific number of bits to a minimum value or a value close to the minimum, and decodes the decoded lag parameter value as the decoded value distortion between codes. It is generated using a distortion measure such that the distortion is evaluated to be small at an integral multiple or a fraction of an integer.
  • the decoding lag parameter value when a bit error occurs in the code is erroneous near an integer multiple (including 1) or a fraction of the decoding lag parameter value when there is no bit error. Since the ratio can be increased, audio signal encoding and decoding can be performed while suppressing deterioration in audio quality in terms of auditory perception.
  • FIG. 1 shows a lag parameter encoding method according to Embodiment 1 of the present invention and its encoding method.
  • FIG. 2 is a schematic block diagram of a voice coding unit of the wireless communication device according to the first embodiment
  • FIG. 3 is a main block diagram of a voice coding unit of the wireless communication device according to the first embodiment
  • FIG. 5 is a diagram showing a procedure of a codebook creating method applied to the wireless communication device according to the first embodiment.
  • Embodiment 1 of the present invention will be described with reference to FIGS.
  • FIG. 1 is a schematic block diagram of a wireless transmission device to which the present invention is applied.
  • the voice transmission process is performed as follows.
  • the audio signal input from the microphone 101 is A / D converted by the AZD converter 102, output to the audio encoding unit 103, and encoded by, for example, the CELP method.
  • the coded output is modulated by a modulation / demodulation unit 104, for example, according to the CDMA system or the like, and transmitted via a radio transmission unit 105 and an antenna 106.
  • the voice reception process is performed as follows.
  • the modulated signal received via the antenna 107 and the radio receiving unit 108 is demodulated by the modem 104 and further decoded by the audio decoding unit 109, and is then decoded by the DZA converter 110. After DZA conversion, audio is output from speaker 1 1 1.
  • the present invention is applied to a part of the adaptive codebook search processing used in the voice coding unit 103 and the voice decoding unit 109 of the wireless communication device.
  • FIG. 2 is a schematic block diagram of the speech encoding unit 103 of the wireless communication device, and shows a general configuration of a CELP-type speech codec.
  • the A / D-converted audio signal is input from terminal 201 and output to LPC analyzer 202.
  • LPC analysis W section 202 performs linear prediction analysis on the input speech signal, and outputs linear prediction coefficients.
  • the LPC parameter quantization unit 203 quantizes the linear prediction coefficient, and outputs the quantization result to the synthesis filter 204 and the multiplexer 205.
  • the synthesis filter 204 forms a filter having predetermined characteristics based on the linear prediction coefficients, filters the sound source signal input from the adder 206, and outputs the result to the adder 207.
  • the adder 2007 calculates an error between the input voice signal from the terminal 201 and the output from the synthesis filter 204, and outputs the error signal to the auditory weighting unit 208.
  • the auditory weighting unit 208 performs a weighting process corresponding to the auditory sense on the error signal, and outputs the error signal to the error minimizing unit 209.
  • the error minimizing unit 209 sets the vector of the adaptive codebook 210 and the fixed excitation codebook 211 so that the error signal output from the auditory weighting unit 208 is minimized, and Gain codebook 2 1 2 Set the gain.
  • the adaptive codebook 210 is a sound source signal table that accumulates past sound source vectors in predetermined frame units, and includes a plurality of codes according to the vector set by the error minimizing unit 209. And selectively output a specific code string.
  • Multiplier 2 13 multiplies its output by the gain set by gain codebook 2 12, and outputs the result to adder 206.
  • the adaptive codebook 210 is composed of a buffer for holding the history of the excitation vector output of the adder 206 finally determined for a certain period, and is set by the error minimizing unit 209. A lag value indicating which section of the signal sequence stored in the buffer is to be cut out according to the vector value is output to the lag parameter encoding unit 215.
  • the lag parameter coding unit 2 15 is composed of a lag parameter codebook 2 15 a and a lag parameter coding unit 2 15 b created in advance according to a predetermined rule. The value output is encoded under a certain rule and output to the multiplexer 205.
  • the lag parameter encoding unit 215 will be described later in detail.
  • fixed excitation codebook 2 1 1 is the vector set by error minimizing section 2 09.
  • a specific fixed excitation code sequence is selectively output from a plurality of codes according to the torque value.
  • Multiplier 2 16 multiplies its output by the gain set by gain codebook 2 12, and outputs the result to adder 206.
  • the adder 206 adds the outputs of the multipliers 2 13 and 2 16 and outputs the result to the synthesis filter 204 as a sound source vector. At the same time, the output is fed back to the adaptive codebook 210 and accumulated sequentially.
  • error minimizing section 209 measures error signals for all excitation vectors stored in adaptive codebook 210, and obtains error signal from auditory weighting section 208.
  • the output (P) of the lag parameter encoder 2 15 b, the output (S) of the fixed excitation codebook 2 11, and the output (G) of the gain codebook 2 1 2 Are output to the multiplexer 205.
  • the multiplexer 205 multiplexes the quantized linear prediction coefficients (L) and the outputs (P), (S), and (G), and outputs the multiplexed signals to the modulator 104 of FIG. I do.
  • the audio decoding unit 110 (FIG. 1) of the wireless communication device is also configured by a general CELP-type audio decoding device, but the description is omitted here.
  • FIGS. 3 and 4 show the configuration of a main part of a lag parameter coding unit 215 to which the present invention is applied.
  • FIG. 3 shows a functional block on the lag parameter coding unit side. Indicates a functional block on the lag parameter decoding unit side.
  • Such a lag parameter coding unit is applicable not only to mobile phones but also to all devices that perform voice coding and decoding.
  • the lag parameter coding unit 2 15 includes a lag parameter code book 2 15 a and a lag parameter coding unit that references the lag parameter code book 2 15 a to code the lag value.
  • the lag parameter codebook 2 15 a is a table in which input lag values and output codes are stored in association with each other. It is created under certain rules in advance.
  • the lag parameter decoding section of the speech decoding apparatus includes the same lag parameter codebook 2 15 a as the lag parameter coding section, and the lag parameter codebook 2 15 Referring to a, the lag parameter decoding means 4 0 1 to decode the corresponding lag parameter from the received-input code, and a.
  • the lag parameter encoding unit 2 15 having the above configuration will be described more specifically.
  • the lag parameter codebook 2 15a of the present invention is obtained by calculating the decoding lag parameter value when a bit error occurs in a code, which is approximately an integer multiple (including 1) of the decoding lag parameter value when there is no bit error. It is characterized in that it is generated so as to increase the rate of occurrence of bit errors with a value or a value that is approximately a fraction of an integer. The creation method will be described later.
  • the lag parameter is a parameter related to the pitch period included in the audio signal, but a correct lag value may not be obtained due to a bit error or the like.
  • the inventor of the present application has found that when the incorrect decoding lag value is a value that is an integral multiple (including 1) of the correct lag value or a value in the vicinity of 1 / integer, the hearing deterioration is relatively small. I found that I could do it. The reason is that the audio signal decoded or synthesized using the incorrect lag value has a frequency component having a correct pitch period as a part of the spectrum as long as the above condition is satisfied.
  • the lag parameter is erroneously set to a value that is an integral multiple (including 1) of a correct decoded value or a value that is a fraction of an integer, deterioration in auditory perception is small. . paragraph
  • the lag parameter codebook 2 15a By constructing the lag parameter codebook 2 15a using the characteristic that there is no 8, it is possible to reduce the perceived speech quality degradation when a bit error occurs in the code.
  • This lag parameter codebook is designed so that the decoding lag parameter value when a bit error occurs in the code is approximately an integer multiple (including 1) of the decoding lag parameter value when there is no bit error, or approximately 1 / The value is set so that the error rate increases.
  • FIG. 5 shows a processing procedure for creating the lag parameter codebook.
  • Table (i) represents the decoded value (scalar—value or vector value may be used) for code i.
  • this codebook is a lag parameter codebook
  • Table (i) represents the intermediate code P0 for code i as described in the lag parameter codebook 101 in the first embodiment. You may.
  • the correspondence between the code and the decoded value in the initial codebook can be arbitrarily determined.
  • the decoded value distortion between codes differs depending on the parameter represented by the code.
  • the Euclidean distance between decoded values or something similar thereto is used.
  • the method of expressing the distortion measure of the lag parameter is one of the features of the present invention. This will be further described in the second embodiment.
  • step 503 a code pair i_a, i_b and a codebook Table (i) in which the Hamming distance dH exceeds the specific number of bits MB (dH> MB) is randomly selected.
  • step 504 the code pair After exchanging the decoded values, the sum D of decoded value distortions between codes having a Hamming distance within the specific number of bits is calculated.
  • step 505 it is determined whether or not the total distortion D in step 504 is less than the previously calculated total distortion Do. If the number has decreased, in step 506, replacement of the decoded value and update of the distortion sum are performed between the code pairs.
  • step 507 the convergence of the distortion sum Do is determined, and the operations in steps 503 to 507 are repeated until the distortion sum converges.
  • a lag parameter codebook is created by the above processing, decoding between codes within a specific Hamming distance ⁇ : the total sum of distortions can be reduced, so that the decoded value when a bit error occurs The value is close to the correct decoded value in the case where there is no error, and it is possible to suppress the deterioration of the sound quality in audibility.
  • step 503 the code pairs a and i_b randomly selected from the codebook Table (i) are limited to those having a Hamming distance exceeding a specific number of bits. Not limited to.
  • the second embodiment is implemented on the same hardware and software as the first embodiment. Difference from lag parameter codebook creation method applied to Embodiment 1 Is that the distortion scale has been changed.
  • the procedure for creating the codebook is the same as that in FIG. 5 shown in the first embodiment.
  • the difference from the first embodiment is that the scale shown in equation (2) is used as the decoded value distortion between codes used in steps 502 and 504.
  • T a and T b are the target codes a, i—b the decoding lag value (unit: sample), fa, fl ⁇ 3 ⁇ 4T a, frequency values for Tb and Tb (Hz :), F s is the sampling frequency (Hz), and d (fa, fb) is the decoded value distortion between code pairs.
  • Equation (2) does not represent the lag parameter value distortion as a mere Euclidean distance. Equation (2) is defined taking into account the difference between one lag value and an integer multiple of the other lag value (wl, w2, and w3 are the distortions from the integer multiple). Weighting constant), and other definitions realizing the same concept can be used.
  • the decoded value between codes having a Hamming distance within a specific number of bits becomes a value close to an integral multiple of one of the decoded values.
  • the lag parameter is a parameter related to the pitch period included in the audio signal
  • the decoding lag value is an integer multiple (including 1) or an integer component of the correct lag value due to a bit error or the like. If the audio signal has a value near 1 of the above, the audio signal decoded or synthesized using that value has a frequency component of the correct pitch period as a part of the spectrum, so that the deterioration in auditory perception is compared. You need less.
  • the invention of the lag parameter encoding method according to the present invention is a method for encoding a lag parameter which is an audio signal encoding parameter.
  • a lag parameter codebook that is set to increase the error rate around an integer multiple (including 1) or a fraction of the integer of the decoding lag parameter when there is no bit error in the decoding lag parameter, Is used to encode the lag parameter.
  • the invention of the lag parameter decoding method according to the present invention provides a lag parameter code that is encoded on the encoding side by the encoding method described in the above aspect, the same as the lag parameter code on the encoding side. It is decrypted using a book.
  • the decoding lag parameter value when a bit error occurs in the code increases the error rate when the decoding lag parameter value is an integer multiple (including 1) or around the integral value of 1 when there is no bit error.
  • the invention of the codebook creating method according to the present invention is such that the sum in the codebook of the decoded value distortion between codes having a Hamming distance within a predetermined number of bits in the codebook is set to a minimum or a value close to the minimum.
  • This is a method of creating a codebook.
  • the decoded value is set to a value close to the correct decoded value when there is no error.
  • the steps of randomly selecting the code pair, exchanging decoded values and updating the distortion sum, and determining the convergence of the distortion sum may be repeated.
  • a distortion criterion such that the distortion is evaluated to be small at a value that is an integral multiple or a fraction of the decoding lag parameter value in determining the decoded value distortion between the lag parameter codes.
  • lag parameter encoding and decoding for encoding and decoding lag parameters by using the above encoding method and decoding method, or using a codebook created by any of the above codebook creating methods.
  • the method can be realized.
  • the present invention includes a codebook representing a correspondence between a parameter value of a lag parameter, which is a coding parameter of an audio signal, and a code, and a lag parameter encoder for coding the lag parameter using the codebook.
  • a codebook representing a correspondence between a parameter value of a lag parameter, which is a coding parameter of an audio signal, and a code
  • a lag parameter encoder for coding the lag parameter using the codebook.
  • it can be realized as a speech encoding device.
  • the present invention can also be realized as a speech decoding device including a lag parameter decoder that decodes the lag parameter code encoded by the encoding device using the same codebook as the encoding side.
  • the data encoding / decoding device can be realized by one device.
  • the above-mentioned encoding method can be realized by computer software. More specifically, a computer readable medium and a decoding lag parameter value when the decoding lag parameter value has no bit error when a bit error occurs in the code of the lag parameter which is an encoding parameter of the audio signal.
  • a program instruction means for causing a computer processor to encode a lag parameter using a codebook is provided.
  • the program instructing means may be stored in an executable form on the medium, and may be operated by a computer when being executed by the processor.
  • the encoding software can be stored in various storage media and used. That is, when a bit error occurs in the code of the lag parameter, which is the coding parameter of the audio signal, the decoding lag parameter value is an integer multiple (including 1) of the decoding lag parameter value when there is no bit error.
  • the decoding lag parameter value is an integer multiple (including 1) of the decoding lag parameter value when there is no bit error.
  • it is a machine-readable storage medium that stores a program that encodes a lag parameter using a lag parameter codebook that is set to be erroneous near a value of 1 in an integer. Then, it is downloaded to a computer, and the above encoding method is realized by operating the computer.
  • the computer and the processor must have a codebook so that the sum of the decoded value distortion between the code readable by the computer and the code having a Hamming distance within a predetermined number of bits in the codebook is a minimum or a value close to the minimum.
  • a program instruction means for creating the program It can be realized as a codebook creating device that is loaded into a computer memory when the processor executes the codebook and runs a computer.
  • the present invention can be applied to a case where no error detection is performed. However, it is needless to say that the present invention can be used in combination with the error detection. Further, the present invention can be applied to all voice coding / decoding methods that perform lag parameter coding.
  • the encoding device, the decoding device, the encoding method, and the decoding method according to the present invention can be widely applied to devices having a speech encoding device and a speech decoding device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

A lag parameter coding means (215b) generates a code corresponding to a lag parameter value by using a lag parameter code book (215a). On the decoding side, a lag parameter value corresponding to the lag parameter code generated on the coding side is decoded by using the same lag parameter code book (215a) and outputted. In the lag parameter code book (215a), the relation between the lag parameter value and the corresponding code (P) is shown. The relation is so determined as to increase the rate at which the decoded lag parameter value of when a bit error occurs in the code deviates to approximately an integral multiple (including one time) or an integral submultiple of the decoded lag parameter value of when no bit error occurs. As a result, the auditory degradation of quality of decoded sound is suppressed even when the code has a bit error.

Description

明細書 ラグパラメータの符号化方法及びその装置並びに符号帳作成方法 技術分野  TECHNICAL FIELD The present invention relates to a lag parameter encoding method and apparatus, and a codebook creating method.
本発明は、 デジタノレ携帯電話やパーソナルコンピュータなどに適用可能な音 声処理装置に係り、 特に、 音声信号の特徴を表すパラメータの一つであるピッ チ周期またはそれに関連するパラメータを含んだラグパラメータを符号化する、 ラグパラメータの符号化方法及びその装置並びにこれらに使用される符号帳の 作成方法に関する。 背景技術  The present invention relates to a sound processing device applicable to a digital cellular phone, a personal computer, and the like, and more particularly, to a lag parameter including a pitch period, which is one of parameters representing characteristics of a sound signal, or a parameter related thereto. The present invention relates to a method and an apparatus for encoding a lag parameter to be encoded, and a method for creating a codebook used for these. Background art
音声信号の特徴を表す重要なパラメータに音声信号のピツチ周期やラグパラ メータがある。 これらのパラメータは、 音声信号を高能率に符号化する音声符 号化処理における符号化パラメータや、 音声合成における合成パラメータとし て用いられている。 ラグパラメータを伝送または蓄積する際には、 そのパラメ 一タ値を特定の規則に従って、その値に対応する符号に符号化する必要がある。 音声符号化におけるラグパラメータの符号化方法は、 国際機関 I T U— Tの 勧告 G. 729 (8kbpsCS-ACELP音声符号化方式)に記載されている。  Important parameters that express the characteristics of the audio signal include the pitch period and lag parameter of the audio signal. These parameters are used as coding parameters in voice coding processing for coding voice signals with high efficiency, and as synthesis parameters in voice synthesis. When transmitting or storing a lag parameter, the parameter value must be encoded into a code corresponding to the value according to a specific rule. The coding method of the lag parameter in voice coding is described in Recommendation G.729 (8 kbps CS-ACELP voice coding method) of International Organization ITU-T.
その勧告により符号化されたラグパラメータは、 他の符号化パラメータの符 号と共に伝送される。 本従来例におけるラグパラメータは、 本従来例の音声符 号化方式である CS-ACELP 方式において、 復号音声の合成に用いられる音源信 号を生成する際に、 適応符号帳と呼ばれる符号帳が有する信号のどの区間の信 号を用いるかを表す値 (ラグ値) であり、 このラグ値 Tは、 整数部分 T 1 ( T 1 =19〜143)と小数部分 frac/3 (frac=_l, 0, 1)からなつている。  The lag parameters coded according to the recommendation are transmitted with the codes of the other coding parameters. The lag parameter in this conventional example has a codebook called an adaptive codebook when generating the excitation signal used for the synthesis of decoded speech in the CS-ACELP system, which is the speech coding system of this conventional example. It is a value (lag value) that indicates which section of the signal to use. This lag value T consists of an integer part T 1 (T 1 = 19 to 143) and a decimal part frac / 3 (frac = _l, 0 , 1).
このラグ値 Tは、 符号化装置において、 上記 T l , fracを用いて以下の (1 ) 式により符号 P ( P =0〜255)として符号化される。 The lag value T is calculated by the encoding device using the above T l and frac as follows: It is encoded as a code P (P = 0 to 255) by the equation.
( 3 X (Tl - 19)+frac - 1, Tl=19〜85,frac=— 1,0,1 (3 X (Tl-19) + frac-1, Tl = 19 to 85, frac =-1,0,1
P =  P =
l (Tl - 85)+197, Tl=86~ 143,frac=0  l (Tl-85) +197, Tl = 86 ~ 143, frac = 0
… ( 1 ) 一方、複号化装置において、復号ラグ値 T 1 , frac 、符号 Pに基づいて( 1 ) 式の逆の規則により復号される。  (1) On the other hand, decoding is performed by the decryption device based on the decoding lag value T 1, frac and code P according to the inverse rule of equation (1).
なお、 ラグパラメータは、 音声信号のある時刻 t 1からその時刻 t 1以前で その時刻 t 1の波形に類似している波形の時刻 t 0までの遅延量である。 つま り、 ラグパラメータは、 典型的には、 周期的な波形におけるピッチ周期を表す パラメータであり、 音声のピッチ周期そのものである。 伹し、 ラグパラメ一タ は、 音声の立ち上がり区間のように、 非周期的な音声波形で単に波形が類似し ている位置までの遅延量をも含むという意味で、 ピッチ周期を含む広い概念で ある。  The lag parameter is a delay amount from a certain time t1 of the audio signal to a time t0 before the time t1 and similar to the waveform at the time t1. That is, the lag parameter is typically a parameter representing a pitch cycle in a periodic waveform, and is the pitch cycle of the voice itself. However, lag parameter is a broad concept that includes the pitch period, in the sense that it also includes the amount of delay to a position where the waveform is similar in a non-periodic voice waveform, such as a rising section of voice. .
しかしながら、 上記従来のラグパラメータ符号化方法で得られたラグパラメ ータ符号は、 伝送又は蓄積の過程でビット誤りが生じた場合、 復号ラグ値は誤 りのない正しいラグ値と大きく異なり、 復号音声に大きな劣化を生じる可能性 がある。  However, the lag parameter code obtained by the conventional lag parameter coding method described above, if a bit error occurs during transmission or storage, the decoded lag value is significantly different from the correct lag value without error, and There is a possibility that large deterioration will occur.
一般に、 符号のビット誤りによる品質劣化を抑える方法の一つとして、 符号 化パラメータのパラメ一タ値間のユークリッド距離等の歪みと、 そのパラメ一 タ値を表す符号間の符号間距離 (ハミング距離) と、 に何らかの相関を持たせ て、 ビット誤りが生じた場合に、 その影響を少なくする方法がある。  In general, as one method of suppressing quality degradation due to bit errors in codes, distortions such as Euclidean distance between parameter values of coding parameters and inter-code distance (hamming distance) between codes representing the parameter values are used. There is a method to reduce the effects of bit errors by giving some correlation to and.
ラグパラメータのパラメータ値間の歪み尺度として、 そのラグ値間のユーク リ ツド距離や差分値等を用いた場合、 その値が小さい範囲では有効である。 し かし、 その値が一定値を超えると聴感上の歪みとの対応が取れなくなるため、 ラグパラメータの符号化復号化処理に上記一般的な方法を採用してもあまり有 効ではない。 このようなビット誤りへの対処として、 ビット誤りを検出し誤りを含むラグ 値を使用しないようにする方法もあるが、 この方法は、 誤り検出自体が煩雑で あるし、 音声通信のような低ビットレートの通信方法にチェックビットのよう な冗長なビットを付加するのも適当ではない。 When the Euclidean distance between the lag values and the difference value are used as the distortion measure between the lag parameter values, it is effective in the range where the values are small. However, if the value exceeds a certain value, it will not be possible to cope with audible distortion. Therefore, it is not very effective to adopt the above-mentioned general method for encoding and decoding the lag parameter. As a countermeasure against such a bit error, there is a method of detecting a bit error and not using a lag value containing the error. However, this method is complicated in error detection itself and requires low error such as voice communication. It is not appropriate to add redundant bits such as check bits to the bit rate communication method.
本発明は、 以上のような実情に鑑みてなされたものであり、 ラグパラメータ の符号にビット誤りが生じた場合に、 その誤りによる聴感上の音声品質の劣化 を抑えることのできる優れたラグパラメータの符号化方法及びその装置並びに 符号帳作成方法を提供することを目的とする。 発明の開示  The present invention has been made in view of the above-described circumstances, and has an excellent lag parameter that can suppress deterioration of audio quality due to the error when a bit error occurs in the lag parameter code. It is an object of the present invention to provide an encoding method and apparatus thereof and a codebook creating method. Disclosure of the invention
上記課題を解決するために、 本発明は、 ラグパラメータを以下のように定め られた符号帳を用いて符号化するようにした。 その符号帳は、 ラグパラメータ の符号にビット誤りが生じたときに、 復号ラグパラメータ値がビット誤りのな い場合の復号ラグパラメータ値の整数倍 (1倍を含む) または整数分の 1の値 付近で誤る割合を増加させるように設定される。  In order to solve the above-mentioned problem, the present invention encodes a lag parameter using a codebook defined as follows. When a bit error occurs in the lag parameter code, the codebook uses an integer multiple (including 1) or 1 / integer value of the decoding lag parameter value when the decoding lag parameter value has no bit error. It is set to increase the error rate in the vicinity.
その符号帳は、 特定のビット数以内のハミング距離を有する符号間の復号値 歪みの総和を最小又は最小に近い値とするようにすると共に、 符号間の復号値 歪みとして、 復号ラグパラメータ値の整数倍または整数分の 1の値で歪みが小 さく評価されるような歪み尺度を用いて、 生成される。  The codebook sets the sum of decoded value distortion between codes having a Hamming distance within a specific number of bits to a minimum value or a value close to the minimum, and decodes the decoded lag parameter value as the decoded value distortion between codes. It is generated using a distortion measure such that the distortion is evaluated to be small at an integral multiple or a fraction of an integer.
その結果、 符号にビット誤りが生じた際の復号ラグパラメ一タ値がビット誤 りのない場合の復号ラグパラメ一タ値の整数倍 (1倍を含む) または整数分の 1の値の付近に誤る割合を増加させることができるため、 聴感上の音声品質劣 化を抑えて音声信号の符号復号を行うことができる。 図面の簡単な説明  As a result, the decoding lag parameter value when a bit error occurs in the code is erroneous near an integer multiple (including 1) or a fraction of the decoding lag parameter value when there is no bit error. Since the ratio can be increased, audio signal encoding and decoding can be performed while suppressing deterioration in audio quality in terms of auditory perception. BRIEF DESCRIPTION OF THE FIGURES
図 1は、 本発明の実施の形態 1に係るラグパラメータの符号化方法及びその 装置が適用される無線送信装置の概略プロック図、 FIG. 1 shows a lag parameter encoding method according to Embodiment 1 of the present invention and its encoding method. Schematic block diagram of a wireless transmission device to which the device is applied,
図 2は、実施の形態 1に係る無線通信装置の音声符号化部の概略プロック図、 図 3は、実施の形態 1に係る無線通信装置の音声符号化部の要部プロック図、 図 4は、実施の形態 1に係る無線通信装置の音声複号化部の要部プロック図、 そして、  FIG. 2 is a schematic block diagram of a voice coding unit of the wireless communication device according to the first embodiment, FIG. 3 is a main block diagram of a voice coding unit of the wireless communication device according to the first embodiment, and FIG. , A block diagram of a main part of the voice decoding unit of the wireless communication apparatus according to the first embodiment,
図 5は、 実施の形態 1に係る無線通信装置に適用される符号帳作成方法の手 順を示す図、 である。 発明を実施するための最良の形態  FIG. 5 is a diagram showing a procedure of a codebook creating method applied to the wireless communication device according to the first embodiment. BEST MODE FOR CARRYING OUT THE INVENTION
(実施の形態 1 )  (Embodiment 1)
以下、 本発明の実施の形態 1について、 図 1〜図 5を用いて説明する。  Hereinafter, Embodiment 1 of the present invention will be described with reference to FIGS.
図 1は、 本発明が適用される無線送信装置の概略プロック図を示している。 音声送信の処理は、 以下のように行われる。 マイク 1 0 1から入力された音 声信号は、 AZD変換器 1 0 2により A/D変換され、 音声符号化部 1 0 3に 出力され、 例えば、 C E L P方式により符号化される。 符号化された出力は、 変復調部 1 0 4で、 例えば、 C D MA方式等により変調され、 無線送信部 1 0 5、 アンテナ 1 0 6を介して送信される。  FIG. 1 is a schematic block diagram of a wireless transmission device to which the present invention is applied. The voice transmission process is performed as follows. The audio signal input from the microphone 101 is A / D converted by the AZD converter 102, output to the audio encoding unit 103, and encoded by, for example, the CELP method. The coded output is modulated by a modulation / demodulation unit 104, for example, according to the CDMA system or the like, and transmitted via a radio transmission unit 105 and an antenna 106.
音声受信の処理は、 以下のように行われる。 アンテナ 1 0 7、 無線受信部 1 0 8を介して受信された変調信号を変復調部 1 0 4で復調し、 更に、 音声復号 化部 1 0 9で復号し、 D ZA変換器 1 1 0で D ZA変換後にスピーカ 1 1 1か ら音声出力する。  The voice reception process is performed as follows. The modulated signal received via the antenna 107 and the radio receiving unit 108 is demodulated by the modem 104 and further decoded by the audio decoding unit 109, and is then decoded by the DZA converter 110. After DZA conversion, audio is output from speaker 1 1 1.
本発明は、 上記無線通信装置の音声符号化部 1 0 3及び音声複号化部 1 0 9 で使用される適応符号帳探索処理の一部に適用される。  The present invention is applied to a part of the adaptive codebook search processing used in the voice coding unit 103 and the voice decoding unit 109 of the wireless communication device.
図 2は、 無線通信装置の音声符号化部 1 0 3の概略ブロック図であり、 C E L P型音声符号復号装置の一般的な構成を示している。 A/D変換された音声 信号は端子 2 0 1から入力し、 L P C分析部 2 0 2に出力される。 L P C分析 W 部 2 0 2は、 入力音声信号により線形予測分析を行い、 線形予測係数を出力す る。 L P Cパラメータ量子化部 2 0 3は、 線形予測係数を量子化し(し)、 量子 化結果を合成フィルタ 2 0 4と多重化器 2 0 5とに出力する。 FIG. 2 is a schematic block diagram of the speech encoding unit 103 of the wireless communication device, and shows a general configuration of a CELP-type speech codec. The A / D-converted audio signal is input from terminal 201 and output to LPC analyzer 202. LPC analysis W section 202 performs linear prediction analysis on the input speech signal, and outputs linear prediction coefficients. The LPC parameter quantization unit 203 quantizes the linear prediction coefficient, and outputs the quantization result to the synthesis filter 204 and the multiplexer 205.
合成フィルタ 2 0 4は、 上記線形予測係数により所定特性を有するフィルタ を構成し、 加算器 2 0 6から入力される音源信号をフィルタリングし、 その結 果を加算器 2 0 7に出力する。 この加算器 2 0 7は、 端子 2 0 1からの入力音 声信号と合成フィルタ 2 0 4からの出力との誤差を算出して、 その誤差信号を 聴覚重み付け部 2 0 8に出力する。 聴覚重み付け部 2 0 8は、 誤差信号に聴覚 に対応する重み付け処理を行い、 誤差最小化部 2 0 9に出力する。  The synthesis filter 204 forms a filter having predetermined characteristics based on the linear prediction coefficients, filters the sound source signal input from the adder 206, and outputs the result to the adder 207. The adder 2007 calculates an error between the input voice signal from the terminal 201 and the output from the synthesis filter 204, and outputs the error signal to the auditory weighting unit 208. The auditory weighting unit 208 performs a weighting process corresponding to the auditory sense on the error signal, and outputs the error signal to the error minimizing unit 209.
誤差最小化部 2 0 9は、 聴覚重み付け部 2 0 8からの誤差信号出力が最小に なるように、 適応符号帳 2 1 0と固定音源符号帳 2 1 1のべク トル設定を行う とともに、 ゲイン符号帳 2 1 2の利得設定を行う。  The error minimizing unit 209 sets the vector of the adaptive codebook 210 and the fixed excitation codebook 211 so that the error signal output from the auditory weighting unit 208 is minimized, and Gain codebook 2 1 2 Set the gain.
適応符号帳 2 1 0は、 過去の音源べク トルを所定フレーム単位で蓄積する音 源信号テ一ブルであり、 誤差最小化部 2 0 9により設定されたべク トルに従つ て、 複数コードから選択的に特定の符号列を出力する。 乗算器 2 1 3は、 その 出力とゲイン符号帳 2 1 2により設定された利得とを乗算して、 加算器 2 0 6 に出力する。  The adaptive codebook 210 is a sound source signal table that accumulates past sound source vectors in predetermined frame units, and includes a plurality of codes according to the vector set by the error minimizing unit 209. And selectively output a specific code string. Multiplier 2 13 multiplies its output by the gain set by gain codebook 2 12, and outputs the result to adder 206.
尚、 この適応符号帳 2 1 0は、 最終的に決定された加算器 2 0 6の音源べク トル出力の一定期間の履歴を保持するバッファからなり、 誤差最小化部 2 0 9 により設定されたべク トル値に従って、 前記バッファに蓄積された信号列のど の区間を切出すかを示すラグ値を、ラグパラメータ符号化部 2 1 5に出力する。 このラグパラメータ符号化部 2 1 5は、 所定規則で予め作成されたラグパラメ ータ符号帳 2 1 5 aとラグパラメータ符号化部 2 1 5 bとから構成され、 適応 符号帳 2 1 0のラグ値出力を一定規則の下に符号化して多重化器 2 0 5に出力 する。 このラグパラメータ符号化部 2 1 5については、 後に詳述する。  The adaptive codebook 210 is composed of a buffer for holding the history of the excitation vector output of the adder 206 finally determined for a certain period, and is set by the error minimizing unit 209. A lag value indicating which section of the signal sequence stored in the buffer is to be cut out according to the vector value is output to the lag parameter encoding unit 215. The lag parameter coding unit 2 15 is composed of a lag parameter codebook 2 15 a and a lag parameter coding unit 2 15 b created in advance according to a predetermined rule. The value output is encoded under a certain rule and output to the multiplexer 205. The lag parameter encoding unit 215 will be described later in detail.
また、 固定音源符号帳 2 1 1は、 誤差最小化部 2 0 9により設定されたべク トル値に従って、 複数コ一ドから選択的に特定の固定音源符号列を出力する。 乗算器 2 1 6は、 その出力とゲイン符号帳 2 1 2により設定された利得と乗算 して、 加算器 2 0 6に出力する。 In addition, fixed excitation codebook 2 1 1 is the vector set by error minimizing section 2 09. A specific fixed excitation code sequence is selectively output from a plurality of codes according to the torque value. Multiplier 2 16 multiplies its output by the gain set by gain codebook 2 12, and outputs the result to adder 206.
加算器 2 0 6は、 乗算器 2 1 3と乗算器 2 1 6との出力とを加算し、 音源べ ク トルとして、 合成フィルタ 2 0 4に出力する。 同時に、 その出力は、 適応符 号帳 2 1 0にフィードバックされ、 順次蓄積される。  The adder 206 adds the outputs of the multipliers 2 13 and 2 16 and outputs the result to the synthesis filter 204 as a sound source vector. At the same time, the output is fed back to the adaptive codebook 210 and accumulated sequentially.
このようにして、 誤差最小化部 2 0 9は、 適応符号帳 2 1 0に蓄積されてい る全ての音源べク トルに対して誤差信号を測定し、 聴覚重み付け部 2 0 8から の誤差信号が最小になった時の、 ラグパラメータ符号化部 2 1 5 bの出力(P ) と、 固定音源符号帳 2 1 1の出力 (S ) と、 ゲイン符号帳 2 1 2の出力 (G) と、 を多重化器 2 0 5に出力させる。 多重化器 2 0 5は、 量子化された線形予 測係数(L )と、 上記出力 (P )、 (S )、 (G ) とを多重化して、 図 1の変調部 1 0 4に出力する。  In this way, error minimizing section 209 measures error signals for all excitation vectors stored in adaptive codebook 210, and obtains error signal from auditory weighting section 208. When is minimized, the output (P) of the lag parameter encoder 2 15 b, the output (S) of the fixed excitation codebook 2 11, and the output (G) of the gain codebook 2 1 2 Are output to the multiplexer 205. The multiplexer 205 multiplexes the quantized linear prediction coefficients (L) and the outputs (P), (S), and (G), and outputs the multiplexed signals to the modulator 104 of FIG. I do.
無線通信装置の音声複号化部 1 1 0 (図 1 ) も、 一般的な C E L P型の音声 復号化装置により構成されているが、 ここではその説明を省略する。  The audio decoding unit 110 (FIG. 1) of the wireless communication device is also configured by a general CELP-type audio decoding device, but the description is omitted here.
ついで、 本発明が適用されるラグパラメータ符号化部 2 1 5について、 具体 的に説明する。  Next, the lag parameter encoding unit 215 to which the present invention is applied will be specifically described.
図 3および図 4は、 本発明が適用されるラグパラメータ符号化部 2 1 5の要 部の構成を示しており、 図 3はラグパラメ一タ符号化部側の機能プロックを示 し、 図 4はラグパラメータ複号化部側の機能ブロックを示している。 このよう なラグパラメータ符号化部は、 特に、 携帯電話に限らず、 音声の符号化複号化 を行う全ての機器に適用可能である。  FIGS. 3 and 4 show the configuration of a main part of a lag parameter coding unit 215 to which the present invention is applied. FIG. 3 shows a functional block on the lag parameter coding unit side. Indicates a functional block on the lag parameter decoding unit side. Such a lag parameter coding unit is applicable not only to mobile phones but also to all devices that perform voice coding and decoding.
図 3に示すように、 ラグパラメータ符号化部 2 1 5は、 ラグパラメータ符号 帳 2 1 5 aと、 このラグパラメータ符号帳 2 1 5 aを参照してラグ値を符号化 するラグパラメータ符号化手段 2 1 5 bと、 を備えている。 ラグパラメータ符 号帳 2 1 5 aは、 入力ラグ値と出力符号とを対応づけて記憶したテーブルであ り、 予め一定規則の下で作成されている。 As shown in FIG. 3, the lag parameter coding unit 2 15 includes a lag parameter code book 2 15 a and a lag parameter coding unit that references the lag parameter code book 2 15 a to code the lag value. Means 2 15 b. The lag parameter codebook 2 15 a is a table in which input lag values and output codes are stored in association with each other. It is created under certain rules in advance.
同様に、 図 4に示すように、 音声復号化装置のラグパラメータ複号化部は、 上記ラグパラメータ符号化部と同じラグパラメータ符号帳 2 1 5 aと、 このラ グパラメータ符号帳 2 1 5 aを参照して、 受信 ·入力された符号から対応する ラグパラメータを復号するラグパラメータ複号化手段 4 0 1と、を備えている。 上記構成のラグパラメータ符号化部 2 1 5を、 更に具体的に説明する。 Similarly, as shown in FIG. 4, the lag parameter decoding section of the speech decoding apparatus includes the same lag parameter codebook 2 15 a as the lag parameter coding section, and the lag parameter codebook 2 15 Referring to a, the lag parameter decoding means 4 0 1 to decode the corresponding lag parameter from the received-input code, and a. The lag parameter encoding unit 2 15 having the above configuration will be described more specifically.
ラグパラメータ符号帳 2 1 5 aは、 ラグパラメ一タ値 Tとそれに対応する符 号 Pの関係が表されたテーブルである。例えば、符号帳サイズを Nとした場合、 符号 P (^〜 に対応するラグ値丁が、 記憶されている。 また、 従来の技術 で挙げた I T U— T勧告 G. 729 (8kbps CS-ACELP)におけるラグパラメータ符 号化の ( 1 ) 式のような計算式により、 一旦中間符号 P 0 (0〜N- 1)を求め、 P 0 に対する最終的な符号 P (=0〜N - 1)との対応表を記憶させてもよレ、。  The lag parameter codebook 2 15 a is a table in which the relationship between the lag parameter value T and the corresponding code P is represented. For example, if the codebook size is N, the lag value corresponding to the code P (^ ~ is stored. Also, the ITU-T recommendation G.729 (8kbps CS-ACELP) mentioned in the prior art The intermediate code P0 (0 to N-1) is calculated once by using a formula such as equation (1) for the lag parameter encoding in, and the final code P (= 0 to N-1) for P0 You may memorize the correspondence table.
本発明のラグパラメータ符号帳 2 1 5 aは、 符号にビット誤りが生じた際の 復号ラグパラメータ値が、 ビット誤りのない場合の復号ラグパラメータ値の概 ね整数倍 (1倍を含む) の値又は概ね整数分の 1の値で、 ビット誤りが発生す る割合が増加するように生成されている点に特徴がある。 その作成方法は、 後 に説明する。  The lag parameter codebook 2 15a of the present invention is obtained by calculating the decoding lag parameter value when a bit error occurs in a code, which is approximately an integer multiple (including 1) of the decoding lag parameter value when there is no bit error. It is characterized in that it is generated so as to increase the rate of occurrence of bit errors with a value or a value that is approximately a fraction of an integer. The creation method will be described later.
ラグパラメータは、 音声信号に含まれるピッチ周期に関連するパラメータで あるが、 ビット誤り等により正しいラグ値が得られない場合がある。 しかし、 本願発明者は、 誤った復号ラグ値が、 正しいラグ値の整数倍(1倍を含む) ま たは整数分の 1付近の値である場合には、 聴感上の劣化は比較的少なくて済む ことを見出した。 その理由は、 その誤ったラグ値を用いて復号または合成され た音声信号は、 上記条件を満たす限り、 そのスペク トルが正しいピッチ周期の 周波数成分をその一部として含むためである。  The lag parameter is a parameter related to the pitch period included in the audio signal, but a correct lag value may not be obtained due to a bit error or the like. However, the inventor of the present application has found that when the incorrect decoding lag value is a value that is an integral multiple (including 1) of the correct lag value or a value in the vicinity of 1 / integer, the hearing deterioration is relatively small. I found that I could do it. The reason is that the audio signal decoded or synthesized using the incorrect lag value has a frequency component having a correct pitch period as a part of the spectrum as long as the above condition is satisfied.
以上のように、 実施の形態 1によれば、 ラグパラメータが正しい復号値の整 数倍 (1倍を含む) または整数分の 1の値の付近に誤っても聴感上の劣化が少 。„ As described above, according to the first embodiment, even if the lag parameter is erroneously set to a value that is an integral multiple (including 1) of a correct decoded value or a value that is a fraction of an integer, deterioration in auditory perception is small. . „
WO 99/38157  WO 99/38157
8 ないという特性を利用して、 ラグパラメータ符号帳 2 1 5 aを構成することに より、 符号にビット誤りが生じた場合の聴感上の音声品質劣化を低減させるこ とができる。  By constructing the lag parameter codebook 2 15a using the characteristic that there is no 8, it is possible to reduce the perceived speech quality degradation when a bit error occurs in the code.
次に、 本発明で使用する上記ラグパラメータ符号帳の作成方法について説明 する。 このラグパラメータ符号帳は、 符号にビット誤りが生じた際の復号ラグ パラメータ値が、 ビット誤りのない場合の復号ラグパラメータ値の概ね整数倍 ( 1倍を含む) の値または概ね整数分の 1の値で誤る割合が増加するように設 定される。  Next, a method of creating the lag parameter codebook used in the present invention will be described. This lag parameter codebook is designed so that the decoding lag parameter value when a bit error occurs in the code is approximately an integer multiple (including 1) of the decoding lag parameter value when there is no bit error, or approximately 1 / The value is set so that the error rate increases.
図 5は、上記ラグパラメータ符号帳を作成するための処理手順を示している。 まず、 ステップ 5 0 1において、 初期符号帳 Table (i) (i=0〜N- 1 ;Nは符号 帳サイズ) が設定される。 ここで、 Table (i)は符号 iに対する復号値 (スカラ —値、 べク トル値いずれでもよい) を表す。 なお、 本符号帳がラグパラメータ 符号帳の場合、 Table (i)は、 実施の形態 1のラグパラメ一タ符号帳 1 0 1で説 明したように、 符号 iに対する中間符号 P 0 を表すようにしてもよい。 更に、 初期符号帳における符号と復号値との対応は、 任意に定めることができる。 次に、 ステップ 5 0 2において、 Table (i)において、 ハミング距離 d Hが特 定のビット数 (=MB とする)以内である (dH MB) 符号の組み合わせ全てについ て、 その組み合わせ符号間の復号値歪みがそれぞれ算出され、 その総和 D oが 求められる。  FIG. 5 shows a processing procedure for creating the lag parameter codebook. First, in step 501, an initial codebook Table (i) (i = 0 to N-1; N is the codebook size) is set. Here, Table (i) represents the decoded value (scalar—value or vector value may be used) for code i. When this codebook is a lag parameter codebook, Table (i) represents the intermediate code P0 for code i as described in the lag parameter codebook 101 in the first embodiment. You may. Furthermore, the correspondence between the code and the decoded value in the initial codebook can be arbitrarily determined. Next, in step 502, in Table (i), for all combinations of (dH MB) codes in which the Hamming distance d H is within a specific number of bits (= MB), the Decoded value distortions are calculated respectively, and the total sum D o is obtained.
ここで、 符号間の復号値歪みは、 その符号が表すパラメータによって異なる 力 一般には復号値間のュ一クリッド距離又はそれに類するものが用いられる。 ラグパラメータの歪み尺度の表現方法は、 本発明における特徴の一つである。 それについては、 実施の形態 2において、 更に言及する。  Here, the decoded value distortion between codes differs depending on the parameter represented by the code. In general, the Euclidean distance between decoded values or something similar thereto is used. The method of expressing the distortion measure of the lag parameter is one of the features of the present invention. This will be further described in the second embodiment.
次に、 ステップ 5 0 3において、 ハミング距離 d Hが前記特定のビット数 M Bを越える(dH>MB)ような符号対 i_a, i_b 、 符号帳 Table (i)内から、 ランダ ムに選択される。 そして、 ステップ 5 0 4において、 前記符号対の間で相互に その復号値を交換した後に、 前記特定のビット数以内のハミング距離を有する 符号間の復号値歪みの総和 Dが算出される。 Next, in step 503, a code pair i_a, i_b and a codebook Table (i) in which the Hamming distance dH exceeds the specific number of bits MB (dH> MB) is randomly selected. . Then, in step 504, the code pair After exchanging the decoded values, the sum D of decoded value distortions between codes having a Hamming distance within the specific number of bits is calculated.
次に、 ステップ 5 0 5において、 ステップ 5 0 4における歪み総和 Dが、 以 前に算出された歪み総和 D oより少なくなつたかどうかの判定を行う。 少なく なった場合には、 ステップ 5 0 6において、 前記符号対の間でその復号値の交 換および歪み総和の更新が行なわれる。  Next, in step 505, it is determined whether or not the total distortion D in step 504 is less than the previously calculated total distortion Do. If the number has decreased, in step 506, replacement of the decoded value and update of the distortion sum are performed between the code pairs.
そして、 ステップ 5 0 7において、 前記歪み総和 D oの収束性が判定され、 前記歪み総和が収束するまで前記ステップ 5 0 3から 5 0 7までの動作が繰り 返される。  Then, in step 507, the convergence of the distortion sum Do is determined, and the operations in steps 503 to 507 are repeated until the distortion sum converges.
以上の処理によりラグパラメータ符号帳を作成すれば、 特定のハミング距離 以内の符号間の複号^:歪みの総和を少なくすることができるため、 符号にビッ ト誤りが生じた際の復号値が誤りのない場合の正しい復号値に近い値となり、 聴感上の音声品質の劣化を抑えることができる。  If a lag parameter codebook is created by the above processing, decoding between codes within a specific Hamming distance ^: the total sum of distortions can be reduced, so that the decoded value when a bit error occurs The value is close to the correct decoded value in the case where there is no error, and it is possible to suppress the deterioration of the sound quality in audibility.
特に、 歪みの総和の最小化を特定のビット数以内のハミング距離の符号間に 限定することにより、 少ないビット数のビット誤りが生じた際の劣化をより有 効に抑えることができる。 また、 ハミング距離が特定のビット数を越える符号 対 i— a, i— bをランダムに選択することにより、 より効率的で歪み総和を小さく することができる。 従って、 ビット誤りが発生した場合でも、 聴感上の音声品 質劣化をより抑えることができる。  In particular, by minimizing the sum of distortions between codes having a Hamming distance within a specific number of bits, it is possible to more effectively suppress deterioration when a bit error with a small number of bits occurs. Further, by randomly selecting a code pair i−a, i−b whose Hamming distance exceeds a specific number of bits, it is possible to reduce the sum of distortions more efficiently. Therefore, even if a bit error occurs, it is possible to further suppress the deterioration of audio quality in the sense of hearing.
なお、 上記ステップ 5 0 3では、 符号帳 Table (i)内からランダムに選択す る符号対し a, i_bを、 ハミング距離が特定のビット数を越えるものに限定して いるが、 本発明はこれに限定されるものではなレ、。  In step 503, the code pairs a and i_b randomly selected from the codebook Table (i) are limited to those having a Hamming distance exceeding a specific number of bits. Not limited to.
(実施の形態 2 ) (Embodiment 2)
実施の形態 2は、 実施の形態 1と同様のハードウェア、 ソフトウェア上で実 現される。 実施の形態 1に適用したラグパラメ一タの符号帳作成方法との相違 は、 歪み尺度を変更した点にある。 The second embodiment is implemented on the same hardware and software as the first embodiment. Difference from lag parameter codebook creation method applied to Embodiment 1 Is that the distortion scale has been changed.
符号帳作成の手順は実施の形態 1に示した図 5と同一の手順である。 実施の 形態 1と異なる点は、 ステップ 502および 504で用いられる符号間の復号 値歪みとして、 (2) 式で示した尺度を用いる点である。 d(fa,fb)=min(wl X d0(fb,fa), w2 d0(£bf2 fa), w3 Xd0(£b,3 Xfa) 但し、 fa=Fs/Ta(Hz) … (2) fb=Fs/Tb(Hz) The procedure for creating the codebook is the same as that in FIG. 5 shown in the first embodiment. The difference from the first embodiment is that the scale shown in equation (2) is used as the decoded value distortion between codes used in steps 502 and 504. d (fa, fb) = min (wl X d0 (fb, fa), w2 d0 (£ b f 2 fa), w3 Xd0 (£ b, 3 Xfa) where fa = Fs / Ta (Hz)… (2 ) fb = Fs / Tb (Hz)
fb≥fa  fb≥fa
dO(fx,fy)=|fx-fy|/(fxXfy)1 2 ここで、 T a、 Tbは対象とする符号 し a,i— b の復号ラグ値 (単位:サンプ ル)、 f a、 f l^¾T a、 Tbに対する周波数値 (Hz:)、 F sはサンプリング周 波数 (Hz)であり、 d (fa,fb)は符号対の間の復号値歪みを表す。 dO (fx, fy) = | fx-fy | / (fxXfy) 1 2 Here, T a and T b are the target codes a, i—b the decoding lag value (unit: sample), fa, fl ^ ¾T a, frequency values for Tb and Tb (Hz :), F s is the sampling frequency (Hz), and d (fa, fb) is the decoded value distortion between code pairs.
(2) 式は、 ラグパラメータ値の歪みを単なるユークリッド距離に類したも ので表すものではない。 (2) 式は、 1つのラグ値と他方のラグ値の整数倍の 値との間での差を考慮して定義したもの (wl,w2,w3 はその整数倍の値との歪 みに対する重み定数) の一例であり、 同様な考え方を実現する他の定義を用い ることもできる。  Equation (2) does not represent the lag parameter value distortion as a mere Euclidean distance. Equation (2) is defined taking into account the difference between one lag value and an integer multiple of the other lag value (wl, w2, and w3 are the distortions from the integer multiple). Weighting constant), and other definitions realizing the same concept can be used.
このような歪み尺度を用いることにより、 特定のビット数以内のハミング距 離を持つ符号間の復号値が、 片方の復号値の整数倍に近い値となる。 既に説明 したように、 ラグパラメータは、 音声信号に含まれるピッチ周期に関連するパ ラメ一タであり、 ビット誤り等により復号ラグ値が正しいラグ値の整数倍( 1 倍を含む) または整数分の 1付近の値を有する場合、 その値を用いて復号また は合成された音声信号は、 そのスぺク トルが正しいピッチ周期の周波数成分を その一部として含むため、 聴感上の劣化は比較的少なくて済む。  By using such a distortion measure, the decoded value between codes having a Hamming distance within a specific number of bits becomes a value close to an integral multiple of one of the decoded values. As described above, the lag parameter is a parameter related to the pitch period included in the audio signal, and the decoding lag value is an integer multiple (including 1) or an integer component of the correct lag value due to a bit error or the like. If the audio signal has a value near 1 of the above, the audio signal decoded or synthesized using that value has a frequency component of the correct pitch period as a part of the spectrum, so that the deterioration in auditory perception is compared. You need less.
また、 そのような整数倍付近の値を小さい歪みとして定義できること、 およ び特定のビット数以内のハミング距離を持つ符号間に限定して歪み最小化によ り符号帳を作成することにより、 より歪み総和を少なくできる。 よって、 上記 方法によりラグパラメータの符号帳を作成すれば、 ラグパラメータのような誤 りによる復号値のずれに敏感なパラメ一タについても、 ビット誤り時の聴感上 の品質劣化をより効果的に抑えて、 符号化、 復号化を行うことができる。 In addition, it is possible to define a value near such an integral multiple as a small distortion, and By creating a codebook by minimizing distortion only between codes having a Hamming distance within a specific number of bits, the total distortion can be further reduced. Therefore, if the codebook of the lag parameter is created by the above method, even for parameters such as the lag parameter that are sensitive to the deviation of the decoded value due to errors, the deterioration of the auditory quality at the time of bit error can be more effectively reduced. In addition, encoding and decoding can be performed.
上述のとおり、 本発明に係るラグパラメータの符号化方法の発明は、 音声信 号の符号化パラメータであるラグパラメータを符号化する方法であって、 ラグ パラメータの符号にビット誤りが生じたときに、 復号ラグパラメータ値がビッ 卜誤りのない場合の復号ラグパラメータ値の整数倍 (1倍を含む) または整数 分の 1の値付近で誤る割合を増加させるように設定されたラグパラメータ符号 帳、 を用いてラグパラメータを符号化するものである。  As described above, the invention of the lag parameter encoding method according to the present invention is a method for encoding a lag parameter which is an audio signal encoding parameter. A lag parameter codebook that is set to increase the error rate around an integer multiple (including 1) or a fraction of the integer of the decoding lag parameter when there is no bit error in the decoding lag parameter, Is used to encode the lag parameter.
また、 本発明に係るラグパラメータの複号化方法の発明は、 符号化側におい て上記態様記載の符号化方法によつて符号化されたラグパラメータの符号を、 符号化側と同じラグパラメータ符号帳を用いて復号化するものである。  Further, the invention of the lag parameter decoding method according to the present invention provides a lag parameter code that is encoded on the encoding side by the encoding method described in the above aspect, the same as the lag parameter code on the encoding side. It is decrypted using a book.
このように、 符号にビット誤りが生じた際の復号ラグパラメータ値がビット 誤りのない場合の復号ラグパラメータ値の整数倍 (1倍を含む) または整数分 の 1の値付近で誤る割合を増加させるように設定された符号帳を用いることに より、 ラグパラメータが正しい復号値の整数倍 (1倍を含む) または整数分の 1の値付近で誤っても聴感上の劣化が少ないという特性を利用して、 符号にビ ット誤りが生じた場合の聴感上の音声品質劣化を抑えることができる。  In this way, the decoding lag parameter value when a bit error occurs in the code increases the error rate when the decoding lag parameter value is an integer multiple (including 1) or around the integral value of 1 when there is no bit error. By using a codebook that is set to cause the lag parameter to have a characteristic that there is little deterioration in auditory perception even if the lag parameter is erroneous near an integer multiple (including 1) or a fraction of the correct decoded value. By using this, it is possible to suppress the deterioration of audio quality in audibility when a bit error occurs in the code.
また、 本発明に係る符号帳作成方法の発明は、 符号帳内で所定ビット数以内 のハミング距離を有する符号間の復号値歪みの符号帳内の総和を最小又は最小 に近い値とするように符号帳を作成する方法である。 符号にビット誤りが生じ た際に、 その復号値が誤りのない場合の正しい復号値に近い値とすることによ り、 聴感上の音声品質の劣化を抑えることができ、 歪み総和の最小化の対象を 特定のビット数以内のハミング距離の符号間に限定することにより、 少ないビ ッ 卜数でのビット誤りが生じた際の音質の劣化をより有効に抑えることができ る。 Further, the invention of the codebook creating method according to the present invention is such that the sum in the codebook of the decoded value distortion between codes having a Hamming distance within a predetermined number of bits in the codebook is set to a minimum or a value close to the minimum. This is a method of creating a codebook. When a bit error occurs in the code, the decoded value is set to a value close to the correct decoded value when there is no error. By restricting the target to codes between Hamming distances within a specific number of bits, Deterioration of sound quality when a bit error occurs in the number of bits can be suppressed more effectively.
また、 上記符号帳作成の際には、 初期符号帳においてハミング距離が所定ビ ット数以内の符号間の復号値歪みの総和を算出する工程と、 符号帳内から符号 対をランダムに選択する工程と、 前記符号対の間でその復号値を交換した後で 前記所定ビット数以内のハミング距離を有する符号間の復号値歪みの総和を算 出する工程と、 前記復号値歪みの総和がそれ以前に算出された前記歪み総和よ り小さい場合に、 前記復号値の交換および歪み総和の更新を行う工程と、 前記 歪み総和の収束を判定する工程とを含み、 前記歪み総和が収束するまで、 前記 符号対をランダムに選択する工程、 復号値の交換および歪み総和の更新を行う 工程、 及び歪み総和の収束判定の工程を繰り返すようにすればよい。  In addition, when creating the codebook, a step of calculating the sum of decoded value distortions between codes having a Hamming distance within a predetermined number of bits in the initial codebook, and randomly selecting a code pair from the codebook Calculating the sum of the decoded value distortions between codes having a Hamming distance within the predetermined number of bits after exchanging the decoded value between the code pairs; and When the sum of the distortions is smaller than the previously calculated sum of the distortions, a step of exchanging the decoded values and updating the sum of the distortions; and a step of determining the convergence of the sum of the distortions. The steps of randomly selecting the code pair, exchanging decoded values and updating the distortion sum, and determining the convergence of the distortion sum may be repeated.
また、 ラグパラメータ符号間の復号値歪みの判断に、 復号ラグパラメータ値 の整数倍または整数分の 1の値で歪みが小さく評価されるような歪み尺度を用 いると好ましく、 これにより、 ラグパラメータが正しい復号値の整数倍 (1倍 を含む) または整数分の 1の値の付近に誤っても聴感上の劣化が少ないという 特性を利用して符号にビット誤りが生じた場合の聴感上の音声品質劣化を抑え ることができる。  In addition, it is preferable to use a distortion criterion such that the distortion is evaluated to be small at a value that is an integral multiple or a fraction of the decoding lag parameter value in determining the decoded value distortion between the lag parameter codes. Using the characteristic that even if an error is near an integer multiple (including 1) of the correct decoded value or a value that is a fraction of an integer, there is little deterioration in auditory perception. Audio quality degradation can be suppressed.
また、 上記符号化方法および復号化方法により、 又は、 上記いずれかの符号 帳作成方法で作成された符号帳を用いて、 ラグパラメータの符号化 ·復号化を 行うラグパラメータ符号化 ·複号化方法を実現できる。  In addition, lag parameter encoding and decoding for encoding and decoding lag parameters by using the above encoding method and decoding method, or using a codebook created by any of the above codebook creating methods. The method can be realized.
また、 本発明を、 音声信号の符号化パラメータであるラグパラメータのパラ メータ値と符号との対応を表す符号帳と、 前記符号帳を用いてラグパラメータ を符号化するラグパラメータ符号器とを備えた、 音声符号化装置として実現す ることもできる。 また、 上記符号化装置によって符号化されたラグパラメ一タ の符号を、 符号化側と同じ符号帳を用いて復号化するラグパラメータ復号器を 備えた音声復号化装置として実現することもできる。 さらに、 上記ラグパラメ —タ符号化 ·復号化装置を一つの装置で実現することもできる。 Further, the present invention includes a codebook representing a correspondence between a parameter value of a lag parameter, which is a coding parameter of an audio signal, and a code, and a lag parameter encoder for coding the lag parameter using the codebook. Also, it can be realized as a speech encoding device. Further, the present invention can also be realized as a speech decoding device including a lag parameter decoder that decodes the lag parameter code encoded by the encoding device using the same codebook as the encoding side. In addition, The data encoding / decoding device can be realized by one device.
また、上記符号化方法をコンピュータソフトウエアで実現することもできる。 具体的には、 コンピュータによる読み取りの可能な媒体と、 音声信号の符号化 パラメータであるラグパラメータの符号にビット誤りが生じたときに復号ラグ パラメータ値がビッ ト誤りのない場合の復号ラグパラメータ値の整数倍 (1倍 を含む) または整数分の 1の値の付近に誤るように設定されたラグパラメータ 符号帳を用いてコンピュータ ·プロセッサにラグパラメータを符号化させるプ 口グラム命令手段を具備し、 前記プログラム命令手段が実行可能な形式で前記 媒体に記憶されていて、 前記プロセッサによる実行の際にコンピュータ · メモ リに口一ドされてコンピュータを動かすようにすればよレ、。  Further, the above-mentioned encoding method can be realized by computer software. More specifically, a computer readable medium and a decoding lag parameter value when the decoding lag parameter value has no bit error when a bit error occurs in the code of the lag parameter which is an encoding parameter of the audio signal. A lag parameter set to be erroneous in the vicinity of an integer multiple (including 1) or a fraction of an integer. A program instruction means for causing a computer processor to encode a lag parameter using a codebook is provided. The program instructing means may be stored in an executable form on the medium, and may be operated by a computer when being executed by the processor.
同様に、 上記複号化方法をコンピュータソフ トウェアで実現することも、 勿 論可能である。  Similarly, it is of course possible to realize the above-mentioned decoding method by computer software.
また、 上記符号化ソフトウェアを、 各種記憶媒体に記憶させて利用すること もできる。 それは、 コンピュータに、 音声信号の符号化パラメータであるラグ パラメータの符号にビッ 卜誤りが生じたときに復号ラグパラメータ値がビット 誤りのない場合の復号ラグパラメータ値の整数倍 (1倍を含む) または整数分 の 1の値の付近に誤るように設定されたラグパラメータ符号帳を用いてラグパ ラメータを符号化させるプログラムを記憶した機械読み取り可能な記憶媒体で ある。 そして、 それはコンピュータにダウンロードされ、 コンピュータを動作 させることにより上記符号化方法を実現する。  Further, the encoding software can be stored in various storage media and used. That is, when a bit error occurs in the code of the lag parameter, which is the coding parameter of the audio signal, the decoding lag parameter value is an integer multiple (including 1) of the decoding lag parameter value when there is no bit error. Alternatively, it is a machine-readable storage medium that stores a program that encodes a lag parameter using a lag parameter codebook that is set to be erroneous near a value of 1 in an integer. Then, it is downloaded to a computer, and the above encoding method is realized by operating the computer.
同様に、 上記複号化ソフトウェアを、 各種記憶媒体に記憶させて利用するこ とも勿論可能である。  Similarly, it is of course possible to store the decryption software in various storage media and use it.
また、 コンピュータによる読み取りの可能な媒体と、 符号帳内で所定ビット 数以内のハミング距離を有する符号間の復号値歪みの総和を最小又は最小に近 い値とするようにコンピュータ 'プロセッサに符号帳を作成させるプログラム 命令手段とを備え、 前記プログラム命令手段が実行可能な形式で前記媒体に記 憶されていて、 前記プロセッサによる実行の際にコンピュータ■メモリにロー ドされてコンピュータを動かす符号帳作成装置としても実現できる。 In addition, the computer and the processor must have a codebook so that the sum of the decoded value distortion between the code readable by the computer and the code having a Hamming distance within a predetermined number of bits in the codebook is a minimum or a value close to the minimum. And a program instruction means for creating the program. It can be realized as a codebook creating device that is loaded into a computer memory when the processor executes the codebook and runs a computer.
尚、 本発明は、 誤り検出を行わない場合にも適用可能であるが、 勿論、 誤り 検出と併用して使用することもできる。 更に、 ラグパラメータの符号化を行う 全ての音声符号化復号化方法に適用することができる。  The present invention can be applied to a case where no error detection is performed. However, it is needless to say that the present invention can be used in combination with the error detection. Further, the present invention can be applied to all voice coding / decoding methods that perform lag parameter coding.
この出願は、 1 9 9 8年 1月 2 7日に出願された日本国特許出願平成 1 0年 2 9 3 3 2号に基づいている。 その全ての内容は、 ここに含まれている。 産業上の利用可能性  This application is based on Japanese Patent Application No. 2003-93332 filed on Jan. 27, 1998. All its contents are included here. Industrial applicability
本発明による符号化装置、 復号化装置及び符号化方法、 複号化方法は、 音声 符号化装置、音声複号化装置を有する機器に広く適用することができる。特に、 デジタル携帯電話等の無線通信装置に適用すれば、 聴感上の品質劣化を効率的 に抑止できるので好ましい。  INDUSTRIAL APPLICABILITY The encoding device, the decoding device, the encoding method, and the decoding method according to the present invention can be widely applied to devices having a speech encoding device and a speech decoding device. In particular, it is preferable to apply the present invention to a wireless communication device such as a digital mobile phone, because it is possible to efficiently suppress deterioration in auditory quality.

Claims

請求の範囲 The scope of the claims
1 . 音声信号の符号化パラメータであるラグパラメータを符号化する方法であ つて、 ラグパラメータの符号にビット誤りが生じたときに復号ラグパラメータ 値がビット誤りのない場合の復号ラグパラメータ値の整数倍 (1倍を含む) ま たは整数分の 1の値の付近に誤るように設定されたラグパラメータ符号帳を用 いてラグパラメータを符号化することを特徴とするラグパラメータの符号化方 法。  1. A method of encoding a lag parameter, which is an encoding parameter of an audio signal, where the decoding lag parameter value is an integer when there is no bit error when a bit error occurs in the lag parameter code. A lag parameter encoding method characterized by encoding a lag parameter using a lag parameter codebook that is set to be erroneous near a multiple (including 1) or a value that is a fraction of an integer. .
2 . 符号化側において請求項 1記載の符号化方法によって符号化されたラグパ ラメータの符号を、 符号化側と同じラグパラメータ符号帳を用いて複号化する ことを特徴とするラグパラメータの複号化方法。  2. The encoding of the lag parameter encoded by the encoding method according to claim 1 on the encoding side by using the same lag parameter codebook as the encoding side. Encoding method.
3 . 符号帳内で所定ビット数以内のハミング距離を有する符号間の復号値歪み の総和を最小又は最小に近い値とするように符号帳を作成することを特徴とす る符号帳作成方法。  3. A codebook creating method characterized in that a codebook is created so that the total sum of decoded value distortions between codes having a Hamming distance within a predetermined number of bits in the codebook is a minimum or a value close to the minimum.
4 . 初期符号帳においてハミング距離が所定ビット数以内の符号間の復号値歪 みの総和を算出する工程と、符号帳内から符号対をランダムに選択する工程と、 前記符号対の間でその復号値を交換した後で前記所定ビット数以内のハミング 距離を有する符号間の復号値歪みの総和を算出する工程と、 前記復号値歪みの 総和がそれ以前に算出された前記歪み総和より小さい場合に、 前記復号値の交 換および歪み総和の更新を行う工程と、 前記歪み総和の収束を判定する工程と を含み、  4. In the initial codebook, a step of calculating a sum of decoded value distortions between codes whose Hamming distance is within a predetermined number of bits, a step of randomly selecting a code pair from the codebook, Calculating the sum of the decoded value distortions between codes having a Hamming distance within the predetermined number of bits after exchanging the decoded values; and if the sum of the decoded value distortions is smaller than the previously calculated sum of the distortions. Replacing the decoded values and updating the sum of distortions; and determining the convergence of the sum of distortions.
前記歪み総和が収束するまで、 前記符号対をランダムに選択する工程、 復 号値の交換および歪み総和の更新を行う工程、 及び歪み総和の収束判定の工程 を繰り返すことを特徴とする請求項 3記載の符号帳作成方法。  4. The method according to claim 3, wherein the steps of randomly selecting the code pair, exchanging decoding values and updating the distortion sum, and determining the convergence of the distortion sum are repeated until the distortion sum converges. Codebook creation method described.
5 . 符号間の復号値歪みとして、 復号ラグパラメ一タ値の整数倍または整数分 の 1の値で歪みが小さく評価されるような歪み尺度を用レ、ることを特徴とする 請求項 3記載の符号帳作成方法。 請求項 3記載の符号帳作成方法。 5. The decoded value distortion between codes, wherein a distortion scale is used such that the distortion is evaluated to be small at an integral multiple of the decoding lag parameter value or at a value of 1 of an integer. Codebook creation method. The codebook creation method according to claim 3.
6 . 符号間の復号値歪みとして、 復号ラグパラメータ値の整数倍または整数分 の 1の値で歪みが小さく評価されるような歪み尺度を用いることを特徴とする 請求項 4記載の符号帳作成方法。  6. The codebook creation according to claim 4, characterized in that a distortion measure is used such that the distortion is evaluated to be small at an integral multiple of the decoding lag parameter value or 1 / integer as the decoding value distortion between codes. Method.
7 . 請求項 1記載の符号化方法および請求項 2記載の複号化方法により、 ラグ パラメータの符号化 ·複号化を行うことを特徴とするラグパラメータ符号化 · 復号化方法。 7. A lag parameter encoding / decoding method characterized by performing lag parameter encoding / decoding by the encoding method according to claim 1 and the decoding method according to claim 2.
8 . 請求項 3に記載の符号帳作成方法で作成された符号帳を用いて、 ラグパラ メータの符号化 ·複号化を行うことを特徴とするラグパラメータ符号化■復号 化方法。  8. A lag parameter encoding / decoding method, characterized in that lag parameters are encoded and decoded using the code book created by the code book creating method according to claim 3.
9 . 請求項 4記載の符号帳作成方法で作成された符号帳を用いて、 ラグパラメ —タの符号化 ·復号化を行うことを特徴とするラグパラメータ符号化 ·復号化 方法。  9. A lag parameter encoding / decoding method, characterized in that lag parameters are encoded / decoded using the codebook created by the codebook creating method according to claim 4.
1 0 . 請求項 5記載の符号帳作成方法で作成された符号帳を用いて、 ラグパラ メータの符号化 ·復号化を行うことを特徵とするラグパラメータ符号化 ·復号 化方法。  10. A lag parameter encoding / decoding method characterized in that lag parameters are encoded / decoded using the codebook created by the codebook creating method according to claim 5.
1 1 . 請求項 6記載の符号帳作成方法で作成された符号帳を用いて、 ラグパラ メータの符号化 ·復号化を行うことを特徴とするラグパラメータ符号化 ·復号 化方法。  11. A lag parameter encoding / decoding method characterized by performing lag parameter encoding / decoding using the codebook created by the codebook creating method according to claim 6.
1 2 . 音声信号の符号化パラメータであるラグパラメータのパラメータ値と符 号との対応を表す符号帳と、 前記符号帳を用いてラグパラメータを符号化する ラグパラメータ符号器とを備え、 前記符号帳が、 符号にビット誤りが生じた際 の復号ラグパラメータ値がビット誤りのない場合の復号ラグパラメータ値の整 数倍 (1倍を含む) または整数分の 1の値の付近に誤る割合を増加させるよう に設定されていることを特徴とするラグパラメータの符号化装置。  12. A codebook representing a correspondence between a parameter value of a lag parameter, which is a coding parameter of an audio signal, and a code, and a lag parameter encoder for coding a lag parameter using the codebook, wherein the code The ratio of the error in the book when the decoding lag parameter value when a bit error occurs in the code is around an integral multiple (including 1) or 1 / integer value of the decoding lag parameter value when there is no bit error. A lag parameter encoding device characterized by being set to increase.
1 3 . 符号化側において請求項 1 2記載の符号化装置によって符号化されたラ 17 グパラメータの符号を、 符号化側と同じ符号帳を用いて復号化するラグパラメ —タ復号器を備えたラグパラメ一タの復号化装置。 13 3. On the encoding side, a code encoded by the encoding device according to claim 12 A lag parameter decoding device equipped with a lag parameter decoder that decodes the code of the lag parameter using the same codebook as the encoding side.
1 4 .請求項 1 2記載の符号化装置および請求項 1 3記載の復号化装置により、 ラグパラメータの符号ィヒ ·復号化を行うラグパラメータ符号化 ·複号化装置。  14. A lag parameter coding / decoding device that performs lag parameter coding / decoding by the coding device according to claim 12 and the decoding device according to claim 13.
1 5 . 請求項 1 4記載のラグパラメータ符号化 ·復号化装置を備えた音声符号 化 ·復号化装置。 15. An audio encoding / decoding device comprising the lag parameter encoding / decoding device according to claim 14.
1 6 . 請求項 1 5記載の音声符号化 '復号化装置を具備することを特徴とする 無線通信装置。  16. A wireless communication device comprising the speech encoding / decoding device according to claim 15.
1 7 . コンピュータによる読み取りの可能な媒体と、 音声信号の符号化パラメ —タであるラグパラメータの符号にビット誤りが生じたときに復号ラグパラメ 17. Computer-readable media and decoding lag parameters when a bit error occurs in the lag parameter code, which is an audio signal coding parameter.
—タ値がビッ ト誤りのない場合の復号ラグパラメータ値の整数倍 (1倍を含 む) または整数分の 1の値の付近に誤るように設定されたラグパラメータ符号 帳を用いてコンピュータ ·プロセッサにラグパラメータを符号化させるプログ ラム命令手段を具備し、 The computer uses a lag parameter codebook that is set to be erroneous near an integer multiple (including 1) or a fraction of the integer value of the decoding lag parameter when there is no bit error. A program instruction means for causing a processor to encode a lag parameter,
前記プログラム命令手段が実行可能な形式で前記媒体に記憶されていて、 前記プロセッサによる実行の際にコンピュータ · メモリにロードされてコンビ ユータを動かす符号化装置。  An encoding device in which the program instruction means is stored in an executable form on the medium, and is loaded into a computer memory to move the computer when the processor is executed.
1 8 . コンピュータによる読み取りの可能な媒体と、 音声信号の符号化パラメ ータであるラグパラメータの符号にビット誤りが生じたときに復号ラグパラメ —タ値がビット誤りのない場合の復号ラグパラメータ値の整数倍 (1倍を含 む) または整数分の 1の値の付近に誤るように設定されたラグパラメ一タ符号 帳を用いてコンピュータ ·プロセッサにラグパラメータの符号を復号化させる プログラム命令手段を具備し、  1 8. Decoding lag parameter value when there is no bit error when a bit error occurs in the medium that can be read by a computer and the lag parameter code that is the coding parameter of the audio signal. A program instruction means for causing a computer processor to decode the lag parameter code using a lag parameter codebook set to be erroneous near an integral multiple (including 1) or a fraction of an integer Have,
前記プログラム命令手段が実行可能な形式で前記媒体に記憶されていて、 前記プロセッサによる実行の際にコンピュータ ·メモリにロードされてコンビ ユータを動かす復号化装置。 A decoding device in which the program instruction means is stored in an executable form on the medium, and is loaded into a computer memory to move a computer when the processor executes the program instruction means.
1 9 . コンピュータによる読み取りの可能な媒体と、 符号帳内で所定ビット数 以内のハミング距離を有する符号間の復号値歪みの総和を最小又は最小に近い 値とするようにコンピュータ ·プロセッサに符号帳を作成させるプログラム命 令手段とを備え、 19. The codebook is sent to the computer processor so that the sum of the decoded value distortions between the code readable by the computer and the code having the Hamming distance within a predetermined number of bits in the codebook is a minimum or a value close to the minimum. And program instruction means for creating
前記プログラム命令手段が実行可能な形式で前記媒体に記憶されていて、 前記プロセッサによる実行の際にコンピュータ■メモリにロードされてコンビ ユータを動かす符号帳作成装置。  A codebook creating apparatus in which the program instruction means is stored in an executable form on the medium, and is loaded into a computer memory to run a computer when executed by the processor.
PCT/JP1999/000294 1998-01-27 1999-01-26 Method and device for coding lag parameter and code book preparing method WO1999038157A1 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CA002283203A CA2283203A1 (en) 1998-01-27 1999-01-26 Method and device for coding lag parameter and code book preparing method
AU20751/99A AU2075199A (en) 1998-01-27 1999-01-26 Method and device for coding lag parameter and code book preparing method
KR1019997008737A KR20010005669A (en) 1998-01-27 1999-01-26 Method and device for coding lag parameter and code book preparing method
EP99901171A EP0971338A1 (en) 1998-01-27 1999-01-26 Method and device for coding lag parameter and code book preparing method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP10/29332 1998-01-27
JP2933298 1998-01-27

Publications (1)

Publication Number Publication Date
WO1999038157A1 true WO1999038157A1 (en) 1999-07-29

Family

ID=12273290

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1999/000294 WO1999038157A1 (en) 1998-01-27 1999-01-26 Method and device for coding lag parameter and code book preparing method

Country Status (6)

Country Link
EP (1) EP0971338A1 (en)
KR (1) KR20010005669A (en)
CN (1) CN1256001A (en)
AU (1) AU2075199A (en)
CA (1) CA2283203A1 (en)
WO (1) WO1999038157A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8819523B2 (en) * 2011-05-19 2014-08-26 Cambridge Silicon Radio Limited Adaptive controller for a configurable audio coding system
US8793557B2 (en) 2011-05-19 2014-07-29 Cambrige Silicon Radio Limited Method and apparatus for real-time multidimensional adaptation of an audio coding system
CN103474075B (en) * 2013-08-19 2016-12-28 科大讯飞股份有限公司 Voice signal sending method and system, method of reseptance and system
US10840944B2 (en) * 2017-07-25 2020-11-17 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, data structure of code string, encoding method, decoding method, encoding program and decoding program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288476A (en) * 1994-04-15 1995-10-31 Matsushita Electric Ind Co Ltd Coded signal decoding method/device
JPH09261070A (en) * 1996-03-22 1997-10-03 Sony Corp Digital audio signal processing unit
JPH10200580A (en) * 1997-01-16 1998-07-31 Matsushita Electric Ind Co Ltd Method for reproducing voice packet
JPH10209881A (en) * 1997-01-24 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> Method for encoding error correction and method for decoding the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288476A (en) * 1994-04-15 1995-10-31 Matsushita Electric Ind Co Ltd Coded signal decoding method/device
JPH09261070A (en) * 1996-03-22 1997-10-03 Sony Corp Digital audio signal processing unit
JPH10200580A (en) * 1997-01-16 1998-07-31 Matsushita Electric Ind Co Ltd Method for reproducing voice packet
JPH10209881A (en) * 1997-01-24 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> Method for encoding error correction and method for decoding the same

Also Published As

Publication number Publication date
CN1256001A (en) 2000-06-07
KR20010005669A (en) 2001-01-15
CA2283203A1 (en) 1999-07-29
EP0971338A1 (en) 2000-01-12
AU2075199A (en) 1999-08-09

Similar Documents

Publication Publication Date Title
KR100718712B1 (en) Decoding device and method, and medium for providing a program
JP4731775B2 (en) LPC harmonic vocoder with super frame structure
KR101592968B1 (en) Device and method for quantizing and inverse quantizing lpc filters in a super-frame
US9123328B2 (en) Apparatus and method for audio frame loss recovery
WO2006025313A1 (en) Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method
JP4263412B2 (en) Speech code conversion method
US8255210B2 (en) Audio/music decoding device and method utilizing a frame erasure concealment utilizing multiple encoded information of frames adjacent to the lost frame
JPH11122120A (en) Coding method and device therefor, and decoding method and device therefor
RU2701075C1 (en) Audio signal processing device, audio signal processing method and audio signal processing program
JP2004138756A (en) Voice coding device, voice decoding device, and voice signal transmitting method and program
US20170309287A1 (en) Signal codec device and method in communication system
US9129590B2 (en) Audio encoding device using concealment processing and audio decoding device using concealment processing
JP4414705B2 (en) Excitation signal encoding apparatus and excitation signal encoding method
WO1999038157A1 (en) Method and device for coding lag parameter and code book preparing method
EP1617411B1 (en) Code conversion method and device
JP2004302259A (en) Hierarchical encoding method and hierarchical decoding method for sound signal
US7873512B2 (en) Sound encoder and sound encoding method
JP4236675B2 (en) Speech code conversion method and apparatus
JP6713424B2 (en) Audio decoding device, audio decoding method, program, and recording medium
JPH11316600A (en) Method and device for encoding lag parameter and code book generating method
JP4597360B2 (en) Speech decoding apparatus and speech decoding method
US8418032B2 (en) Processing of bit errors in a digital audio bit frame
JP2001265390A (en) Voice coding and decoding device and method including silent voice coding operating with plural rates

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 99800072.8

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AL AM AT AU AZ BA BB BG BR BY CA CH CN CU CZ DE DK EE ES FI GB GE GH GM HR HU ID IL IS KE KG KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT UA UG US UZ VN YU ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW SD SZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 09380584

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2283203

Country of ref document: CA

Ref document number: 2283203

Country of ref document: CA

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 1019997008737

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 1999901171

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1999901171

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWP Wipo information: published in national office

Ref document number: 1019997008737

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1019997008737

Country of ref document: KR

WWW Wipo information: withdrawn in national office

Ref document number: 1999901171

Country of ref document: EP