JP3050978B2 - 音声符号化方法 - Google Patents
音声符号化方法Info
- Publication number
- JP3050978B2 JP3050978B2 JP3335009A JP33500991A JP3050978B2 JP 3050978 B2 JP3050978 B2 JP 3050978B2 JP 3335009 A JP3335009 A JP 3335009A JP 33500991 A JP33500991 A JP 33500991A JP 3050978 B2 JP3050978 B2 JP 3050978B2
- Authority
- JP
- Japan
- Prior art keywords
- vocal tract
- parameter
- code
- excitation
- statistical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
化方法に関するものである。
信号の高能率符号化方法は、Atal等による、コード
励振線形予測符号化方式(以下CELP)が有効な手法
である。これは音声信号を声道のパラメータと、励振源
のパラメータとによって表現するものであり、また、励
振源のパラメータを統計コードブックと適応コードブッ
クの2つによってベクトル量子化することについては、
次の文献に開示されている。
Coding with Time-Varying Bit Allocations to Excit
ation and LPC parameters",Proc,ICASSP-89,(1989)
有声音の区間と、過渡的な無声音の区間に分けて考える
ことができ、両者はその統計的な性質は大きく異なって
いる。CELPによる圧縮符号化に関しても、有声音で
は適応コードブックによる音質に対する寄与が非常に大
きいのに対し、無声音ではその寄与はほとんどなく、む
しろ声道パラメータの精度が重要となる。そのため、効
果的な圧縮符号化のためには、有声音の区間のための符
号化方法と、無声音に対する符号化方法を別々に用意す
ることが望ましい。
振コードに重点的に情報を配分し、無声音の場合は声道
パラメータに重点的に情報を配分することにより、高品
質・高能率とした音声の圧縮符号化方法を提供せんとす
るものである。
特定されるCELPの改良である。
ル)を線形予測分析して声道パラメータ(ベクトル)を
求める手段を持つ。また、入力音声信号の声道パラメー
タを量子化して、量子化された声道パラメータ(声道主
パラメータ)とそれに対応した声道パラメータコードを
出力する声道パラメータ量子化手段を持つ。また、入力
音声信号の前記声道パラメータと、補間後のもしくは補
間をともなわない量子化された前記声道パラメータとの
誤差を対象として量子化し、量子化された声道補正パラ
メータとそれに対応した声道パラメータ補正コードとを
出力する声道補正パラメータ量子化手段を持つ。また、
過去の入力音声信号の励振源パラメータを表わす適応励
振ベクトルを記憶している適応コードブックと、予め定
められている励振源パラメータである統計励振ベクトル
を記憶している統計コードブックとを持つ。更に、量子
化された声道パラメータと励振源パラメータとに基づい
て合成音声信号を作成し、前記入力音声信号と当該合成
音声信号(ベクトル)との誤差を評価することによっ
て、励振源出力コードを決定する。
分析を行うことによって有声音か無声音かを判別し、有
声音の場合は、量子化された前記声道パラメータと、前
記適応励振ベクトルと前記統計励振ベクトルとの加算ベ
クトルとに基づいて、前記合成音声信号を作成し、且
つ、前記入力音声信号と当該合成音声信号との誤差を評
価することによって適応励振コードと統計励振コードと
を決定する。
ラメータと量子化された前記声道補正パラメータとの加
算値と、前記統計励振ベクトルとに基づいて、前記合成
音声信号を作成し、前記入力音声信号と当該合成音声信
号との誤差を評価することによって統計励振コードとを
決定し、有声音か無声音かに応じて、それぞれ前記適応
励振コード及び前記声道パラメータ補正コードの一方を
他のコードと多重化して出力語とする。
る、声道パラメータコード、及び有声音か無声音かの判
別結果の有声無声識別コードはフレーム毎に更新される
情報とし、且つ声道パラメータ補正コード、適応励振コ
ード及び統計励振コードはサブフレーム毎に更新される
情報とすることができる。
関を分析して、有声音か無声音かを判別する。
クを用いて長周期の相関を持つ励振信号ベクトルを符号
化する。
ドブックを用いず、その替わりに、声道パラメータの補
正を行うコードブックを用いて、声道パラメータの量子
化、補間などによる誤差を符号化する。
更新させてもサブフレーム毎に更新されてもよく、前者
の場合は、補間処理を後段に持ってこれるため、声道パ
ラメータの見通しが容易であり、そのコードブックの作
成に従来ものが利用できる利点がある。
を示す。
信号系列は、特定のフレーム長単位で入力され、声道分
析器101で入力音声信号は声道分析され、声道パラメ
ータを求める。入力音声信号の声道パラメータは声道パ
ラメータ量子化器102で内臓の量子化テーブルを用い
て量子化される。
た声道パラメータコードC1は各フレームで1回、多重
化器113に送られる。
補間器103で、フレームをさらに分割したサブフレー
ム単位に補間されて用いられる(声道補間パラメータP
h)。
タは量子化、および補間による誤差を含んでいる。そこ
で、サブフレーム毎に声道の分析をやりなおして、現サ
ブフレームで分析の結果得られた、誤差を含まない声道
パラメータとの差から、その誤差を減算器114で求
め、その誤差を声道補正パラメータ量子化器104で内
臓の量子化テーブルを用いて量子化し、声道補正パラメ
ータP2を求めておく。
タP2に対応した声道パラメータ補正コードC2が、各
サブフレームに1回、多重化器113に送られる。
号の長周期の相関を計算し、各サブフレーム毎に、現時
刻の入力音声信号の区間が有声音であるか、無声音であ
るかを判別し、その有声無声識別コードC3を多重化器
113に送る。
チ106を閉じ、スイッチ107を開き、適応コードブ
ック108からの適応励振ベクトルと、統計コードブッ
ク109からの統計励振ベクトルを加算器115で加算
して励振ベクトルを構成し、その励振ベクトルから、補
正を受けない声道補間パラメータPhを用いた合成フィ
ルタ110で合成音声信号を合成し、その合成音声信号
と入力音声信号との誤差を、減算器116と誤差計算器
111とで計算する。
小誤差選択器112で最適な適応励振ベクトルと最適な
統計励振ベクトルを選択する。
ドC4と適応励振ベクトルに対応した適応励振コードC
5とは、各サブフレーム毎に、多重化器113に送られ
る。
チ106を開き、スイッチ107を閉じて、統計コード
ブック109からの統計励振ベクトルのみで励振ベクト
ルを構成し、また、声道パラメータP1と声道補正パラ
メータP2とを加算器117で加算して補正された声道
パラメータを作成し、統計励振のみの励振ベクトルと補
正された声道パラメータを用いた合成フィルタ110で
合成音声信号を合成し、誤差計算器111で入力音声信
号との誤差を求める。
は統計コードブック109についてのみ最適な励振ベク
トルを選択する。
声道パラメータコードP1と、有声無声識別コードC3
と、統計励振コードC5と、また、有声音の場合は、適
応励振コードC2とを、また、無声音の場合は、声道パ
ラメータ補正コードC2とを、多重化して通信回線に送
信する。
C1のみフレーム毎の情報であり、他のコードC2〜C
5はサブフレーム毎の情報である。
器のブロック図を示す。
線から受け取った符号語を、声道パラメータC1、有声
無声識別コードC3、統計励振コードC5、および適応
励振コードC4、もしくは声道補正パラメータコードC
2に分離し、復号器の各部に送る。そのとき、もし有声
音であればスイッチ202を適応コードブック205に
つなぎ、無声音であれば声道補正パラメータ逆量子化器
204につなぐ。
タ逆量子化器203で逆量子化され、声道パラメータP
1となる。さらに、声道パラメータP1は補間器207
で各サブフレーム単位に補間される。
いる場合には、スイッチ210を閉じ、スイッチ209
を開いて、適応コードブック205からの、適応励振コ
ードC4に対応する最適な適応励振ベクトルと、統計コ
ードブック206からの、統計励振コードC5に対応す
る最適な統計励振ベクトルを加算器211で足し合わせ
て、励振ベクトルを構成し、補正を受けない声道補間パ
ラメータPhを用いた合成フィルタ208で再生音声出
力を合成する。
示している場合には、スイッチ210を聞き、スイッチ
209を閉じて、声道補正パラメータ逆量子化器204
で、声道補正パラメータコードC2を逆量子化して声道
補正パラメータP2を求め、声道パラメータPhを加算
器212で補正する。そして、統計コードブック206
からの、統計励振コードC5に対応する最適な統計励振
ベクトルのみから励振ベクトルを構成し、補正された声
道パラメータを用いた合成フィルタ208で再生音声出
力を合成する。
ブロック図を示す。図1の例と異なるのは、有声無声識
別をフレーム単位で行い、サブフレーム単位で行わない
ことである。
信号系列は、特定のフレーム長単位で入力される。
声道分析され、声道パラメータを求める。長周期分析器
105は、入力音声信号の長周期の相関を計算し、現時
刻の入力音声信号の区間が有声音であるか、無声音であ
るかを判別する。その判別(C3)はフレーム単位で行
う。
メータ量子化器102で量子化される。量子化された声
道パラメータはP1は各フレームで1回、多重化器11
3に送られる。
る場合には、量子化される前の声道パラメータと量子化
された後の声道パラメータP1との差から、その誤差を
減算器314で求め、その誤差を声道補正パラメータ量
子化器304で量子化し、サブフレーム毎に声道補正パ
ラメータP2を求めておく。
き、量子化された声道パラメータを補間器303で、フ
レームをさらに分割したサブフレーム単位に補間して用
い、無声音の場合には、スイッチ307を閉じ、量子化
された声道パラメータP1と声道補正パラメータPhを
足し合わせたものを補間器303で補間して用いる。
には、スイッチ106を閉じ、適応コードブック108
からの適応励振ベクトルと、統計コードブック109か
らの統計励振ベクトルを加算器115で加算して励振ベ
クトルを構成し、合成フィルタ110で合成音声信号を
合成し、その合成音声信号と入力音声信号との誤差を、
減算器116と誤差計算器111とで計算する。誤差計
算器111で得られた誤差から、最小誤差選択器112
で最適な適応励振ベクトルと最適な統計励振ベクトルを
選択する。
チ106を開き、統計コードブック109からの統計励
振ベクトルのみで励振ベクトルを構成し、合成フィルタ
110で合成音声信号を合成し、減算器116と誤差計
算器111で入力音声信号との誤差を求める。無声音の
場合には、最小誤差選択器112は統計コードブック1
09についてのみ最適な励振ベクトルを選択する。
声道パラメータコードC1、有声無声識別コードC3、
統計励振コードC5、並びに、適応励振コードC4もし
くは声道補正パラメータコードC2の一方を、多重化
し、通信回線に送信する。
あり、コードC2、C4、C5はフレーム単位に情報で
ある。
器のブロック図を示す。
線から受け取った符号語を、声道パラメータコードC
1、有声無声識別コードC3、統計励振コードC5、お
よび適応励振コードC4、もしくは声道補正パラメータ
コードC2に分離し、復号器の各装置に送る。そのと
き、もし有声音であればスイッチ202を適応コードブ
ック205につなぎ、無声音であれば声道補正パラメー
タ逆量子化器204につなぐ。
タ逆量子化器403で逆量子化され、声道パラメータと
なる。
いる場合には、スイッチ210を開き、スイッチ409
を閉じて、声道補正パラメータ逆量子化器204で、声
道パラメータ補正コードC2を逆量子化して声道補正パ
ラメータP2を求め、声道パラメータを補正する。さら
に、補間器407で各サブフレーム単位に補間される
(Ph)。
統計励振ベクトルコードに対応する最適な統計励振ベク
トルのみから励振信号ベクトルを構成し、補正された声
道パラメータを用いた合成フィルタ408で再生音声出
力を合成する。
示している場合には、スイッチ210を閉じ、スイッチ
409を開いて、適応コードブック205からの、適応
励振コードC4に対応する最適な適応励振ベクトルと、
統計コードブック206からの、統計励振コードC5に
対応する最適な統計励振ベクトルから励振ベクトルを構
成し、補正を受けない声道補間パラメータPhを用いた
合成フィルタ208で再生音声出力を合成する。
するような符号化方法と、無声音に対して効果的に符号
化するような符号化方法を、選択的に用いることを可能
とすることで、より高品質、高能率な音声の圧縮符号化
方法を実現できる。
Claims (2)
- 【請求項1】 入力音声信号を線形予測分析して声道パ
ラメータを求める手段と、 当該声道パラメータを量子化して、量子化された声道パ
ラメータとそれに対応した声道パラメータコードを出力
する声道パラメータ量子化手段と、 入力音声信号の前記声道パラメータと、補間後のもしく
は補間をともなわない量子化された前記声道パラメータ
との誤差を対象として量子化し、量子化された声道補正
パラメータとそれに対応した声道パラメータ補正コード
とを出力する声道補正パラメータ量子化手段と、 過去の入力音声信号の励振源パラメータを表わす適応励
振ベクトルを記憶している適応コードブックと、 予め定められている励振源パラメータである統計励振ベ
クトルを記憶している統計コードブックとを備え、 量子化された声道パラメータと励振源パラメータとに基
づいて合成音声信号を作成し、前記入力音声信号と当該
合成音声信号との誤差を評価することによって、励振源
出力コードを決定する音声符号化方法において、 入力音声信号の長周期分析を行うことによって有声音か
無声音かを判別し、 有声音の場合は、量子化された前記声道パラメータと、
前記適応励振ベクトルと前記統計励振ベクトルとの加算
ベクトルとに基づいて、前記合成音声信号を作成し、且
つ、前記入力音声信号と当該合成音声信号との誤差を評
価することによって適応励振コードと統計励振コードと
を決定し、 無声音の場合は、量子化された前記声道パラメータと量
子化された前記声道補正パラメータとの加算値と、前記
統計励振ベクトルとに基づいて、前記合成音声信号を作
成し、前記入力音声信号と当該合成音声信号との誤差を
評価することによって統計励振コードとを決定し、 有声音か無声音かに応じて、それぞれ前記適応励振コー
ド及び前記声道パラメータ補正コードの一方を他のコー
ドと多重化して出力語とすることを特徴とした音声符号
化方法。 - 【請求項2】 請求項1の音声符号化方法において、 出力語として多重化する、声道パラメータコード、及び
有声音か無声音かの判別結果の有声無声識別コードはフ
レーム毎に更新される情報であり、且つ声道パラメータ
補正コード、適応励振コード及び統計励振コードはサブ
フレーム毎に更新される情報であることを特徴とした音
声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3335009A JP3050978B2 (ja) | 1991-12-18 | 1991-12-18 | 音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3335009A JP3050978B2 (ja) | 1991-12-18 | 1991-12-18 | 音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05165500A JPH05165500A (ja) | 1993-07-02 |
JP3050978B2 true JP3050978B2 (ja) | 2000-06-12 |
Family
ID=18283719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3335009A Expired - Fee Related JP3050978B2 (ja) | 1991-12-18 | 1991-12-18 | 音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3050978B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
JP3319396B2 (ja) | 1998-07-13 | 2002-08-26 | 日本電気株式会社 | 音声符号化装置ならびに音声符号化復号化装置 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
DE60202881T2 (de) | 2001-11-29 | 2006-01-19 | Coding Technologies Ab | Wiederherstellung von hochfrequenzkomponenten |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
-
1991
- 1991-12-18 JP JP3335009A patent/JP3050978B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH05165500A (ja) | 1993-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4550289B2 (ja) | Celp符号変換 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
JP2003044098A (ja) | 音声帯域拡張装置及び音声帯域拡張方法 | |
JP4558205B2 (ja) | スピーチコーダパラメータの量子化方法 | |
EP1096476B1 (en) | Speech signal decoding | |
JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
US6768978B2 (en) | Speech coding/decoding method and apparatus | |
JP3050978B2 (ja) | 音声符号化方法 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP4438280B2 (ja) | トランスコーダ及び符号変換方法 | |
JPH10207496A (ja) | 音声符号化装置及び音声復号装置 | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JP3232701B2 (ja) | 音声符号化方法 | |
KR0155798B1 (ko) | 음성신호 부호화 및 복호화 방법 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3296411B2 (ja) | 音声符号化方法および復号化方法 | |
JP3047761B2 (ja) | 音声符号化装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3107620B2 (ja) | 音声符号化方法 | |
JPH09244695A (ja) | 音声符号化装置及び復号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3192051B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000314 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080331 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090331 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100331 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100331 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110331 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |