JPH113099A

JPH113099A - 音声符号化復号化システム、音声符号化装置及び音声復号化装置

Info

Publication number: JPH113099A
Application number: JP10097513A
Authority: JP
Inventors: Masaya Takahashi; 真哉高橋
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1997-04-16
Filing date: 1998-04-09
Publication date: 1999-01-06

Abstract

(57)【要約】【課題】音声符号化・復号化において、復号化音声に
おける語頭部分や音節先頭部分の音声品質を向上させ
る。【解決手段】音声符号化装置に、入力音声を蓄積しこ
の蓄積結果を蓄積時とは逆方向に出力するバッファ２０
を設け、音声復号化装置に、復号処理によって得られた
音声データを蓄積しこの蓄積結果を蓄積時とは逆方向に
出力するバッファ２１を設けた。この構成によれば、音
源情報の符号化処理の順序において語頭部分の前に有声
音の部分が来るので、語頭部分においてもピッチ周期及
びピッチピークのある音源信号を得ることができ、復号
化音声の語頭部分の品質を向上させることができる。ま
た、過去のフレームからの予測による音声スペクトルの
符号化を用いる構成では、符号化の際音節先頭部分の前
に定常部が来るので、音節先頭部分において効率の良い
スペクトル量子化を行うことができ、復号化音声の音節
先頭部分の品質を向上させることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、音声信号をディ
ジタル信号に圧縮符号化する音声符号化装置、及びこの
音声符号化装置で圧縮符号化された信号を復号化して音
声信号を再生する音声復号化装置に関する。

【０００２】

【従来の技術】低ビットレートにおいても比較的良好な
音声品質を得られる音声符号化方式として、符号駆動線
形予測（ＣＥＬＰ：Code Excited Linear Prediction、
以下「ＣＥＬＰ」と呼ぶ）方式が知られている。

【０００３】図１９は、ＣＥＬＰ方式による従来の音声
符号化装置を示す。また図２０は、ＣＥＬＰ方式による
従来の音声復号化装置を示す。

【０００４】これらは、Draft Recommendation G.729,"
Coding of Speech at 8kbit/s Using Conjugate-struct
ure Algebraic-Code Excited Linear Prediction(CS-AC
ELP)",ITU-T Study Group 15 Contribution Q.12/15, F
eb. 1996に示されたものである。

【０００５】まず、図１９に示すように、従来の音声符
号化装置は、音声符号化部１と多重化処理部８とで構成
されている。音声符号化部１は、スペクトル分析部２、
スペクトル符号化部３、及び音源符号化部５０を含む。
そして、音源符号化部５０は、合成フィルタ４、適応音
源符号帳５、雑音音源符号帳６、び最適音源探索部７で
構成されている。

【０００６】また、図２０に示すように、従来の音声復
号化装置は、分離処理部９と音声復号化部１０とで構成
されている。音声復号化部１０は、スペクトル復号化部
１１、合成フィルタ１４、及び音源復号化部５１を含
む。そして、音源復号化部５１は、適応音源符号帳１
２、雑音音源符号帳１３で構成されている。

【０００７】以下、従来の音声符号化装置及び音声復号
化装置の動作について説明する。

【０００８】まず、図１９の音声符号化装置の動作につ
いて説明する。この音声符号化装置に入力される入力音
声は、アナログ音声信号をＡ／Ｄ変換器で予め離散デー
タ化して得た音声サンプルの時系列である。スペクトル
分析部２は、この入力音声を分析フレーム毎に線形予測
分析して線形予測係数を求めるとともに、更にこの線形
予測係数をＬＳＰ(Line Spectrum Pair:線スペクトル
対)係数ωiにに変換してスペクトル符号化部３に出力す
る。スペクトル符号化部３は、先ず現在のフレームｍに
おける量子化すべき目的ベクトルＬi(m)を、過去の１又
は複数のフレームの量子化された目的ベクトルＬ'i(m-
k)を用いて次式で求める（m,kは自然数）。

【数１】この式においてＰi,kはＭＡ(Moving Average)予測係数
であり、ωi(m)は現在のフレームｍのＬＳＰ係数であ
る。次に、求めたＬi(m)をベクトル量子化してＬ'i(m)
を求め、これに対応する符号を生成して多重化処理部８
に出力する。上式のように量子化すべき目的ベクトルＬ
i(m)は、以前のフレームの量子化された目的ベクトル
Ｌ'i(m-k)とＭＡ予測係数との積の線形和(ＭＡ予測値)
と、現フレームのＬＳＰ係数ωiとの差分(ＭＡ予測誤
差)で与えられるので、以前のフレームと現フレームｍ
のＬＳＰ係数の相関が大きくＭＡ予測誤差が小さくなる
場合(例えば定常母音が継続する場合)はＬｉ(m)の各次
元の値が減少し量子化誤差の少ない効率的な量子化が行
える。逆に以前のフレームと現フレームｍとの相関が少
ない場合はＭＡ予測誤差が大きくなり量子化の効率が劣
化する。

【０００９】次にスペクトル符号化部３は量子化したＬ
ＳＰ係数ω'i(m)を次式を用いて求める。

【００１０】

【数２】そして、スペクトル符号化部３は、求めた量子化ＬＳＰ
係数ω'i(m)を線形予測係数に変換して合成フィルタ４
に出力する。

【００１１】適応音源符号帳５には、過去に求めた音源
信号が記憶されており、最適音源探索部７より入力され
る適応音源符号Ｌに対応した適応音源ベクトルを出力す
る。図２１を用いて適応音源ベクトルの生成方法を説明
する。この図に示すように、適応音源ベクトルは、適応
音源符号帳５内の過去の音源信号から、適応音源符号Ｌ
の長さ（ピッチ周期）のベクトルを切り出し、これを予
め設定されたサブフレーム長になるまで繰り返すことに
より生成する。適応音源符号帳５から出力された適応音
源ベクトルには、適応音源利得βが乗じられる。

【００１２】また、雑音音源符号帳６には、例えばラン
ダム雑音から生成したＮ個の雑音音源ベクトルが記憶さ
れており、最適音源探索部７より入力される雑音音源符
号Ｉに対応した雑音音源ベクトルを出力する。雑音音源
符号帳６から出力された雑音音源ベクトルには、雑音音
源利得γが乗じられる。

【００１３】合成フィルタ４は、適応音源ベクトル、雑
音音源ベクトルに対してそれぞれ適応音源利得β、雑音
音源利得γを乗じて加算したベクトル（以下「音源信
号」と呼ぶ）と、スペクトル符号化部３から供給される
量子化した線形予測係数とを用いて、合成音声を生成す
る。

【００１４】最適音源探索部７は、合成フィルタ４で生
成された合成音声と入力音声との誤差を評価し、この誤
差が最小になる適応音源符号Ｌ、雑音音源符号Ｉ、適応
音源利得β、雑音音源利得γを求め、これら適応音源符
号Ｌ、雑音音源符号Ｉ及び量子化した適応音源利得β及
び雑音音源利得γをそれぞれ多重化処理部８に出力す
る。

【００１５】適応音源符号帳５は、前記誤差が最小にな
る適応音源符号Ｌに対応する適応音源ベクトル、雑音音
源符号Ｉに対応する雑音音源ベクトル、量子化した適応
音源利得β及び雑音音源利得γを用いて生成した音源信
号により、符号帳の内容を更新する。

【００１６】なお、これまで説明した音源符号化部５０
内の合成フィルタ４、適応音源符号帳５、雑音音源符号
帳６、最適音源探索部７の処理をＣＥＬＰにおける音源
符号化と呼ぶ。

【００１７】多重化処理部８は、スペクトル符号化部３
から入力されたＬＳＰ係数に対応する符号と、最適音源
探索部７から入力される適応音源符号Ｌ、駆動音源符号
Ｉ、及び量子化した適応音源利得β、雑音音源利得γに
対応する符号と、を多重化し、符号化データとして外部
へ出力する。

【００１８】次に、図２０に示した音声復号化装置の動
作について説明する。分離処理部９は、図１９の音声符
号化装置から受信した符号化データを多重分離し、適応
音源符号Ｌは適応音源符号帳１２に、雑音音源符号Ｉは
雑音音源符号帳１３に、ＬＳＰ係数の符号はスペクトル
復号化部１１に、それぞれ供給する。また、分離処理部
９は、受信した符号かデータから適応音源利得β及び雑
音音源利得γに対応する符号をそれぞれ分離する。

【００１９】適応音源符号帳１２は、受け取った適応音
源符号Ｌに対応した適応音源ベクトルを出力する。この
適応音源ベクトルには、分離処理部９にて分離された符
号を復号化して得た適応音源利得βが乗じられる。雑音
音源符号帳１３は、受け取った雑音音源符号Ｉに対応し
た雑音音源ベクトルを出力する。この雑音音源ベクトル
には、分離処理部９にて分離された符号を復号化して得
た雑音音源利得γが乗じられる。スペクトル復号化部１
１は、受け取ったＬＳＰ係数の符号から量子化された目
的ベクトルＬi'(m)を求め、以前のフレームで求めた量
子化されたＬ'(m-k)を用い、スペクトル符号化部３と同
様に、量子化されたＬＳＰ係数ω'iを求める。そして、
スペクトル復号化部１１は、このωiから線形予測係数
を求めて合成フィルタ１４に出力する。

【００２０】合成フィルタ１４は、適応音源利得βを乗
じた適応音源ベクトルと雑音音源利得γを乗じた雑音音
源ベクトルとを加算して得た音源信号と、スペクトル復
号化部１１で求められた線形予測係数を用いて、復号化
音声を生成する。このようにして求められた復号化音声
は音声サンプルの時系列である。

【００２１】なお、適応音源符号帳１２は、音声符号化
装置の適応音源符号帳５と同様に、前記音源信号で符号
帳の内容を更新する。

【００２２】これまで説明した音源復号化部５１内の合
成フィルタ１４、適応音源符号帳１２、雑音音源符号帳
１３の処理をＣＥＬＰにおける音源復号化と呼ぶ。

【００２３】

【発明が解決しようとする課題】先ず従来の音声符号化
装置及び音声復号化装置の第一の問題を説明する。

【００２４】定常母音のような有声音声の波形は、数十
ｍｓ（ミリ秒）程度の短い範囲では顕著なピッチ周期性
を持っている。このような有声音声をＣＥＬＰ方式で符
号化する場合、良好な品質の復号化音声を得るために
は、音源信号にもピッチ周期性とピッチ周期毎のパワー
の偏り（以下「ピッチピーク」と呼ぶ）を持つことが必
要とされる。図２１に示したように、適応音源ベクトル
は過去の音源信号の一部をピッチ周期に相当する周期Ｌ
で繰り返すことで得られるので、過去の音源信号にピッ
チ周期性とピッチピークがあれば現在の音源信号に必要
なピッチ周期性とピッチピークをうまく生成できる。

【００２５】しかしながら、単語音声の語頭のように、
初めて有声音になる部分については、その直前の部分の
音源信号にピッチ周期性が無いので、ピッチ周期性のあ
る適応音源ベクトルが得られない。したがって、従来の
音声符号化装置及び音声復号化装置の第一の問題とし
て、ピッチ周期性のある適応音源ベクトルが単語音声の
語頭部分で得られず、その部分の復号化音声の品質が劣
化するという点があった。人間の聴覚は、音声の音韻を
判断する上で語頭部のスペクトル変化を重要な手がかり
としているため、この語頭部分の品質劣化は他の部分以
上に聴覚上重大な問題となる。

【００２６】図２２において、（ａ）は語頭を含む入力
音声の波形の一例を示す。そして、（ｂ）はこの入力音
声に対して従来の音声符号化装置及び音声復号化装置で
生成される音源信号の波形を示し、（ｃ）はこの入力音
声を従来の音声符号化装置で符号化し、従来の音声符号
化装置で復号化した場合に得られる復号化音声の波形を
示す。図２２によれば、従来の音声符号化装置及び音声
復号化装置では、音源信号及び復号化音声において語頭
部分の情報が劣化していることがわかる。

【００２７】次に従来の音声符号化装置及び音声復号化
装置の第二の問題を説明する。

【００２８】従来の音声符号化装置及び音声復号化装置
では、以前のフレームと現フレームのスペクトル(ＬＳ
Ｐ係数)の相関が大きくＭＡ予測誤差が小さくなる場合
(例えば定常母音が継続する場合)は量子化誤差の少ない
効率的な量子化が行え、従って良好品質の復号音声を得
ることができるが、逆に以前のフレームと現フレームと
のスペクトルの相関が少ない部分、例えば語頭部分や語
中で音韻が変化する部分では、ＭＡ予測誤差が大きくな
りスペクトルの量子化の効率が劣化し、良好な品質の復
号音声を得られないという問題があった。

【００２９】この発明は上記問題を解決するためになさ
れたものであり、その目的は、音声符号化復号化システ
ムにおいて、語頭部分などのように無音（又は無声音）
から有声音へ変化する区間の復号音声の品質を向上させ
ることである。また本発明の目的は、以前のフレームと
現フレームのスペクトルの相関が少ない部分の復号音声
の品質を向上させることにある。

【００３０】

【課題を解決するための手段】この発明に係る音声符号
化復号化システムは、入力音声を符号駆動線形予測符号
化方式で符号化する音声符号化装置と、この音声符号化
装置から出力された符号化データを符号駆動線形予測復
号化方式で復号化して音声を再生する音声復号化装置
と、を含む音声符号化復号化システムにおいて、前記音
声符号化装置は、入力音声の音声サンプル列を所定量蓄
積するごとに、蓄積した音声サンプル列を蓄積時とは逆
方向に出力するバッファと、このバッファから出力され
た音声サンプル列に対し符号駆動線形予測符号化式によ
る符号化を行う音声符号化部とを備え、前記音声復号化
装置は、前記音声符号化装置から出力された音声符号化
データを符号駆動線形予測復号化方式によって音声に復
号化する音声復号化部と、この音声復号化部での復号化
により得られた音声サンプル列を所定量蓄積するごと
に、蓄積した音声サンプル列を蓄積時とは逆方向に出力
するバッファとを備えるものである。

【００３１】この発明に係る音声符号化装置は、入力音
声の音声サンプル列を所定量蓄積するごとに、蓄積した
音声サンプル列を蓄積時とは逆方向に出力するバッファ
と、このバッファから出力された音声サンプル列に対し
符号駆動線形予測符号化式による符号化を行う音声符号
化部とを備えるものである。

【００３２】この発明に係る音声復号化装置は、符号化
された音声データを符号駆動線形予測復号化方式によっ
て音声に復号化する音声復号化部と、この音声復号化部
での復号化により得られた音声サンプル列を所定量蓄積
するごとに、蓄積した音声サンプル列を蓄積時とは逆方
向に出力するバッファとを備えるものである。

【００３３】また、この発明に係る音声符号化復号化シ
ステムは、入力音声から音声スペクトルと音源情報とを
求めてそれぞれ符号化する音声符号化装置と、この音声
符号化装置から出力された符号化音声スペクトル及び符
号化音源情報を復号化し、この結果得られた音声スペク
トルと音源情報から音声を再生する音声復号化装置と、
を含む音声符号化復号化システムにおいて、前記音声符
号化装置は、入力音声の音声サンプル列を所定量蓄積す
るごとに、蓄積した音声サンプル列を蓄積時とは逆方向
に出力するバッファと、このバッファから出力された音
声サンプル列をフレーム毎にスペクトル分析して音声ス
ペクトルを求めるスペクトル分析部と、このスペクトル
分析部から出力される音声スペクトルを以前の１又は複
数のフレームの音声スペクトルによる予測処理を用いて
符号化するスペクトル符号化部と、前記バッファから出
力された音声サンプル列から音源情報を求めて符号化す
る音源符号化部とを備え、前記音声復号化装置は、前記
音声符号化装置から出力された符号化音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて復号化するスペクトル復号化部と、前記
音声符号化装置から出力された符号化音源情報を復号化
する音源復号化部と、前記スペクトル復号化部で復号化
された音声スペクトルと前記音源復号化部で復号化され
た音源情報とから音声を合成する合成フィルタと、この
合成フィルタで合成された音声サンプル列を所定量蓄積
するごとに、蓄積した音声サンプル列を蓄積時とは逆方
向に出力するバッファとを備えるものである。

【００３４】また、この発明に係る音声符号化装置は、
入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積した音声サンプル列を蓄積時とは逆方向に出力するバ
ッファと、このバッファから出力された音声サンプル列
をフレーム毎にスペクトル分析して音声スペクトルを求
めるスペクトル分析部と、このスペクトル分析部から出
力される音声スペクトルを以前の１又は複数のフレーム
の音声スペクトルによる予測処理を用いて符号化するス
ペクトル符号化部と、前記バッファから出力された音声
サンプル列から音源情報を求めて符号化する音源符号化
部とを備えるものである。

【００３５】また、この発明に係る音声復号化装置は、
符号化された音声スペクトルを、以前の１又は複数のフ
レームの音声スペクトルによる予測処理を用いて復号化
するスペクトル復号化部と、符号化された音源情報を復
号化する音源復号化部と、前記スペクトル復号化部で復
号化された音声スペクトルと前記音源復号化部で復号化
された音源情報とから音声を合成する合成フィルタと、
この合成フィルタで合成された音声サンプル列を所定量
蓄積するごとに、蓄積した音声サンプル列を蓄積時とは
逆方向に出力するバッファとを備えるものである。

【００３６】また、この発明に係る音声符号化復号化シ
ステムは、入力音声を符号駆動線形予測符号化方式で符
号化する音声符号化装置と、この音声符号化装置から出
力された符号化データを符号駆動線形予測復号化方式で
復号化して音声を再生する音声復号化装置と、を含む音
声符号化復号化システムにおいて、前記音声符号化装置
は、入力音声の音声サンプル列を所定量蓄積するごと
に、蓄積結果の音声サンプル列を、蓄積時と同方向及び
逆方向にそれぞれ出力する双方向バッファと、この双方
向バッファから前記各方向の音声サンプル列を受け取る
ごとに、受け取った音声サンプル列を符号駆動線形予測
符号化方式で符号化するとともに、この符号化処理に伴
い内部的に生成される合成音声のサンプル列と前記入力
音声の音声サンプル列との誤差を算出する音声符号化部
と、前記各方向についての前記誤差を比較し、前記音声
符号化部で求められた符号化データのうち前記誤差の小
さい方の方向についての符号化データを選択し、前記誤
差の小さい方の方向を示す時間方向情報とともに出力す
る比較制御部とを備え、前記音声復号化装置は、前記音
声符号化装置から出力された音声符号化データを符号駆
動線形予測復号化方式によって音声復号化する音声復号
化部と、この音声復号化部での復号化により得られた音
声サンプル列を所定量蓄積するごとに、蓄積した音声サ
ンプル列を、前記音声符号化装置から受け取った時間方
向情報に応じた方向に出力するバッファとを備えるもの
である。

【００３７】また、この発明に係る音声符号化装置は、
入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積結果の音声サンプル列を、蓄積時と同方向及び逆方向
にそれぞれ出力する双方向バッファと、この双方向バッ
ファから前記各方向の音声サンプル列を受け取るごと
に、受け取った音声サンプル列を符号駆動線形予測符号
化方式で符号化するとともに、この符号化処理に伴い内
部的に生成される合成音声のサンプル列と前記入力音声
の音声サンプル列との誤差を算出する音声符号化部と、
前記各方向についての前記誤差を比較し、前記音声符号
化部で求められた符号化データのうち前記誤差の小さい
方の方向についての符号化データを選択し、前記誤差の
小さい方の方向を示す時間方向情報とともに出力する比
較制御部とを備えるものである。

【００３８】また、この発明に係る音声復号化装置は、
符号化された音声データを符号駆動線形予測復号化方式
によって音声復号化する音声復号化部と、この音声復号
化部での復号化により得られた音声サンプル列を所定量
蓄積するごとに、蓄積した音声サンプル列を、受け取っ
た時間方向情報に応じた方向に出力するバッファとを備
えるものである。

【００３９】また、この発明に係る音声符号化復号化シ
ステムは、入力音声から音声スペクトルと音源情報とを
求めてそれぞれ符号化する音声符号化装置と、この音声
符号化装置から出力された符号化音声スペクトル及び符
号化音源情報を復号化し、この結果得られた音声スペク
トルと音源情報から音声を再生する音声復号化装置と、
を含む音声符号化復号化システムにおいて、前記音声符
号化装置は、入力音声の音声サンプル列を所定量蓄積す
るごとに、蓄積結果の音声サンプル列を、蓄積時と同方
向及び逆方向にそれぞれ出力する双方向バッファと、こ
の双方向バッファから前記各方向の音声サンプル列を受
け取るごとに、受け取った音声サンプル列をフレーム毎
にスペクトル分析して音声スペクトルを求めるスペクト
ル分析部と、このスペクトル分析部から出力される音声
スペクトルを以前の１又は複数のフレームの音声スペク
トルによる予測処理を用いて符号化するスペクトル符号
化部と、前記双方向バッファから出力された音声サンプ
ル列から音源情報を求めて符号化し、この結果得られた
符号化音源情報と前記スペクトル符号化部で求められた
符号化音声スペクトルとから合成音声を合成し、この合
成音声のサンプル列と前記入力音声の音声サンプル列と
の誤差を算出する音源符号化部と、前記各方向について
の前記誤差を比較し、前記スペクトル符号化部及び音源
符号化部でそれぞれ求められた前記同方向及び逆方向の
符号化音声スペクトル及び符号化音源情報のうち、前記
誤差の小さい方の方向についての符号化音声スペクトル
及び符号化音源情報を選択し、前記誤差の小さい方の方
向を示す時間方向情報とともに出力する比較制御部とを
備え、前記音声復号化装置は、前記音声符号化装置から
出力された符号化音声スペクトルを、以前の１又は複数
のフレームの音声スペクトルによる予測処理を用いて復
号化するスペクトル復号化部と、前記音声符号化装置か
ら出力された符号化音源情報を復号化する音源復号化部
と、前記スペクトル復号化部で復号化された音声スペク
トルと前記音源復号化部で復号化された音源情報とから
音声を合成する合成フィルタと、この合成フィルタで得
られた音声サンプル列を所定量蓄積するごとに、蓄積し
た音声サンプル列を、前記音声符号化装置から受け取っ
た時間方向情報に応じた方向に出力するバッファとを備
えるものである。

【００４０】また、この発明に係わる音声符号化装置
は、入力音声の音声サンプル列を所定量蓄積するごと
に、蓄積結果の音声サンプル列を、蓄積時と同方向及び
逆方向にそれぞれ出力する双方向バッファと、この双方
向バッファから前記各方向の音声サンプル列を受け取る
ごとに、受け取った音声サンプル列をフレーム毎にスペ
クトル分析して音声スペクトルを求めるスペクトル分析
部と、このスペクトル分析部から出力される音声スペク
トルを以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて符号化するスペクトル符号化部
と、前記双方向バッファから出力された音声サンプル列
から音源情報を求めて符号化し、この結果得られた符号
化音源情報と前記スペクトル符号化部で求められた符号
化音声スペクトルとから合成音声を合成し、この合成音
声のサンプル列と前記入力音声の音声サンプル列との誤
差を算出する音源符号化部と、前記各方向についての前
記誤差を比較し、前記スペクトル符号化部及び音源符号
化部でそれぞれ求められた前記同方向及び逆方向の符号
化音声スペクトル及び符号化音源情報のうち、前記誤差
の小さい方の方向についての符号化音声スペクトル及び
符号化音源情報を選択し、前記誤差の小さい方の方向を
示す時間方向情報とともに出力する比較制御部とを備え
るものである。

【００４１】また、この発明に係わる音声復号化装置
は、符号化された音声スペクトルを、以前の１又は複数
のフレームの音声スペクトルによる予測処理を用いて復
号化するスペクトル復号化部と、符号化された音源情報
を復号化する音源復号化部と、前記スペクトル復号化部
で復号化された音声スペクトルと前記音源復号化部で復
号化された音源情報とから音声を合成する合成フィルタ
と、この合成フィルタで得られた音声サンプル列を所定
量蓄積するごとに、蓄積した音声サンプル列を、前記符
号化された音声スペクトルと音源情報とに対応して受け
取った時間方向情報に応じた方向に出力するバッファと
を備えるものである。

【００４２】また、この発明に関わる音声符号化復号化
システムは、入力音声から音声スペクトルと音源情報を
求めてそれぞれ符号化する音声符号化装置と、この音声
符号化装置から出力された符号化音声スペクトル及び符
号化音源情報を復号化し、この結果得られた音声スペク
トルと音源情報から音声を再生する音声復号化装置と、
を含む音声符号化復号化システムにおいて、前記音声符
号化装置は、入力音声の音声サンプル列を所定量蓄積す
るごとに、蓄積結果の音声サンプル列を、蓄積時と同方
向及び逆方向にそれぞれ出力する双方向バッファと、こ
の双方向バッファから前記各方向の音声サンプル列を受
け取るごとに、受け取った音声サンプル列をフレーム毎
にスペクトル分析して音声スペクトルを求めるスペクト
ル分析部とを備えるものである。

【００４３】また、この発明に係わる音声符号化装置
は、入力音声の音声サンプル列を所定量蓄積するごと
に、蓄積結果の音声サンプル列を、蓄積時と同方向及び
逆方向にそれぞれ出力する双方向バッファと、この双方
向バッファから前記各方向の音声サンプル列を受け取る
ごとに、受け取った音声サンプル列をフレーム毎にスペ
クトル分析して音声スペクトルを求めるスペクトル分析
部と、このスペクトル分析部から出力される音声スペク
トルを以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて符号化すると共に、この符号化処
理の際の音声スペクトルの量子化誤差を算出するスペク
トル符号化部と、前記双方向バッファから出力された音
声サンプル列から音源情報を求めて符号化する音源符号
化部と、前記各方向についての前記量子化誤差を比較
し、前記スペクトル符号化部及び音源符号化部でそれぞ
れ求められた前記同方向及び逆方向の符号化音声スペク
トル及び符号化音源情報のうち、前記量子化誤差の小さ
い方の方向についての符号化音声スペクトル及び符号化
音源情報を選択し、前記量子化誤差の小さい方の方向を
示す時間方向情報とともに出力する比較制御部とを備え
るものである。

【００４４】また、本発明に係る音声符号化復号化シス
テムは、入力音声を符号駆動線形予測符号化方式で符号
化する音声符号化装置と、この音声符号化装置から出力
された符号化データを符号駆動線形予測復号化方式で復
号化して音声を再生する音声復号化装置と、を含む音声
符号化復号化システムにおいて、前記音声符号化装置
は、入力音声の音声サンプル列を所定長のフレーム単位
に分割し、各フレームが有音フレーム、無音フレームの
いずれであるかを判定するとともに、この判定結果を示
す有音／無音情報を出力する有音／無音判定部と、入力
音声の音声サンプル列を蓄積しフレーム単位で出力する
バッファであって、有音フレームについては、無音フレ
ームから次の無音フレームまでの間の連続する１以上の
有音フレームからなる有音フレーム区間を単位とし、こ
の有音フレーム区間の音声サンプル列を蓄積時と同方向
及び逆方向に順次出力するバッファと、このバッファか
ら音声サンプル列を受け取るごとに、受け取った音声サ
ンプル列を符号駆動線形予測符号化方式で符号化すると
ともに、この符号化処理に伴い内部的に生成される合成
音声のサンプル列と前記入力音声の音声サンプル列との
誤差を算出する音声符号化部と、前記有音フレーム区間
については、前記各方向についての前記誤差を比較し、
前記音声符号化部で求められた符号化データのうち前記
誤差の小さい方の方向について求められた符号化データ
を選択し、前記誤差の小さい方の方向を示す時間方向情
報とともに出力する比較制御部とを備え、前記音声復号
化装置は、前記音声符号化装置から出力された音声符号
化データを符号駆動線形予測復号化方式によって音声復
号化する音声復号化部と、この音声復号化部での復号化
により得られた音声サンプル列を蓄積しフレーム単位で
出力するバッファであって、前記音声符号化装置から取
得した有音／無音情報に基づき有音フレーム区間を検出
し、この有音フレーム区間については該区間を単位とし
て前記音声符号化装置から受け取った時間方向情報に応
じた方向に音声サンプル列を出力するバッファとを備え
るものである。

【００４５】また、この発明に係る音声符号化装置は、
入力音声の音声サンプル列を所定長のフレーム単位に分
割し、各フレームが有音フレーム、無音フレームのいず
れであるかを判定するとともに、この判定結果を示す有
音／無音情報を出力する有音／無音判定部と、入力音声
の音声サンプル列を蓄積しフレーム単位で出力するバッ
ファであって、有音フレームについては、無音フレーム
から次の無音フレームまでの間の連続する１以上の有音
フレームからなる有音フレーム区間を単位とし、この有
音フレーム区間の音声サンプル列を蓄積時と同方向及び
逆方向に順次出力するバッファと、このバッファから音
声サンプル列を受け取るごとに、受け取った音声サンプ
ル列を符号駆動線形予測符号化方式で符号化するととも
に、この符号化処理に伴い内部的に生成される合成音声
のサンプル列と前記入力音声の音声サンプル列との誤差
を算出する音声符号化部と、前記有音フレーム区間につ
いては、前記各方向についての前記誤差を比較し、前記
音声符号化部で求められた符号化データのうち前記誤差
の小さい方の方向について求められた符号化データを選
択し、前記誤差の小さい方の方向を示す時間方向情報と
ともに出力する比較制御部とを備えるものである。

【００４６】また、この発明に係る音声復号化装置は、
符号化データを符号駆動線形予測復号化方式によって音
声復号化する音声復号化部と、この音声復号化部での復
号化により得られた音声サンプル列を蓄積しフレーム単
位で出力するバッファであって、有音／無音情報に基づ
き有音フレーム区間を検出し、この有音フレーム区間に
ついては該区間を単位として時間方向情報に応じた方向
に音声サンプル列を出力するバッファとを備えるもので
ある。

【００４７】また、この発明に関わる音声符号化復号化
システムは、入力音声から音声スペクトルと音源情報と
を求めてそれぞれ符号化する音声符号化装置と、この音
声符号化装置から出力された符号化音声スペクトル及び
符号化音源情報を復号化し、この結果得られた音声スペ
クトルと音源情報から音声を再生する音声復号化装置
と、を含む音声符号化復号化システムにおいて、前記音
声符号化装置は、入力音声の音声サンプル列を所定長の
フレーム単位に分割し、各フレームが有音フレーム、無
音フレームのいずれであるかを判定するとともに、この
判定結果を示す有音／無音情報を出力する有音／無音判
定部と、入力音声の音声サンプル列を蓄積しフレーム単
位で出力するバッファであって、有音フレームについて
は、無音フレームから次の無音フレームまでの間の連続
する１以上の有音フレームからなる有音フレーム区間を
単位とし、この有音フレーム区間の音声サンプル列を蓄
積時と同方向及び逆方向に順次出力するバッファと、こ
のバッファから音声サンプル列を受け取るごとに、受け
取った音声サンプル列をフレーム毎にスペクトル分析し
て音声スペクトルを求めるスペクトル分析部と、このス
ペクトル分析部から出力される音声スペクトルを以前の
１又は複数のフレームの音声スペクトルによる予測処理
を用いて符号化するスペクトル符号化部と、前記バッフ
ァから出力された音声サンプル列から音源情報を求めて
符号化し、この結果得られた符号化音源情報と前記スペ
クトル符号化部で求められた符号化音声スペクトルから
合成音声を合成し、この合成音声のサンプル列と前記入
力音声の音声サンプル列との誤差を算出する音源符号化
部と、前記有音フレーム区間については、前記各方向に
ついての前記誤差を比較し、前記スペクトル符号化部及
び音源符号化部でそれぞれ求められた前記同方向及び逆
方向の符号化音声スペクトル及び符号化音源情報のう
ち、前記誤差の小さい方の方向についての符号化音声ス
ペクトル及び符号化音源情報を選択し、前記誤差の小さ
い方の方向を示す時間方向情報とともに出力する比較制
御部とを備え、前記音声復号化装置は、前記音声符号化
装置から出力された符号化音声スペクトルを、以前の１
又は複数のフレームの音声スペクトルによる予測処理を
用いて復号化するスペクトル復号化部と、前記音声符号
化装置から出力された符号化音源情報を復号化する音源
復号化部と、前記スペクトル復号化部で復号化された音
声スペクトルと前記音源復号化部で復号化された音源情
報より音声を合成する合成フィルタと、この合成フィル
タで得られた音声サンプル列を蓄積しフレーム単位で出
力するバッファであって、前記音声符号化装置から取得
した有音／無音情報に基づき有音フレーム区間を検出
し、この有音フレーム区間については該区間を単位とし
て前記音声符号化装置から受け取った時間方向情報に応
じた方向に音声サンプル列を出力するバッファとを備え
るものである。

【００４８】また、この発明に関わる音声符号化装置
は、入力音声の音声サンプル列を所定長のフレーム単位
に分割し、各フレームが有音フレーム、無音フレームの
いずれであるかを判定するとともに、この判定結果を示
す有音／無音情報を出力する有音／無音判定部と、入力
音声の音声サンプル列を蓄積しフレーム単位で出力する
バッファであって、有音フレームについては、無音フレ
ームから次の無音フレームまでの間の連続する１以上の
有音フレームからなる有音フレーム区間を単位とし、こ
の有音フレーム区間の音声サンプル列を蓄積時と同方向
及び逆方向に順次出力するバッファと、このバッファか
ら音声サンプル列を受け取るごとに、受け取った音声サ
ンプル列をフレーム毎にスペクトル分析して音声スペク
トルを求めるスペクトル分析部と、このスペクトル分析
部から出力される音声スペクトルを以前の１又は複数の
フレームの音声スペクトルによる予測処理を用いて符号
化するスペクトル符号化部とを備えるものである。

【００４９】また、この発明に関わる音声復号化装置
は、符号化された音声スペクトルを、以前の１又は複数
のフレームの音声スペクトルによる予測処理を用いて復
号化するスペクトル復号化部と、符号化された音源情報
を復号化する音源復号化部と、前記スペクトル復号化部
で復号化された音声スペクトルと前記音源復号化部で復
号化された音源情報より音声を合成する合成フィルタ
と、この合成フィルタで得られた音声サンプル列を蓄積
しフレーム単位で出力するバッファであって、前記音声
符号化装置から取得した有音／無音情報に基づき有音フ
レーム区間を検出し、この有音フレーム区間については
該区間を単位として前記音声符号化装置から受け取った
時間方向情報に応じた方向に音声サンプル列を出力する
バッファとを備えるものである。

【００５０】また、この発明に関わる音声符号化復号化
システムは、入力音声から音声スペクトルと音源情報と
を求めてそれぞれ符号化する音声符号化装置と、この音
声符号化装置から出力された符号化音声スペクトル及び
符音源情報を復号化し、この結果得られた音声スペクト
ルと音源情報から音声を再生する音声復号化装置と、を
含む音声符号化復号化システムにおいて、前記音声符号
化装置は、入力音声の音声サンプル列を所定長のフレー
ム単位に分割し、各フレームが有音フレーム、無音フレ
ームのいずれであるかを判定するとともに、この判定結
果を示す有音／無音情報を出力する有音／無音判定部
と、入力音声の音声サンプル列を蓄積しフレーム単位で
出力するバッファであって、有音フレームについては、
無音フレームから次の無音フレームまでの間の連続する
１以上の有音フレームからなる有音フレーム区間を単位
とし、この有音フレーム区間の音声サンプル列を蓄積時
と同方向及び逆方向に順次出力するバッファと、このバ
ッファから音声サンプル列を受け取るごとに、受け取っ
た音声サンプル列をフレーム毎にスペクトル分析して音
声スペクトルを求めるスペクトル分析部と、このスペク
トル分析部から出力される音声スペクトルを以前の１又
は複数のフレームの音声スペクトルによる予測処理を用
いて符号化すると共に、この符号化処理の際の音声スペ
クトルの量子化誤差を算出するスペクトル符号化部と、
前記バッファから出力された音声サンプル列から音源情
報を求めて符号化する音源符号化部と、前記有音フレー
ム区間については、前記各方向についての前記誤差を比
較し、前記スペクトル符号化部と音源符号化部でそれぞ
れ求められた符号化音声スペクトル及び符号化音源情報
のうち前記量子化誤差の小さい方の方向について求めら
れた符号化音声スペクトル及び符号化音源情報を選択
し、前記量子化誤差の小さい方の方向を示す時間方向情
報とともに出力する比較制御部とを備え、前記音声復号
化装置は、前記音声符号化装置から出力された符号化音
声スペクトルを、以前の１又は複数のフレームの音声ス
ペクトルによる予測処理を用いて復号化するスペクトル
復号化部と、前記音声符号化装置から出力された符号化
音源情報を復号化する音源復号化部と、前記スペクトル
復号化部で復号化された音声スペクトルと前記音源復号
化部で復号化された音源情報より音声を合成する合成フ
ィルタと、この合成フィルタで得られた音声サンプル列
を蓄積しフレーム単位で出力するバッファであって、前
記音声符号化装置から取得した有音／無音情報に基づき
有音フレーム区間を検出し、この有音フレーム区間につ
いては該区間を単位として前記音声符号化装置から受け
取った時間方向情報に応じた方向に音声サンプル列を出
力するバッファとを備えるものである。

【００５１】また、この発明に関わる音声符号化装置
は、入力音声の音声サンプル列を所定長のフレーム単位
に分割し、各フレームが有音フレーム、無音フレームの
いずれであるかを判定するとともに、この判定結果を示
す有音／無音情報を出力する有音／無音判定部と、入力
音声の音声サンプル列を蓄積しフレーム単位で出力する
バッファであって、有音フレームについては、無音フレ
ームから次の無音フレームまでの間の連続する１以上の
有音フレームからなる有音フレーム区間を単位とし、こ
の有音フレーム区間の音声サンプル列を蓄積時と同方向
及び逆方向に順次出力するバッファと、このバッファか
ら音声サンプル列を受け取るごとに、受け取った音声サ
ンプル列をフレーム毎にスペクトル分析して音声スペク
トルを求めるスペクトル分析部と、このスペクトル分析
部から出力される音声スペクトルを以前の１又は複数の
フレームの音声スペクトルによる予測処理を用いて符号
化すると共に、この符号化処理の際の音声スペクトルの
量子化誤差を算出するスペクトル符号化部と、前記バッ
ファから出力された音声サンプル列から音源情報を求め
て符号化する音源符号化部と、前記バッファから出力さ
れた音声サンプル列から音源情報を求めて符号化する音
源符号化部と、前記有音フレーム区間については、前記
各方向についての前記量子化誤差を比較し、前記スペク
トル符号化部及び音源符号化部でそれぞれ求められた前
記同方向及び逆方向の符号化音声スペクトル及び符号化
音源情報のうち前記量子化誤差の小さい方の方向につい
ての符号化音声スペクトル及び符号化音源情報を選択
し、前記量子化誤差の小さい方の方向を示す時間方向情
報とともに出力する比較制御部とを備えるものである。

【００５２】

【発明の実施の形態】

実施の形態１．この実施の形態１の音声符号化復号化シ
ステムは、図１に示す音声符号化装置と、図２に示す音
声復号化装置とから構成される。図１及び図２におい
て、前述の図１９及び図２０の構成要素と同一又はそれ
に相当する構成要素には、同一の符号を付した。

【００５３】図１に示すように、この実施の形態１の音
声符号化装置は、音声データをＣＥＬＰ方式で符号化す
る音声符号化部１と、音声符号化部１で生成された各符
号を多重化して通信路に送出する多重化処理部８とに加
えて、入力音声を所定量だけ蓄え、この蓄積結果を蓄積
時とは逆方向（すなわち、蓄積順序とは逆順）に前記音
声符号化部１に出力するバッファ２０を備えている。こ
こで、音声符号化装置に入力される入力音声は、アナロ
グ音声信号をＡ／Ｄ変換器で予め離散データ化して得た
音声サンプルの時系列であり、バッファ２０は、この音
声サンプルを時系列的に蓄えていき、音声サンプルが所
定データ量だけ蓄積されると、それら音声サンプルを逆
方向（すなわち未来から過去に向かう方向）に出力す
る。このようにバッファ２０は、いわゆるＬＩＦＯ（後
入れ先出し方式）の記憶装置である。以下、このように
入力音声の音声サンプルの時系列を逆向きに並べ換えて
得られる系列を「逆方向入力音声」と呼ぶ。

【００５４】音声符号化部１において、スペクトル分析
部２は、スペクトル分析して音声スペクトルを求める。
このスペクトル分析では、まずバッファ２０から供給さ
れる逆方向入力音声を線形予測分析して線形予測係数を
算出し、これをＬＳＰ（LineSpectrum Pair：線スペク
トル対）係数ωiに変換する。ＬＳＰ係数が音声スペク
トルの情報を表す。ここで行う線形予測分析処理及び線
形予測係数のＬＳＰ係数への変換処理は公知のものでよ
い。スペクトル符号化部３は、このＬＳＰ係数ωiを図
１９のスペクトル符号化部３と同様、まず現在のフレー
ムｍにおける量子化すべき目的ベクトルＬi(m)を、ｋフ
レーム分過去のフレームの量子化された目的ベクトル
Ｌ'i(m-k)を用いて、次の（１）式により求める。

【００５５】

【数３】この式は、従来技術の説明において示した目的ベクトル
Ｌiの算出式と同様であり、Ｐi,kはＭＡ(Moving Averag
e)予測係数、ωi(m)は現在のフレームｍのＬＳＰ係数を
示す。目的ベクトルＬiは、当該フレームの音声スペク
トルを表す。この式では、現在のフレームｍからみて１
フレーム前〜４フレーム前（すなわちｋが１〜４）まで
の量子化目的ベクトルＬ'i(m-k)を演算に用いている
が、幾つ前までのフレームを用いるかは、要求される予
測精度やこのシステムがインプリメントされるコンピュ
ータ等の処理負荷などに基づき変更可能である。もちろ
ん１フレーム前のデータのみを用いることも可能であ
る。

【００５６】そして、スペクトル符号化部３は、次の
（２）式に基づき、量子化したＬＳＰ係数ω'i(m)を求
める。

【００５７】

【数４】この式は、従来技術の説明において示した量子化したＬ
ＳＰ係数の算出式と同様である。この式でも、現在のフ
レームｍからみて１〜４フレーム前のデータを演算に用
いているが、何フレーム前までを利用するかは、個々の
事情に応じて変更可能である。

【００５８】そして、スペクトル符号化部３は、求めた
量子化ＬＳＰ係数ω'i(m)を合成フィルタ４に供給する
とともに、その量子化したＬＳＰ係数を符号化して多重
化処理部８に出力する。合成フィルタ４は、音源信号
と、スペクトル符号化部３から供給される量子化された
線形予測係数とに基づき、合成音声を生成する。ここ
で、音源信号は、適応音源符号帳５から出力される適応
音源ベクトルに適応音源利得βを乗じ、雑音音源符号帳
６から出力される雑音音源ベクトルに雑音音源利得γを
乗じ、これら両乗算結果の和をとったものである。最適
音源探索部７は、合成フィルタ４で生成された合成音声
と、バッファ２０から供給された逆方向入力音声との誤
差を評価し、この誤差が最小になる適応音源符号Ｌ、雑
音音源符号Ｉ、適応音源利得β及び雑音音源利得γを求
める。そして、最適音源探索部７は、これら適応音源符
号Ｌ、雑音音源符号Ｉ、量子化した適応音源利得β及び
雑音音源利得γをそれぞれ多重化処理部８に出力する。
また、最適音源探索部７は、適応音源符号Ｌを適応音源
符号帳５に供給するとともに、雑音音源符号Ｉを雑音音
源符号帳６に供給する。

【００５９】スペクトル符号化部３で行う上記（１）式
の計算において、過去のフレームの量子化された目的ベ
クトルＬ'i(m-k)は、所定長の各区間の中では時間的に
逆方向(すなわち未来から過去に向かう方向)のデータ列
となっているが、全体としてはそれら各区間が時間的に
順方向(すなわち過去から未来に向かう方向)に並んだも
のとなっている。

【００６０】適応音源符号帳５は、過去に求めた音源信
号を記憶しており、最適音源探索部７より入力される適
応音源符号Ｌに基づき適応音源ベクトルを生成する。適
応音源ベクトルは、記憶した過去の音源信号から適応音
源符号Ｌの長さ（ピッチ周期）のベクトルを切り出し、
これを予め設定されたサブフレーム長になるまで繰り返
すことにより生成する。生成された適応音源ベクトル
は、適応音源利得βと乗じられ、音源信号の元の一つと
なる。なお、適応音源符号帳５には、過去に合成フィル
タ４の入力として用いられた音源信号が順次蓄積され、
これにより符号帳のデータが更新されていく。したがっ
て、適応音源符号帳５に蓄積される過去の音源信号は、
所定長の各区間の中では時間的に逆方向（すなわち未来
から過去に向かう方向）のデータ列となっているが、全
体としてはそれら各区間が時間的に順方向（すなわち過
去から未来に向かう方向）に並んだものとなっている。

【００６１】また、雑音音源符号帳６は、例えばランダ
ム雑音から生成したＮ個の雑音音源ベクトルを保持して
おり、最適音源探索部７より入力される雑音音源符号Ｉ
に対応した雑音音源ベクトルを決定し、出力する。な
お、雑音音源符号帳６が保持している各雑音音源ベクト
ルは、時間的に逆方向のデータ列である。雑音音源符号
帳６から出力された雑音音源ベクトルは、雑音音源利得
γと乗じられ、音源信号の元の一つとなる。

【００６２】また、図２に示すように、この実施の形態
１の音声復号化装置は、多重化された符号化データを多
重分離する分離処理部９と、分離処理部９から供給され
る符号をＣＥＬＰ方式で復号化する音声復号化部１０と
に加え、音声復号化部１０により得られた音声サンプル
列を所定量だけ蓄え、この蓄積結果を蓄積時とは逆方向
に出力するバッファ２１を備えている。

【００６３】音声復号化部１０において、スペクトル復
号化部１１は、分離処理部９で分離されたＬＳＰ係数の
符号を受け取り、これを図２０のスペクトル復号化部１
１と同じ方法で復号化してＬＳＰ係数ω'iを求め、これ
を線形予測係数に変換する。適応音源符号帳１２は、過
去の音源信号を保持しており、分離処理部９で分離され
た適応音源符号Ｌを受け取り、これに対応した適応音源
ベクトルを生成する。適応音源ベクトルの生成の方法
は、図１の音声符号化装置の適応音源符号帳５の場合と
同様でよい。この適応音源ベクトルには、分離処理部９
にて分離された符号を復号化して得た適応音源利得βが
乗じられる。雑音音源符号帳１３は、音声符号化装置の
雑音音源符号帳６と同様、ランダム雑音などから生成し
た所定数の雑音音源ベクトルを保持している。雑音音源
符号帳１３は、分離処理部９で分離された雑音音源符号
Ｉを受け取り、保持している雑音音源ベクトル群からこ
の雑音音源符号Ｉに対応する雑音音源ベクトルを決定
し、出力する。出力された雑音音源ベクトルには、分離
処理部９にて分離された符号を復号化して得た雑音音源
利得γが乗じられる。この乗算結果は、前述の適応音源
ベクトルと適応音源利得βとの乗算結果と加算され、こ
の加算結果が音源信号となる。この音源信号は、合成フ
ィルタ１４に入力されるとともに、適応音源符号帳１２
にフィードバックされ、過去の音源信号として符号帳に
加えられる。

【００６４】合成フィルタ１４は、適応音源ベクトル及
び適応音源利得βの乗算結果と雑音音源ベクトル及び雑
音音源利得γの乗算結果とを加算して得た音源信号と、
スペクトル復号化部１１で求められた線形予測係数を用
いて、音声を合成する。音源信号と線形予測係数とに基
づく音声合成は、線形予測分析方式における従来公知の
方法で行えばよい。この実施の形態１では、音声復号化
部１０には音声符号化装置からの逆方向入力音声の符号
化データが入力されるので、合成フィルタ１４で合成さ
れた音声は、時間的に逆方向の系列となっている。合成
フィルタ１４で合成された音声を「逆方向復号化音声」
と呼ぶ。このようにして生成された逆方向復号化音声
は、バッファ２１に入力される。

【００６５】バッファ２１は、ＬＩＦＯ方式の記憶装置
であり、入力される逆方向復号化音声のデータを順次蓄
えていき、蓄積データ量が所定量に達するごとに、この
蓄積結果を蓄積時とは逆方向に（すなわち、末尾から先
頭に向かって）出力する。したがって、バッファ２１か
ら出力された音声信号は、時間的に順方向（すなわち過
去から未来に向かう向き）の復号化音声となる。

【００６６】次に、この実施の形態１における音声の符
号化及び復号化の処理手順について説明する。

【００６７】まず、図１の音声符号化装置の処理動作に
ついて説明する。

【００６８】入力音声は、バッファ２０に入力される。
バッファ２０は、入力音声のデータ列を蓄積し、蓄積量
が所定量に達するごとに、それまでの蓄積結果を後端部
から逆方向に出力する。この結果得られた逆方向入力音
声は、音声符号化部１に入力される。音声符号化部１
は、バッファ２０から与えられた逆方向入力音声をＣＥ
ＬＰ方式で符号化する。この結果得られたＬＳＰ係数の
符号、適応音源符号Ｌ、雑音音源符号Ｉ、適応音源利得
βの符号及び雑音音源利得γの符号は、多重化処理部８
で多重化され、通信路に送出される。

【００６９】次に、図２の音声復号化装置の動作につい
て説明する。

【００７０】通信路から到来した多重化された符号化デ
ータは、分離処理部９にてＬＳＰ係数の符号や適応音源
符号などに多重分離される。音声復号化部１０は、分離
処理部９から受け取ったこれら各符号から、ＣＥＬＰ方
式に従った復号化処理により逆方向復号化音声を合成
し、バッファ２１に出力する。バッファ２１は、入力さ
れる逆方向復号化音声を所定長だけ蓄えた後、蓄積結果
を後端部から逆方向に出力する。この結果、時間的に順
方向の復号化音声が得られる。

【００７１】なお、以上の構成においては、過去のフレ
ームのデータから現フレームのＬＳＰ係数を予測する方
法としてＭＡ予測を用いたが、これに限らず、ＡＲ(Aut
o Regressive)予測や、前フレームとの差分による予測
方式を用いてもよい。また、以上の構成においては、Ｃ
ＥＬＰ方式における量子化対象となるスペクトルパラメ
ータとしてＬＳＰ係数を用いたが、これに限らず、例え
ば線形予測係数、ＰＡＲＣＯＲ係数、ケプストラム係数
など他の係数を用いてもよい。すなわち、本実施形態の
手法は、どのパラメータを用いるかにかかわりなく有効
である。ＬＳＰ係数以外を利用する場合は、スペクトル
分析部２及びスペクトル符号化部３を、その係数に応じ
た分析又は量子化処理を行う処理モジュールに変更する
だけでよく、その他の部分については上記構成と同様で
よい。

【００７２】例えば、線形予測係数を利用するシステム
構成では、音声符号化装置において、ＬＳＰ符号を求め
るスペクトル分析部２の代わりに、入力音声を線形予測
分析して線形予測係数を求める線形予測分析部を設けれ
ばよい。また、ＬＳＰ係数を量子化するスペクトル符号
化部３の代わりに、線形予測係数を量子化して合成フィ
ルタ４に入力し、その量子化した線形予測係数を符号化
して多重化処理部８に出力する線形予測係数符号化部を
設ければよい。また、音声復号化装置においては、符号
化されたＬＳＰ係数の復号化及び線形予測係数への変換
を行うスペクトル復号化部１０の代わりに、符号化され
た線形予測係数を復号化する線形予測係数復号化部を設
ければよい。

【００７３】図３は、この実施の形態１による効果を説
明するための図であり、語頭部分を含む入力音声から符
号化・復号化の各段階で生成され処理される信号の波形
を示している。図３において、（ａ）は語頭部分を含む
入力音声の波形であり、バッファ２０及び２１に蓄積可
能なデータ量に相当する長さが図示されている。同図
（ｂ）はこの入力音声をバッファ２０にて時間的に逆方
向に並べ換えて得られる逆方向入力音声の波形であり、
（ｃ）は（ｂ）の逆方向入力音声をＣＥＬＰ符号化した
ときの音源信号の波形である。また、（ｄ）は（ｂ）の
逆方向入力音声の符号化データを音声復号化部１０で復
号化した結果得られる逆方向復号化音声の波形であり、
（ｅ）は（ｄ）の逆方向復号化音声をバッファ２１にて
時間的に順方向に並べ換えて得られる復号化音声の波形
である。

【００７４】この実施の形態では、逆方向入力音声に対
して符号化処理を施している。この処理は、未来の信号
から過去の信号を予測する処理といえる。すなわち、符
号化処理は、図３（ｂ）に示すように、有声音（この有
声音は、時間的に言えば語頭部分の後に続く部分であ
る）の部分から語頭部分へと、時間的に見れば逆方向に
進行していく。このように語頭部分の前に有声音部分が
処理されるので、音源信号においては、図３（ｃ）に示
すように、語頭部分の前にはピッチ周期性とピッチピー
クが現れる。語頭部分の音源信号は、このピッチ周期性
とピッチピークのある未来時刻の音源信号に基づき生成
されるので、図３（ｃ）に示すように、音源信号の語頭
部分におけるピッチ周期性とピッチピークがよく再生さ
れる。このように、音源信号において語頭部分の直前か
ら語頭部分にかけてピッチ周期性とピッチピークがよく
再生されているので、これに基づき得られる復号結果
（すなわち逆方向復号化音声）には、（ｄ）に示すよう
に語頭部分にピッチ周期性が良く現れている。この逆方
向復号化音声をバッファ２１により逆向き（すなわち時
間的に順方向）に並べ換えることにより、結果的に
（ｅ）に示すような語頭部分の品質が良い復号化音声が
得られる。

【００７５】図４はこの実施形態による他の効果を示す
説明図であり、２つのＣＶ(Consonant+Vowel:子音+母
音)で構成される２音節の入力音声のパワーの時間変化
を示している。同図において、時間軸の下に示される記
号ａ，ｂ，ｃ等は、フレーム毎のスペクトル特徴を示す
記号である。また、その下には、フレーム毎のスペクト
ルの順方向のＭＡ予測誤差及び逆方向のＭＡ予測誤差の
大小が示されている。スペクトル特徴を示す記号につい
ては、フレーム間でスペクトルが類似している場合は、
同じ記号にダッシュを付けてそれぞれを区別する。例え
ば、記号ｄ、ｄ’及びｄ”で示される各フレームは、ス
ペクトルが互いに類似している。一方、スペクトル特徴
が異なる場合は、異なる記号を与えてスペクトルの差異
を表現している。例えば、記号ｃで示されるフレーム
と、記号ｄで示されるフレームとはスペクトルが類似し
ていない。

【００７６】音声のスペクトルは一般に音節の始めの部
分で変化が大きく、その後定常母音が現れ変化が少なく
なり音節の終わりで変化が大きくなる。図４にはこの様
子が模式的に示されている。なお人間の聴覚は音節の始
めのスペクトル変化の大きい部分を聞いて音韻を判断す
るので、この部分は聴覚上非常に重要である。このよう
な音節の先頭部分では、スペクトルの特徴がフレーム間
で大きく相違するため、従来の手法ではＭＡ予測誤差が
大きくなって量子化効率が劣化し、その結果良好な復号
音声が得られなかった。

【００７７】これに対し、この実施の形態では、未来の
信号から過去の信号を予測する処理を行っているので、
図４の逆方向のＭＡ予測誤差が（１）式における量子化
すべき目的ベクトルＬiとなる。そして、図４の矢印で
示す音節先頭部分のフレーム６０ａ及び６０ｂにおける
逆方向のＭＡ予測誤差は、予測が未来の定常母音からな
されるので、値が順方向のＭＡ予測誤差より小さくな
る。このため、この実施の形態では、音節の先頭部分に
ついて効率的な量子化が行え、誤差の少ない量子化ＬＳ
Ｐ係数が得られる。このように音節の始めの部分で量子
化誤差の少ないＬＳＰ係数が得られるので、結果的に音
節の先頭の部分の復号音声のスペクトル特性が良好にな
る。

【００７８】このように、実施の形態１によれば、入力
音声を時間的に逆方向に並べ換えるためのバッファ２０
を音声符号化装置に設け、これによって得られた逆方向
入力音声に対してＣＥＬＰ符号化における音源符号化を
施すため、語頭部分においてもピッチ周期性とピッチピ
ークのある音源信号を得ることができ、復号化において
語頭部分を高い品質で復号化することができる。また、
逆方向入力音声に対して過去のＬＳＰ係数からの予測を
伴うＬＳＰ係数符号化処理を行うので、フレーム間のス
ペクトルの相関が少ない音節の先頭部分において、良好
なスペクトル特性を得ることができる。そして、この復
号化音声をバッファ２１で逆向きに並べ換えて出力する
ことにより、語頭部分や音節の先頭部分で品質のよい順
方向の復号化音声を得ることができる。

【００７９】実施の形態２．この発明の実施の形態２に
係る音声符号化復号化システムは、実施の形態１に示し
たバッファを利用する手法を、いわゆる音声分析合成手
法による音声符号化・復号化を行うシステムに適用した
ものであり、図５に示す音声符号化装置と図６に示す音
声復号化装置とから構成される。すなわち、実施の形態
１では、ＣＥＬＰ方式の音声符号化復号化に対するこの
発明の適用例を説明したが、この実施の形態２では、音
声分析合成手法を例にとり、この発明がＣＥＬＰ方式以
外の音声符号化復号化方式を利用するシステムにも適用
可能であることを示す。なお、図５、図６において、図
１と図２の構成要素と同様の構成要素については、同一
の符号を付してその説明を省略する。

【００８０】実施の形態１の構成と比較してこの実施の
形態２に特有の構成は、音声符号化装置の音声符号化部
１５の音源符号化部５２と音声復号化部１６の音源復号
化部５３である。

【００８１】音源符号化部５２は音声分析合成手法によ
る音声符号化・復号化を行う際の音源情報抽出と符号化
処理を行うものであり、バッファ２０から入力された音
声サンプル列から、分析フレーム毎にその音声サンプル
列のピッチ周期と有声か無声かを示す有声／無声情報及
び音源のゲインを算出し、各々を量子化して符号化し多
重化処理部８に出力する。これらのパラメータの算出、
量子化には公知の方法を用いてよい。

【００８２】音源復号化部５３は音声分析合成手法によ
る音声符号化・復号化を行う際の音源情報の復号化処理
を行うものであり、まず分離処理部９から出力された符
号化されたピッチ周期と有声／無声判定情報及び音源ゲ
インを復号化する。次に、有声／無声情報が有声の場
合、ピッチ周期間隔で音源ゲインに応じた振幅のパルス
列を生成し、合成フィルタ１４に出力する。また、有声
／無声情報が無声の場合、音源ゲインに応じた振幅の雑
音を生成し合成フィルタ１４に出力する。合成フィルタ
１４はこの音源復号化部５３から出力されたピッチ周期
間隔のパルス列あるいは雑音と、スペクトル復号化部１
１で得られた線形予測係数を用いて復号化音声を生成
し、バッファ２１に出力する。

【００８３】なお、以上の構成において、過去のフレー
ムのデータから現フレームのＬＳＰ係数を予測する方法
としてＭＡ予測を用いたが、これに限らずＡＲ予測や前
フレームとの差分による予測を用いてもよい。また、こ
の実施の形態２も、実施の形態１と同様、スペクトルパ
ラメータの種類によらず有効であり、ＬＳＰ係数の代わ
りに線形予測係数、ＰＡＲＣＯＲ係数、ケプストラム係
数などの他の係数を用いることが可能である。ＬＳＰ以
外の係数を用いるシステムを構成するには、スペクトル
分析部２及びスペクトル符号化部３をその係数の種類に
合った分析又は量子化処理を行うモジュールに置き換え
ればよい。

【００８４】このように、実施の形態２によれば、入力
音声を時間的に逆方向に並べ換えるためのバッファ２０
を音声符号化装置に設け、これによって得られた逆方向
入力音声に対して逆方向入力音声に対してＭＡ予測を伴
うＬＳＰ係数の符号化を行うので、音声分析合成手法に
よって音声符号化・復号化を行う場合にも、音節の始ま
りの部分において良好なスペクトル特性を得ることがで
きる。そして、この復号化結果をバッファ２１で逆向き
に並べ換えて出力することにより、音節の始まりの部分
で品質のよい順方向の復号化音声を得ることができる。

【００８５】以上の説明から明らかなように、入力音声
を時間的に逆方向に並べ換えるバッファ２０と、復号化
結果を時間的に逆方向に並べ換えるバッファ２１とを利
用する手法は、ＣＥＬＰ方式以外の音声スペクトルを利
用する符号化復号化方式にも適用可能である。このよう
な方式としては、音声分析合成手法による符号化復号化
方式の他に、例えばＡＰＣ方式やＭＰＣ方式がある。

【００８６】実施の形態３．この発明の実施の形態３に
係る音声符号化復号化システムは、図７に示す音声符号
化装置と図８に示す音声復号化装置とから構成される。
図７、図８において、図１と図２の構成要素と同様の構
成要素については、同一の符号を付してその説明を省略
する。

【００８７】この実施の形態３に特有の構成は、音声符
号化装置の音声符号化部１の前段、及び音声復号化装置
の音声復号化部１０の後段に設けた双方向バッファ２２
及び２３と、音声符号化装置において最適音源探索部７
の後段に設けた比較制御部３０である。

【００８８】双方向バッファ２２及び２３は、蓄積した
音声サンプル列を蓄積時と同方向及び逆方向のいずれに
も出力可能なバッファである。

【００８９】図７の音声符号化装置において、双方向バ
ッファ２２は、所定長の入力音声を蓄えると、まず蓄積
時と同方向、すなわち時間的に順方向に音声符号化部１
に出力する。この時間的に順方向の入力音声を順方向入
力音声と呼ぶ。音声符号化部１は、双方向バッファ２２
から入力された順方向入力音声をＣＥＬＰ符号化する。
ここでの符号化処理（以下「順方向ＣＥＬＰ符号化処
理」と呼ぶ）は、処理対象とする音声データの時間的な
方向が異なるだけで、実質的な処理内容は実施の形態１
で説明したものと同様である。この順方向ＣＥＬＰ符号
化処理において、最適音源探索部７は、合成フィルタ４
にて生成された合成音声と双方向バッファ２２からの順
方向入力音声との誤差を評価し、この誤差を最小とする
適応音源符号Ｌ、雑音音源符号Ｉ、適応音源利得β及び
雑音音源利得γを求め、これらの符号とこのときの最小
の誤差値（以下「順方向波形誤差」と呼ぶ）とを比較制
御部３０に入力する。

【００９０】以上の順方向入力音声についての処理が終
わると、次に双方向バッファ２２は、蓄積している入力
音声を蓄積時の時系列と逆方向、すなわち時間的に逆方
向に音声符号化部１に出力する。音声符号化部１は、こ
のようにして得られた逆方向入力音声を順方向入力音声
の場合と同様にＣＥＬＰ符号化する（この符号化処理を
以下「逆方向ＣＥＬＰ符号化処理」と呼ぶ）。この逆方
向ＣＥＬＰ符号化処理において、最適音源探索部７は、
合成フィルタ４にて生成された合成音声と双方向バッフ
ァ２２からの逆方向入力音声との誤差を評価し、この誤
差を最小とする適応音源符号Ｌ、雑音音源符号Ｉ、適応
音源利得β及び雑音音源利得γを求め、これらの符号と
このときの最小の誤差値（以下「逆方向波形誤差」と呼
ぶ）とを比較制御部３０に入力する。

【００９１】なお、以上では順方向符号化処理が終了し
てから逆方向符号化処理を開始していたが、例えばパイ
プライン処理を行えば、処理時間を短縮することができ
る。また、以上では順方向符号化処理の次に逆方向符号
化処理という順序で処理を行ったが、この順序は逆でも
よい。

【００９２】比較制御部３０は、順方向波形誤差と逆方
向波形誤差とを比較し、誤差値が小さい方の時間方向を
求める。そして、比較制御部３０は、誤差値の小さい方
の時間方向についての各符号（雑音音源符号や適応音源
符号など）を多重化処理部８に出力するとともに、この
誤差値の小さい方の時間方向（すなわち順方向及び逆方
向のいずれか）を表す符号データ（「時間方向情報」と
呼ぶ）を多重化処理部８に出力する。

【００９３】多重化処理部８は、スペクトル符号化部３
から入力された順方向及び逆方向についての各ＬＳＰ係
数の符号のうち、比較処理部３０から入力された時間方
向情報に適合する方の方向の符号を選択し、これと比較
処理部３０から入力された各符号とを多重化して通信路
に送出する。

【００９４】なお、以上の構成において、例えば語頭部
分に対して他の部分よりも大きな重みを付けて誤差の計
算を行えば、聴覚上重要な語頭部分の誤差が小さくなる
ような適切な符号化を実現することができる。

【００９５】また、以上の音声符号化装置において、適
応音源符号帳５に蓄積される過去の音源信号のデータ及
び雑音音源符号帳６に蓄積される所定種類の雑音音源ベ
クトルは、時間的に順方向又は逆方向のいずれか一方の
方向に沿った系列となっている。例えば、それらデータ
が適応音源符号帳５及び雑音音源符号帳６に時間的に順
方向の系列で保持されている場合は、適応音源符号帳５
及び雑音音源符号帳６は、順方向符号化ではそれらのデ
ータをそのままの方向で出力し、逆方向符号化ではそれ
らのを逆向きに並べ換えて出力する。また、この場合、
適応音源符号帳５のデータ内容の更新は、順方向符号化
の場合は合成フィルタに４に入力した音源信号をそのま
ま符号帳に追加し、逆方向符号化の場合は合成フィルタ
４に入力した音声信号を逆向きに変換してから符号帳に
追加する。適応音源符号帳５は、比較制御部３０で誤差
値が小さいと判定された時間方向についての音源信号を
上記のような処理により符号帳に追加する。なお、適応
音源符号帳５及び雑音音源符号帳６の保持データが時間
的に逆方向（すなわち実施の形態１と同様）の場合は、
逆方向符号化では保持データをそのまま用い、順方向符
号化では保持データを逆向きに用いればよい。

【００９６】次に、図８の音声復号化装置においては、
まず分離処理部９が通信路から受信した多重化されたデ
ータを多重分離する。音声復号化部１０は、分離処理部
９から受け取った各符号に基づき、ＣＥＬＰ方式にて音
声の復号化を行う。この復号化処理においては、適応音
源符号帳１２及び雑音音源符号帳１３は、分離処理部９
で分離された時間方向情報に基づき、入力された各符号
の時間方向（順方向又は逆方向のいずれか）と同じ方向
の適応音源ベクトル及び雑音音源ベクトルを生成して出
力する。なお、適応音源符号帳１２は、前述の適応音源
符号帳５と同様に、データの時間方向に応じた適切な方
法で更新される。そして、合成フィルタ１４は、これら
各音源ベクトルと線形予測係数とに基づき、音声を合成
する。合成された音声は、時間方向情報に対応した向き
の時系列データとなっている。この合成音声は、双方向
バッファ２３に蓄積される。双方向バッファ２３は、音
声情報の蓄積量が所定量に達すると、その蓄積内容を分
離処理部９から受け取った時間方向情報に応じた向きに
出力する。すなわち、時間方向情報が順方向ならば、蓄
積内容を蓄積時と同方向に出力して復号化音声を得る。
また、時間方向情報が逆方向ならば、蓄積内容を蓄積時
とは逆方向に出力して復号化音声を得る。このような処
理により、最終的に時間の流れの方向に沿った順方向の
復号化音声を得ることができる。

【００９７】なお、以上の構成においては、過去のフレ
ームのデータから現フレームのＬＳＰ係数を予測する方
法としてＭＡ予測を用いたが、これに限らずＡＲ予測や
前フレームとの差分による予測など、他の予測方式を用
いてもよい。また、この実施の形態３も、実施の形態１
と同様、スペクトルパラメータの種類によらず有効であ
り、ＬＳＰ係数の代わりに線形予測係数、ＰＡＲＣＯＲ
係数、ケプストラム係数などの他の係数を用いることが
可能である。ＬＳＰ以外の係数を用いるシステムを構成
するには、スペクトル分析部２及びスペクトル符号化部
３をその係数の種類に合った分析又は量子化処理を行う
モジュールに置き換えればよい。

【００９８】図９は、この実施の形態３における各処理
段階での信号波形を示す図である。図９において、
（ａ）は音声符号化装置に入力される順方向の入力音声
の波形の一例を示している。図示の時間幅は、双方向バ
ッファ２２及び２３の蓄積容量に対応するものである。
この例は、ピッチ周期性が途中で崩れる入力音声を示し
たものであり、このような入力音声では、ピッチ周期が
変化する区間１００ａの部分が聴覚的に重要となる場合
がある。図９において、（ｂ）はこの順方向入力音声を
ＣＥＬＰ符号化したときに生成される順方向の音源信号
の波形であり、区間１０１ａは順方向入力音声の区間１
００ａに対応する。また、（ｃ）は入力音声を双方向バ
ッファ２２によって時間的に逆方向に並べ換えて得られ
る逆方向入力音声の波形であり、区間１００ｂは順方向
入力音声の区間１００ａに対応する。そして、（ｄ）は
この逆方向入力音声をＣＥＬＰ符号化したときに生成さ
れる逆方向音源信号の波形であり、区間１０１ｂは順方
向入力音声の区間１００ａに対応する。

【００９９】図９の（ａ）に示した入力音声では、区間
１００ａの波形は、逆方向に見た場合よりも順方向に見
た場合の方が、直前の波形との類似度が大きい。したが
って、この区間にとっては図９（ｂ）のような順方向に
ついての音源信号を生成した方が、図９（ｄ）のような
逆方向の音源信号を生成するより良好な音源信号が得ら
れ、結果的に良好な音質の復号化音声が得られる。した
がって、比較制御部３０で入力音声との誤差が小さい時
間方向を選び、その時間方向の符号を伝送することによ
り、常に誤差の小さい方の符号に基づき復号化音声を生
成することができ、品質の良い復号化音声を得ることが
できる。

【０１００】図１０はこの実施の形態による他の効果を
示す説明図であり、２つのＣＶで構成される２音節の入
力音声について、図４と同様のパワー、スペクトル特徴
の記号、スペクトルの順方向のＭＡ予測誤差及び逆方向
のＭＡ予測誤差の大小を示している。図１０は、スペク
トルの変化が図４の例より複雑で、各音節の先頭部分
（図１０では矢印６２ａ、６２ｂで示す）では逆方向よ
り順方向の方がＭＡ予測誤差が少ない場合を示してい
る。この例では、矢印６２ａ及び６２ｂで示すフレーム
については、順方向でＬＳＰ係数を量子化した方が量子
化誤差の少ないＬＳＰ係数が得られる。

【０１０１】この実施の形態では、比較制御部３０で入
力音声との誤差が小さい時間方向を選び、その時間方向
のＬＳＰ係数の符号を伝送しているので、常に量子化誤
差の小さい方の符号に基づき復号化音声を生成すること
ができ、スペクトル変化の複雑な音節先頭部分について
も復号音声のスペクトル特性が良好になり、ひいては高
品質の復号化音声を得ることができる。

【０１０２】以上説明したように、この実施の形態３に
よれば、語頭部分のみならず、ピッチ周期性が変化する
部分についても、良好な復号化音声を得ることができ
る。また、音節の始めの部分のスペクトルが複雑に変化
する部分についても良好な復号音声のスペクトル特性を
得ることができる。

【０１０３】実施の形態４.この発明の実施の形態４に
係る音声符号化復号化システムは、実施の形態３に係る
双方向バッファを利用する手法を、いわゆる音声分析合
成手法による音声符号化・復号化を行うシステムに適用
した例であり、図１１に示す音声符号化装置と、図１２
に示す音声復号化装置とから構成される。図１１及び図
１２において、それぞれ図７又は図５、図８又は図６の
構成要素と同様の構成要素については、同一の符号を付
してその説明を省略する。

【０１０４】実施の形態３のシステム構成と比較してこ
の実施の形態４に特有の構成は、音声符号化装置の音声
符号化部１５と比較制御部３１、及び音声復号化部１６
の音源復号化部５３である。なお、これらのうち音源符
号化部５２及び音源復号化部５３は、実施の形態２で用
いたものと同様の機能を有する。

【０１０５】図１１の音声符号化装置においては、双方
向バッファ２２は、蓄積している入力音声を、音声符号
化部１５に対してまず順方向（すなわち蓄積時の時系列
と同じ方向に）に入力する。音声符号化部１５は、入力
された順方向入力音声を音声分析合成手法によって符号
化する。ここでの符号化処理(以下「順方向分析合成符
号化処理」と呼ぶ）は、処理対象とする音声データの時
間的な方向が異なるだけで、実質的な処理内容は実施の
形態２で説明したものと同様である。

【０１０６】この順方向分析合成符号化処理において、
スペクトル符号化部３は、既に説明しスペクトル算出な
どの処理に加え、ＬＳＰ係数ωi(m)を量子化した時の量
子化誤差Ｄ(m)の計算処理を行う。この計算は次の
（３）式に基づき行われる。そして、スペクトル符号化
部３は、算出した量子化誤差を比較制御部３１に入力す
る。なお、順方向で求めたこの量子化誤差を「順方向ス
ペクトル誤差」と呼ぶ。

【０１０７】

【数５】また音源符号化部５２は、求めたピッチ周期、音源ゲイ
ン、有声／無声情報の各符号を比較制御部３１に入力す
る。

【０１０８】以上の順方向入力音声についての処理が終
わると、次に双方向バッファ２２は、蓄積している入力
音声を蓄積時の時系列と逆方向、すなわち時間的に逆方
向に音声符号化部１５に出力する。音声符号化部１５
は、このようにして得られた逆方向入力音声を順方向入
力音声の場合と同様に音声分析合成符号化する（この符
号化処理を以下「逆方向分析合成符号化処理」と呼
ぶ）。この逆方向分析合成符号化処理において、スペク
トル符号化部３は、ＬＳＰ係数ωiを量子化した時の量
子化誤差Ｄ(m)を上記（３）式で計算し、比較制御部３
１に入力する。逆方向で求めたこの量子化誤差を「逆方
向スペクトル誤差」と呼ぶ。また音源符号化部５２はピ
ッチ周期、音源ゲイン、有声／無声情報の各符号を求
め、それらを比較制御部３１に入力する。

【０１０９】なお、以上では順方向分析合成符号化処理
が終了してから逆方向分析合成符号化処理を開始してい
たが、例えばパイプライン処理を行えば、処理時間を短
縮することができる。また、以上では順方向の符号化処
理の次に逆方向の符号化処理という順序で処理を行った
が、この順序は逆でもよい。

【０１１０】比較制御部３１は、順方向スペクトル誤差
と逆方向スペクトル誤差とを比較し、誤差値が小さい方
の時間方向を求める。そして、比較制御部３１は、スペ
クトル符号化部３及び音源符号化部５２から得た順方向
及び逆方向の各符号うち、誤差値の小さい方の時間方向
についての各符号（ピッチ周期、音源ゲイン等）を多重
化処理部８に出力するとともに、この誤差値の小さい方
の時間方向（すなわち順方向及び逆方向のいずれか）を
表す符号データ（すなわち時間方向情報）を多重化処理
部８に出力する。

【０１１１】多重化処理部８は、スペクトル符号化部３
から入力された順方向及び逆方向についての各ＬＳＰ係
数の符号のうち、比較制御部３１から入力された時間方
向情報に適合する方の方向の符号を選択し、これと比較
制御部３１から入力された各符号とを多重化して通信路
に送出する。

【０１１２】次に、図１２の音声復号化装置において
は、まず分離処理部９が通信路から受信した多重化され
たデータを多重分離する。音声復号化部１６は、分離処
理部９から受け取った各符号に基づき、音声分析合成方
式にて音声の復号化を行う。合成フィルタ１４で生成さ
れた合成音声は、時間方向情報に対応した向きの時系列
データとなっている。この合成音声は、双方向バッファ
２３に蓄積される。そして、双方向バッファ２３は、音
声情報の蓄積量が所定量に達すると、それを分離処理部
９から受け取った時間方向情報に応じた方向に出力す
る。

【０１１３】なお、以上の構成において、過去のフレー
ムのデータから現フレームのＬＳＰ係数を予測する方法
としてＭＡ予測を用いたが、これに限らずＡＲ予測や前
フレームとの差分による予測を用いてもよい。また、こ
の実施の形態４の構成でも、ＬＳＰ係数の代わりに線形
予測係数、ＰＡＲＣＯＲ係数、ケプストラム係数などの
他の係数を用いることが可能である。ＬＳＰ以外の係数
を用いるシステムを構成するには、スペクトル分析部２
及びスペクトル符号化部３をその係数の種類に合った分
析又は量子化処理を行うモジュールに置き換えればよ
い。

【０１１４】この実施の形態４では、比較制御部３１で
スペクトル誤差が小さい時間方向を選び、その時間方向
のＬＳＰ係数の符号を伝送しているので、常に量子化誤
差の小さい方のＬＳＰ係数の符号に基づき復号化音声を
生成することができる。したがって、この実施の形態４
によれば、音声分析合成手法による音声符号化、復号化
においても、音節の先頭の部分のスペクトル特性が良好
な高品質の復号化音声を得ることができる。

【０１１５】以上の説明から明らかなように、双方向バ
ッファ２２及び２３を利用する手法は、ＣＥＬＰ方式の
みならず、音声分析合成手法など、音声スペクトルを利
用する他の音声符号化復号化方式にも効果がある。

【０１１６】実施の形態５．この発明の実施の形態５に
係る音声符号化復号化システムは、図１３に示す音声符
号化装置と、図１４に示す音声復号化装置とから構成さ
れる。図１３、図１４において、それぞれ図１又は図
７、図２又は図８の構成要素と同様の構成要素について
は、同一の符号を付してその説明を省略する。

【０１１７】この実施の形態５に特有の構成は、音声符
号化装置のバッファ２４及び有音／無音判定部４０と、
音声復号化装置のバッファ２５である。バッファ２４及
び２５は、蓄積した音声サンプル列を複数の区間に分け
て管理することが可能で、しかも各区間ごとに蓄積時と
同方向及び逆方向の双方向に音声サンプル列を出力する
ことが可能なバッファである。また、有音／無音判定部
４０は、バッファ２４に蓄積された音声サンプル列にお
いて、所定の長さのフレーム単位ごとに例えば音声パワ
ーを算出し、このパワー算出結果に基づき各フレームが
有音フレームか無音フレームかを判定する。すなわち、
有音／無音判定部４０は、バッファ２４の蓄積結果の先
頭から末尾までを複数のフレームに分割し、先頭から順
に各フレームが有音フレーム又は無音フレームのいずれ
かを判定し、各フレームに先頭から順に与えたフレーム
番号とその判定結果を示す符号を出力する。このように
して有音／無音判定部４０から出力されるデータを有音
／無音情報と呼ぶ。なお、この実施の形態５において、
バッファ２４、２５及び有音／無音判定部４０以外の構
成は、基本的に実施の形態３と同様でよい。

【０１１８】図１３の音声符号化装置において、バッフ
ァ２４は、入力音声の音声サンプル列を所定長だけ蓄え
る。有音／無音判定部４０は、バッファ２４の音声蓄積
と並行して、バッファ２４に１フレーム分の音声サンプ
ル列が蓄積されるごとに、そのフレームの例えば音声パ
ワーを計算し、その音声パワーが所定のしきい値を越え
た場合は有音フレーム、それ以外の無音フレームと判定
する。この判定結果を表す符号は、順番に多重化処理部
８及びバッファ２４に入力される。

【０１１９】バッファ２４は、所定長の入力音声のサン
プル列を蓄積するごとに、次のような出力処理を行う。
まず、蓄積結果の先頭のフレームから順に、各フレーム
ごとに有音／無音判定部４０からの有音／無音情報を参
照し、そのフレームが有音フレーム、無音フレームのい
ずれであるかを判定する。そのフレームが無音フレーム
の場合は、そのフレームの音声サンプル列をそのまま
（すなわち蓄積時と同方向に）音声符号化部１に出力す
る。一方、そのフレームが有音フレームの場合は、有音
／無音情報を参照してそのフレームから次に無音フレー
ムが現れるまでの連続した有音フレーム群（１以上の有
音フレームの連続。以下「有音フレーム区間」と呼ぶ）
を求め、この有音フレーム区間の音声サンプル列を音声
符号化部１に供給する。このときバッファ２４は、実施
の形態２の双方向バッファ２２と同様、有音フレーム区
間の音声サンプル列については、音声符号化部１に対し
てまず蓄積時と同方向（すなわち時間的に順方向）に出
力し、次に逆方向に出力する。なお、有音フレーム区間
の出力が終わると、次は無音フレームなので、以下次に
有音フレームが現れるまでは、無音フレームがフレーム
単位で順方向にのみ出力される。

【０１２０】音声符号化部１は、バッファ２４から受け
取った音声サンプル列をＣＥＬＰ符号化する。このとき
無音フレームについては、そのまま順方向符号化処理を
行い、比較制御部３０は、最適音源探索部７で生成され
た各符号データを、順方向を示す時間方向情報とともに
多重化処理部８に出力する。一方、有音フレーム区間に
ついては、バッファ２４からの順方向及び逆方向の音声
サンプル列の供給に応じて、実施の形態３と同様に、順
方向ＣＥＬＰ符号化処理及び逆方向ＣＥＬＰ符号化処理
を順次実行する。したがって、有音フレーム区間につい
ては、比較制御部３０には、最適音源探索部７から、各
有音フレーム区間ごとに、順方向処理によって求めた各
符号及び誤差と、逆方向処理よって求めた各符号及び誤
差とが入力される。この場合、比較制御部３０は、実施
の形態３と同様に、各有音フレーム区間ごとに、誤差の
小さい時間方向を求め、その時間方向についての各符号
と、その時間方向を表す時間方向情報とを多重化処理部
８に出力する。

【０１２１】多重化処理部８は、有音フレーム区間につ
いては、実施の形態３と同様に、誤差の少ない時間方向
についてのＬＳＰ係数の符号を選択し、この符号と比較
制御部３０から入力された各符号、及び有音／無音判定
部４０から入力された有音／無音情報とを多重化し、通
信路に送出する。また、多重化処理部８は、無音フレー
ムについては、ＬＳＰ係数の符号、比較制御部３０から
入力された各符号、及び有音／無音情報を多重化し、通
信路に送出する。

【０１２２】なお、以上の符号化処理において、適応音
源符号帳５及び雑音音源符号帳６は、有音フレーム区間
については、実施の形態３と同様の動作を有音フレーム
区間を単位として実行する。すなわち、適応音源符号帳
５及び雑音音源符号帳６は、有音フレーム区間ごとに適
切な時間方向の音源ベクトルを出力し、適応音源符号帳
５の内容は有音フレーム区間ごとに実施の形態３と同様
の手順で更新される。なお、無音フレーム区間について
は、順方向処理しか行わないので、適応音源符号帳５及
び雑音音源符号帳６は従来と同様の処理を行えばよい。

【０１２３】次に、図１４の音声復号化装置において
は、まず分離処理部９が通信路から受信した多重化され
たデータを多重分離する。音声復号化部１０は、分離処
理部９から受け取った各符号を用いて、順次ＣＥＬＰ復
号化処理を実行する。この復号化処理はデータが入力さ
れる順に行われるので、無音フレームについてはフレー
ムを単位として、有音フレームについては有音フレーム
区間を単位として復号化処理が行われることになる。こ
の復号化処理においては、適応音源符号帳１２及び雑音
音源符号帳１３は、実施の形態３と同様、時間方向情報
に基づき、入力された各符号の時間方向と同じ方向の適
応音源ベクトル及び雑音音源ベクトルを生成して出力す
る。適応音源符号帳１２は、適応音源符号帳５と同様
に、データの時間方向に応じた適切な方法で更新され
る。そして、合成フィルタ１４は、各無音フレームごと
及び各有音フレーム区間ごとに音声を合成し、この合成
音声をバッファ２５に入力する。この実施の形態では、
バッファ２５に入力される合成音声の時間方向は、無音
フレームについてはすべて同じ順方向であるが、有音フ
レーム区間については各々異なる。

【０１２４】バッファ２５は、分離処理部９を介して受
け取った時間方向情報及び有音／無音情報を参照し、蓄
積した合成音声の音声サンプル列を適切な時間方向に従
って出力する。すなわち、バッファ２５は、出力しよう
とするフレームが無音フレームである場合には、そのフ
レームの音声サンプル列を順方向に出力する。また、バ
ッファ２５は、出力しようとするフレームが有音フレー
ムである場合は、そのフレームから始まる有音フレーム
区間の末尾までの音声サンプル列を、時間方向情報に示
される方向に応じた向きに出力する。すなわち、当該有
音フレーム区間の時間方向が順方向なら蓄積時と同方向
に出力し、逆方向なら蓄積時と逆方向に出力する。この
ような出力処理により、常に時間的に順方向の時系列の
復号化音声を得ることができる。

【０１２５】なお、以上の構成において、過去のフレー
ムから現フレームのＬＳＰ係数を予測する方法としてＭ
Ａ予測を用いたが、これに限らずＡＲ予測や前フレーム
との差分による予測を用いてもよい。また、この実施の
形態５の構成でも、ＬＳＰ係数の代わりに線形予測係
数、ＰＡＲＣＯＲ係数、ケプストラム係数などの他の係
数を用いることが可能である。ＬＳＰ以外の係数を用い
るシステムを構成するには、スペクトル分析部２及びス
ペクトル符号化部３をその係数の種類に合った分析又は
量子化処理を行うモジュールに置き換えればよい。

【０１２６】図１５は、この実施の形態５の効果を説明
するための図である。図１５において、（ａ）は説明の
ための一例として用いる入力音声の波形である。この波
形は、途中に一続きの有音の区間を有している。（ａ）
に示された領域は複数のフレームから構成され、Ａ及び
Ｂは、それぞれ、これら複数のフレームの区切りのなか
の一つである。そして、（ａ）の波形の先頭から区切り
Ｂまでが連続した有音フレーム群、すなわち一つの有音
フレーム区間を構成しているとする。（ｂ）は、（ａ）
の入力音声を区切りＡのところまでで区切り、先頭から
この区切りＡまでのフレーム群の音声サンプル列を時間
的に逆方向に出力した場合の波形である。すなわち、
（ｂ）は、有音フレーム区間を仮に途中のフレームで区
切って符号化する場合の逆方向入力音声を示している。
（ｃ）は、（ｂ）の逆方向入力音声をＣＥＬＰ符号化し
たときに得られる逆方向の音源信号の波形を示し、
（ｄ）はこの逆方向音源信号を用いてＣＥＬＰ復号化を
行った時に得られる時間的に順方向の復号化音声の波形
を示す。また、（ｅ）は、（ａ）の波形の先頭から区切
りＢまでの一連の有音フレーム区間を、バッファ２４に
よって時間的に逆方向に出力した時に得られる逆方向入
力音声の波形を示す。そして、（ｆ）は、（ｅ）に示し
た有音フレーム区間単位の逆方向入力音声を、ＣＥＬＰ
符号化したときに得られる逆方向音源信号の波形を示
し、（ｇ）は、（ｆ）の逆方向音源信号を用いてＣＥＬ
Ｐ復号化を行ったときに得られる時間的に順方向の復号
化音声の波形である。

【０１２７】符号化・復号化をフレーム単位で行おうと
した場合において、図１５の（ａ）のように入力音声を
有音フレーム区間の途中のパワーの大きい区間１１０に
フレームの区切りＡが来たとする。ここで、入力音声を
この区切りＡで区切り、例えば（ｂ）に示すように時間
的に逆方向に直して符号化を行ったとすると、（ｃ）に
示すように音源信号のピッチ周期とピッチピークがうま
く生成できない。このため、（ｃ）の音源信号を用いて
求めた復号化音声（ｄ）は、入力音声の区間１１０に対
応する区間１１１の音声品質が劣化する。有音の区間に
おいてパワーの大きい部分は聴覚上重要部分であり、そ
の部分の復号音声の品質劣化は聴覚上大きな問題を生
む。

【０１２８】これに対し、入力音声（ａ）において一続
きの有音フレーム区間の末尾である区切りＢまでを一つ
の単位とし、これを（ｅ）に示すように時間的に逆方向
に直して符号化すると、音源信号（ｆ）において前述の
区間１１０に対応する区間のピッチ周期及びピッチピー
クが良好に再生される。したがって、この音源信号
（ｆ）を用いて求めた復号化音声（ｇ）は、入力音声の
区間１１０に対応する区間１１２でも良好な品質が得ら
れる。

【０１２９】なお、図１５では、時間的に逆方向に沿っ
た符号化についてのみ説明したが、順方向についての符
号化も本質的には同じであり、有音の区間の途中でフレ
ームが区切られてしまうと、フレーム単位の符号化では
復号化音声の品質が劣化してしまう。これに対して、こ
の実施の形態３によれば、無音フレームから次の無音フ
レームまでの一連の有音フレーム群を一つの有音フレー
ム区間にまとめ、この有音フレーム区間を単位として符
号化を行うので、符号化処理の区切りが音声パワーの大
きな箇所に来ることがない。このため、順方向符号化及
び逆方向符号化のいずれにおいてもピッチ周期及びピッ
チピークが良好に再生され、品質の良好な復号化音声を
得ることができる。

【０１３０】図１６はこの実施形態による他の効果を示
す説明図であり、１つのＣＶによる１音節の入力音声の
パワー、スペクトル特徴、スペクトルの逆方向のＭＡ予
測誤差の大小を示している。図４と同様に、スペクトル
特徴は、類似したものについては同じ記号にダッシュを
付けて示し、類似しないもの同士は記号自体を別のもの
にすることにより区別している。図１６において、
（ａ）は途中に一続きの有音の区間を有しており、Ａ及
びＢは、それぞれ、複数のフレームの区切りのなかの一
つである。そして、（ａ）の先頭から区切りＢまでが連
続した有音フレーム群、すなわち一つの有音フレーム区
間を構成しているとする。（ｂ）は、（ａ）の入力音声
を区切りＡのところまでで区切ったものである。（ｃ）
は、（ａ）の先頭から区切りＢまでの一連の有音フレー
ム区間である。

【０１３１】図１６の（ｂ）のように入力音声を音声パ
ワーの大きな有音区間の途中のＡで区切り、区切りＡを
開始点として逆方向ＭＡ予測を行うと、(ｂ)で示すよう
に十分な長さの定常母音区間が含まれないので語頭部の
矢印６４で示したフレームでの逆方向予測誤差は小さく
ならない。また区切りＡの近傍の音声パワーの大きなフ
レームの逆方向予測誤差も大きい。従ってこれらの部分
では効率的なスペクトル量子化が行えず、復号化音声で
良好なスペクトル特性が得られない。

【０１３２】これに対し、(ｃ)のように一続きの有音フ
レーム区間の末尾である区切りＢまでを一つの単位と
し、区切りＢを開始点として逆方向ＭＡ予測を行うと、
十分な定常母音区間が含まれるので、語頭の矢印６４で
示したフレームでの逆方向ＭＡ予測誤差が小さくなり、
また音声パワーの大きな部分の逆方向ＭＡ予測誤差も小
さくなる。従ってこれらの部分で効率的なスペクトル量
子化が行えて、復号化音声のスペクトル特性が良好にな
る。

【０１３３】なお、図１６では、時間的に逆方向に沿っ
た符号化についてのみ説明したが、順方向についての符
号化も本質的には同じであり、有音の区間の途中でフレ
ームが区切られてしまうと、復号化音声のスペクトル特
性が劣化してしまう。これに対して、この実施の形態５
によれば、無音フレームから次の無音フレームまでの一
連の有音フレーム群を一つの有音フレーム区間にまと
め、この有音フレーム区間を単位として符号化を行うの
で、符号化処理の区切りが音声パワーが大きい有音区間
の途中に来ることがない。このため、順方向ＣＥＬＰ符
号化及び逆方向ＣＥＬＰ符号化のいずれにおいても良好
なスペクトル特性を持つ復号化音声を得ることができ
る。

【０１３４】このように、上記実施の形態５によれば、
各フレームごとに有音、無音を判定し、有音フレームに
ついては一続きの有音フレーム区間を単位として符号化
・復号化を行うとともに、順方向ＣＥＬＰ符号化及び逆
方向ＣＥＬＰ符号化の結果のうち誤差の少ない方を選ん
で伝送するので、語頭部分や有音区間内のパワーの大き
い部分で良好なスペクトル特性を持つ品質の良い復号化
音声を得ることができる。

【０１３５】なお、以上の例では音声のパワーに基づき
有音フレーム、無音フレームの判定を行ったが、この判
定処理は、音声パワーを求める以外の他の方法で行って
もよい。

【０１３６】実施の形態６.この発明の実施の形態６に
係る音声符号化復号化システムは、実施の形態５に示し
た有音／無音判定を利用する手法を、いわゆる音声分析
合成手法による音声符号化・復号化のシステムに適用し
た例であり、図1７に示す音声符号化装置と、図1８に示
す音声復号化装置とから構成される。図1７及び図1８に
おいて、それぞれ図１３又は図１１、図１４又は図１２
の構成要素と同様の構成要素については、同一の符号を
付して詳細な説明を省略する。

【０１３７】図１７の音声符号化装置において、バッフ
ァ２４は、実施の形態５と同様の処理によって音声符号
化部１５に入力音声サンプル列を入力する。音声符号化
部１５は、バッファ２４から受け取った音声サンプル列
を音声分析合成手法により符号化する。このとき無音フ
レームについては、そのまま順方向符号化処理を行い、
比較制御部３１は、音源符号化部５２で生成された各符
号データを、順方向を示す時間方向情報とともに多重化
処理部８に出力する。一方、有音フレーム区間について
は、バッファ２４からの順方向及び逆方向の音声サンプ
ル列の供給に応じて、実施の形態４と同様に、順方向分
析合成符号化処理及び逆方向分析合成符号化処理を順次
実行する。したがって、有音フレーム区間については、
比較制御部３１には、音源符号化部１５とスペクトル符
号化部３から、各有音フレーム区間ごとに、順方向処理
によってそれぞれ求めた各符号及び順方向スペクトル誤
差と、逆方向処理よって求めた各符号及び逆方向スペク
トル誤差とが入力される。この場合、比較制御部３１
は、実施の形態４と同様に、各有音フレーム区間ごと
に、スペクトル誤差の小さい時間方向を求め、その時間
方向についての各符号と、その時間方向を表す時間方向
情報とを多重化処理部８に出力する。

【０１３８】多重化処理部８は、有音フレーム区間につ
いては、実施の形態４と同様に、誤差の少ない時間方向
についてのＬＳＰ係数の符号を選択し、この符号と比較
制御部３１から入力された各符号、及び有音／無音判定
部４０から入力された有音／無音情報とを多重化し、通
信路に送出する。また、多重化処理部８は、無音フレー
ムについては、ＬＳＰ係数の符号、比較制御部３１から
入力された各符号、及び有音／無音情報を多重化し、通
信路に送出する。

【０１３９】次に、図１８の音声復号化装置において
は、まず分離処理部９が通信路から受信した多重化され
たデータを多重分離する。音声復号化部１６は、分離処
理部９から受け取った各符号を用いて、順次分析合成復
号化処理を実行する。この復号化処理はデータが入力さ
れる順に行われるので、無音フレームについてはフレー
ムを単位として、有音フレームについては有音フレーム
区間を単位として復号化処理が行われることになる。合
成フィルタ１４は、各無音フレームごと及び各有音フレ
ーム区間ごとに音声を合成し、この合成音声をバッファ
２５に入力する。この実施の形態では、バッファ２５に
入力される合成音声の時間方向は、無音フレームについ
てはすべて同じ順方向であるが、有音フレーム区間につ
いては各々異なる。そこで、バッファ２５は、実施の形
態５と同様、分離処理部９を介して受け取った時間方向
情報及び有音／無音情報に基づき、蓄積した合成音声の
音声サンプル列を適切な時間方向に従って出力する。こ
の結果、常に時間的に順方向の時系列の復号化音声を得
ることができる。

【０１４０】なお、以上の構成において、過去のフレー
ムのデータから現フレームのＬＳＰ係数を予測する方法
としてＭＡ予測を用いたが、これに限らずＡＲ予測や前
フレームとの差分による予測を用いてもよい。また、こ
の実施の形態６の構成でも、ＬＳＰ係数の代わりに線形
予測係数、ＰＡＲＣＯＲ係数、ケプストラム係数などの
他の係数を用いることが可能である。ＬＳＰ以外の係数
を用いるシステムを構成するには、スペクトル分析部２
及びスペクトル符号化部３をその係数の種類に合った分
析又は量子化処理を行うモジュールに置き換えればよ
い。

【０１４１】このように、上記実施の形態６によれば、
各フレームごとに有音、無音を判定し、有音フレームに
ついては一続きの有音フレーム区間を単位として符号化
・復号化を行うとともに、順方向分析合成符号化及び逆
方向分析合成符号化の結果のうちスペクトルの量子化誤
差の少ない方を選んで伝送するので、語頭部分や有音区
間内のパワーの大きい部分でも良好なスペクトル特性を
持つ品質の良い復号化音声を得ることができる。

【０１４２】以上から明らかなように、有音／無音判定
を利用する手法は、ＣＥＬＰ方式だけでなく、音声分析
合成手法など、音声スペクトルを利用した他の音声符号
化復号化方式にも適用可能である。

【０１４３】

【発明の効果】以上説明したように、この発明に係る音
声符号化復号化システム、音声符号化装置及び音声復号
化装置によれば、音声符号化装置に入力音声を時間的に
逆方向に並べ換えるためのバッファを設け、これによっ
て得られた逆方向入力音声に対してＣＥＬＰ方式による
音源の符号化を行うので、語頭部分においても品質の良
い音源信号を得ることができ、復号化装置において高い
品質の語頭部分の復号化音声を得ることができる。

【０１４４】また、この発明に係る音声符号化復号化シ
ステム、音声符号化装置及び音声復号化装置によれば、
逆方向入力音声に対して過去のデータからの予測を伴う
スペクトルパラメータの符号化を行うので、音節の先頭
部分について良好なスペクトル特性を得ることができ
る。そして、音声復号化装置において復号化音声をバッ
ファで逆向きに並べ換えて出力することにより、語頭部
分を含む音節先頭部分について品質のよい順方向の復号
化音声を得ることができる。このように、この発明によ
れば、音声スペクトルを用いる音声符号化復号化システ
ムにおいて、音節先頭部分の品質のよい復号化音声を得
ることができる。

【０１４５】また、この発明に係る音声符号化復号化シ
ステム、音声符号化装置及び音声復号化装置によれば、
音声符号化装置では双方向バッファの働きにより順方向
及び逆方向の入力音声に対しＣＥＬＰ方式による音源の
符号化を行い、これら各方向の符号化データのうち波形
誤差の小さい方を比較制御部で選択して出力し、音声復
号化装置において語頭部分のみならずピーク周期性が変
化する部分についても品質がよい復号化音声を得ること
ができる。

【０１４６】また、この発明に係る音声符号化復号化シ
ステム、音声符号化装置及び音声復号化装置によれば、
順方向及び逆方向入力音声に対して過去のデータからの
予測を伴うスペクトルパラメータの符号化を行うので、
音節の先頭部分のスペクトルが複雑に変化する場合につ
いても良好な復号音声のスペクトル特性を得ることがで
きる。そして、音声復号化装置においてバッファで復号
化音声を時間方向に合わせて出力制御することにより、
語頭部分や音節の始めの部分で品質のよい順方向の復号
化音声を得ることができる。したがって、この発明によ
れば、音声スペクトルを用いる音声符号化復号化システ
ムにおいて、音節の先頭部分の品質のよい復号音声を得
ることができる。

【０１４７】また、この発明に係る音声符号化復号化シ
ステム、音声符号化装置及び音声復号化装置によれば、
入力音声をフレーム単位で符号化・復号化する場合にお
いて、有音フレームについては、一続きの有音フレーム
からなる有音フレーム区間を単位として符号化・復号化
を行うので、有音の区間の途中で区切って符号化・復号
化することがなくなり、語頭部分の品質が良くしかも有
音区間のパワーの大きい部分でも品質の良い復号化音声
を得ることができる。

【０１４８】また、この発明に係る音声符号化復号化シ
ステム、音声符号化装置及び音声復号化装置によれば、
フレームごとに有音、無音を判定し、有音フレームにつ
いては一続きの有音フレーム区間を単位として時間的に
順方向及び逆方向の双方向に符号化を行い、それら両者
の復号化結果のうち量子化誤差の少ない方を選んで伝送
する。したがって、この発明によれば、音声スペクトル
を用いる音声符号化復号化システムにおいて、語頭部分
や有音区間内のパワーの大きい部分でも良好なスペクト
ル特性を持つ品質の良い復号化音声を得ることができ
る。

【図面の簡単な説明】

【図１】この発明の実施の形態１における音声符号化
装置の構成図である。

【図２】この発明の実施の形態１における音声復号化
装置の構成図である。

【図３】この発明の実施の形態１の効果を説明するた
めの図である。

【図４】この発明の実施の形態１の効果を説明するた
めの図である。

【図５】この発明の実施の形態２における音声符号化
装置の構成図である。

【図６】この発明の実施の形態２における音声復号化
装置の構成図である。

【図７】この発明の実施の形態３における音声符号化
装置の構成図である。

【図８】この発明の実施の形態３における音声復号化
装置の構成図である。

【図９】この発明の実施の形態３の効果を説明するた
めの図である。

【図１０】この発明の実施の形態３の効果を説明する
ための図である。

【図１１】この発明の実施の形態４における音声符号
化装置の構成図である。

【図１２】この発明の実施の形態４における音声復号
化装置の構成図である。

【図１３】この発明の実施の形態５における音声符号
化装置の構成図である。

【図１４】この発明の実施の形態５における音声復号
化装置の構成図である。

【図１５】この発明の実施の形態５の効果を説明する
ための図である。

【図１６】この発明の実施の形態５の効果を説明する
ための図である。

【図１７】この発明の実施の形態６における音声符号
化装置の構成図である。

【図１８】この発明の実施の形態６における音声復号
化装置の構成図である。

【図１９】従来の音声符号化装置の構成図である。

【図２０】従来の音声復号化装置の構成図である。

【図２１】適応音源ベクトルの生成方法を説明するた
めの図である。

【図２２】従来の音声符号化装置及び音声復号化装置
における問題点を説明するための図である。

【符号の説明】

１音声符号化部、２スペクトル分析部、３スペク
トル符号化部、４合成フィルタ、５適応音源符号
帳、６雑音音源符号帳、７最適音源探索部、８多
重化処理部、９分離処理部、１０音声復号化部、１
１スペクトル復号化部、１２適応音源符号帳、１３
雑音音源符号帳、１４合成フィルタ、１５音声符
号化部、１６音声復号化部、２０，２１バッフ
ァ、２２，２３双方向バッファ、２４、２５バッフ
ァ、３０、３１比較制御部、４０有音／無音判定部、
５０，５２音源符号化部、５１，５３音源復号化
部。

Claims

【特許請求の範囲】

【請求項１】入力音声を符号駆動線形予測符号化方式
で符号化する音声符号化装置と、この音声符号化装置か
ら出力された符号化データを符号駆動線形予測復号化方
式で復号化して音声を再生する音声復号化装置と、を含
む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積した音声サンプル列を蓄積時とは逆方向に出力するバ
ッファと、このバッファから出力された音声サンプル列に対し符号
駆動線形予測符号化式による符号化を行う音声符号化部
と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された音声符号化データを
符号駆動線形予測復号化方式によって音声に復号化する
音声復号化部と、この音声復号化部での復号化により得られた音声サンプ
ル列を所定量蓄積するごとに、蓄積した音声サンプル列
を蓄積時とは逆方向に出力するバッファと、を備えることを特徴とする音声符号化復号化システム。
【請求項２】入力音声の音声サンプル列を所定量蓄積
するごとに、蓄積した音声サンプル列を蓄積時とは逆方
向に出力するバッファと、このバッファから出力された音声サンプル列に対し符号
駆動線形予測符号化式による符号化を行う音声符号化部
と、を備えることを特徴とする音声符号化装置。
【請求項３】符号化された音声データを符号駆動線形
予測復号化方式によって音声に復号化する音声復号化部
と、この音声復号化部での復号化により得られた音声サンプ
ル列を所定量蓄積するごとに、蓄積した音声サンプル列
を蓄積時とは逆方向に出力するバッファと、を備えることを特徴とする音声復号化装置。
【請求項４】入力音声から音声スペクトルと音源情報
とを求めてそれぞれ符号化する音声符号化装置と、この
音声符号化装置から出力された符号化音声スペクトル及
び符号化音源情報を復号化し、この結果得られた音声ス
ペクトルと音源情報から音声を再生する音声復号化装置
と、を含む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積した音声サンプル列を蓄積時とは逆方向に出力するバ
ッファと、このバッファから出力された音声サンプル列をフレーム
毎にスペクトル分析して音声スペクトルを求めるスペク
トル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化するスペクトル符号化部と、前記バッファから出力された音声サンプル列から音源情
報を求めて符号化する音源符号化部と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された符号化音声スペクト
ルを、以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて復号化するスペクトル復号化部
と、前記音声符号化装置から出力された符号化音源情報を復
号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報とから音声
を合成する合成フィルタと、この合成フィルタで合成された音声サンプル列を所定量
蓄積するごとに、蓄積した音声サンプル列を蓄積時とは
逆方向に出力するバッファと、を備えることを特徴とする音声符号化復号化システム。
【請求項５】入力音声の音声サンプル列を所定量蓄積
するごとに、蓄積した音声サンプル列を蓄積時とは逆方
向に出力するバッファと、このバッファから出力された音声サンプル列をフレーム
毎にスペクトル分析して音声スペクトルを求めるスペク
トル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化するスペクトル符号化部と、前記バッファから出力された音声サンプル列から音源情
報を求めて符号化する音源符号化部と、を備えることを特徴とする音声符号化装置。
【請求項６】符号化された音声スペクトルを、以前の
１又は複数のフレームの音声スペクトルによる予測処理
を用いて復号化するスペクトル復号化部と、符号化された音源情報を復号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報とから音声
を合成する合成フィルタと、この合成フィルタで合成された音声サンプル列を所定量
蓄積するごとに、蓄積した音声サンプル列を蓄積時とは
逆方向に出力するバッファと、を備えることを特徴とする音声復号化装置。
【請求項７】入力音声を符号駆動線形予測符号化方式
で符号化する音声符号化装置と、この音声符号化装置か
ら出力された符号化データを符号駆動線形予測復号化方
式で復号化して音声を再生する音声復号化装置と、を含
む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積結果の音声サンプル列を、蓄積時と同方向及び逆方向
にそれぞれ出力する双方向バッファと、この双方向バッファから前記各方向の音声サンプル列を
受け取るごとに、受け取った音声サンプル列を符号駆動
線形予測符号化方式で符号化するとともに、この符号化
処理に伴い内部的に生成される合成音声のサンプル列と
前記入力音声の音声サンプル列との誤差を算出する音声
符号化部と、前記各方向についての前記誤差を比較し、前記音声符号
化部で求められた符号化データのうち前記誤差の小さい
方の方向についての符号化データを選択し、前記誤差の
小さい方の方向を示す時間方向情報とともに出力する比
較制御部と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された音声符号化データを
符号駆動線形予測復号化方式によって音声復号化する音
声復号化部と、この音声復号化部での復号化により得られた音声サンプ
ル列を所定量蓄積するごとに、蓄積した音声サンプル列
を、前記音声符号化装置から受け取った時間方向情報に
応じた方向に出力するバッファと、を備えることを特徴とする音声符号化復号化システム。
【請求項８】入力音声の音声サンプル列を所定量蓄積
するごとに、蓄積結果の音声サンプル列を、蓄積時と同
方向及び逆方向にそれぞれ出力する双方向バッファと、この双方向バッファから前記各方向の音声サンプル列を
受け取るごとに、受け取った音声サンプル列を符号駆動
線形予測符号化方式で符号化するとともに、この符号化
処理に伴い内部的に生成される合成音声のサンプル列と
前記入力音声の音声サンプル列との誤差を算出する音声
符号化部と、前記各方向についての前記誤差を比較し、前記音声符号
化部で求められた符号化データのうち前記誤差の小さい
方の方向についての符号化データを選択し、前記誤差の
小さい方の方向を示す時間方向情報とともに出力する比
較制御部と、を備えることを特徴とする音声符号化装置。
【請求項９】符号化された音声データを符号駆動線形
予測復号化方式によって音声復号化する音声復号化部
と、この音声復号化部での復号化により得られた音声サンプ
ル列を所定量蓄積するごとに、蓄積した音声サンプル列
を、受け取った時間方向情報に応じた方向に出力するバ
ッファと、を備えることを特徴とする音声復号化装置。
【請求項１０】入力音声から音声スペクトルと音源情
報とを求めてそれぞれ符号化する音声符号化装置と、こ
の音声符号化装置から出力された符号化音声スペクトル
及び符号化音源情報を復号化し、この結果得られた音声
スペクトルと音源情報から音声を再生する音声復号化装
置と、を含む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積結果の音声サンプル列を、蓄積時と同方向及び逆方向
にそれぞれ出力する双方向バッファと、この双方向バッファから前記各方向の音声サンプル列を
受け取るごとに、受け取った音声サンプル列をフレーム
毎にスペクトル分析して音声スペクトルを求めるスペク
トル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化するスペクトル符号化部と、前記双方向バッファから出力された音声サンプル列から
音源情報を求めて符号化し、この結果得られた符号化音
源情報と前記スペクトル符号化部で求められた符号化音
声スペクトルとから合成音声を合成し、この合成音声の
サンプル列と前記入力音声の音声サンプル列との誤差を
算出する音源符号化部と、前記各方向についての前記誤差を比較し、前記スペクト
ル符号化部及び音源符号化部でそれぞれ求められた前記
同方向及び逆方向の符号化音声スペクトル及び符号化音
源情報のうち、前記誤差の小さい方の方向についての符
号化音声スペクトル及び符号化音源情報を選択し、前記
誤差の小さい方の方向を示す時間方向情報とともに出力
する比較制御部と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された符号化音声スペクト
ルを、以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて復号化するスペクトル復号化部
と、前記音声符号化装置から出力された符号化音源情報を復
号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報とから音声
を合成する合成フィルタと、この合成フィルタで得られた音声サンプル列を所定量蓄
積するごとに、蓄積した音声サンプル列を、前記音声符
号化装置から受け取った時間方向情報に応じた方向に出
力するバッファと、を備えることを特徴とする音声符号化復号化システム。
【請求項１１】入力音声の音声サンプル列を所定量蓄
積するごとに、蓄積結果の音声サンプル列を、蓄積時と
同方向及び逆方向にそれぞれ出力する双方向バッファ
と、この双方向バッファから前記各方向の音声サンプル列を
受け取るごとに、受け取った音声サンプル列をフレーム
毎にスペクトル分析して音声スペクトルを求めるスペク
トル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化するスペクトル符号化部と、前記双方向バッファから出力された音声サンプル列から
音源情報を求めて符号化し、この結果得られた符号化音
源情報と前記スペクトル符号化部で求められた符号化音
声スペクトルとから合成音声を合成し、この合成音声の
サンプル列と前記入力音声の音声サンプル列との誤差を
算出する音源符号化部と、前記各方向についての前記誤差を比較し、前記スペクト
ル符号化部及び音源符号化部でそれぞれ求められた前記
同方向及び逆方向の符号化音声スペクトル及び符号化音
源情報のうち、前記誤差の小さい方の方向についての符
号化音声スペクトル及び符号化音源情報を選択し、前記
誤差の小さい方の方向を示す時間方向情報とともに出力
する比較制御部と、を備えることを特徴とする音声符号化装置。
【請求項１２】符号化された音声スペクトルを、以前
の１又は複数のフレームの音声スペクトルによる予測処
理を用いて復号化するスペクトル復号化部と、符号化された音源情報を復号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報とから音声
を合成する合成フィルタと、この合成フィルタで得られた音声サンプル列を所定量蓄
積するごとに、蓄積した音声サンプル列を、前記符号化
された音声スペクトルと音源情報とに対応して受け取っ
た時間方向情報に応じた方向に出力するバッファと、を備えることを特徴とする音声復号化装置。
【請求項１３】入力音声から音声スペクトルと音源情
報を求めてそれぞれ符号化する音声符号化装置と、この
音声符号化装置から出力された符号化音声スペクトル及
び符号化音源情報を復号化し、この結果得られた音声ス
ペクトルと音源情報から音声を再生する音声復号化装置
と、を含む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定量蓄積するごとに、蓄
積結果の音声サンプル列を、蓄積時と同方向及び逆方向
にそれぞれ出力する双方向バッファと、この双方向バッファから前記各方向の音声サンプル列を
受け取るごとに、受け取った音声サンプル列をフレーム
毎にスペクトル分析して音声スペクトルを求めるスペク
トル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化すると共に、この符号化処理の際
の音声スペクトルの量子化誤差を算出するスペクトル符
号化部と、前記双方向バッファから出力された音声サンプル列から
音源情報を求めて符号化する音源符号化部と、前記各方向についての前記量子化誤差を比較し、前記ス
ペクトル符号化部及び音源符号化部でそれぞれ求められ
た前記同方向及び逆方向の符号化音声スペクトル及び符
号化音源情報のうち、前記量子化誤差の小さい方の方向
についての符号化音声スペクトル及び符号化音源データ
を選択し、前記量子化誤差の小さい方の方向を示す時間
方向情報とともに出力する比較制御部と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された符号化音声スペクト
ルを、以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて復号化するスペクトル復号化部
と、前記音声符号化装置から出力された符号化音源情報を復
号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報より音声を
合成する合成フィルタと、この合成フィルタで得られた音声サンプル列を所定量蓄
積するごとに、蓄積した音声サンプル列を、前記音声符
号化装置から受け取った時間方向情報に応じた方向に出
力するバッファと、を備えることを特徴とする音声符号化復号化システム。
【請求項１４】入力音声の音声サンプル列を所定量蓄
積するごとに、蓄積結果の音声サンプル列を、蓄積時と
同方向及び逆方向にそれぞれ出力する双方向バッファ
と、この双方向バッファから前記各方向の音声サンプル列を
受け取るごとに、受け取った音声サンプル列をフレーム
毎にスペクトル分析して音声スペクトルを求めるスペク
トル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化すると共に、この符号化処理の際
の音声スペクトルの量子化誤差を算出するスペクトル符
号化部と、前記双方向バッファから出力された音声サンプル列から
音源情報を求めて符号化する音源符号化部と、前記各方向についての前記量子化誤差を比較し、前記ス
ペクトル符号化部及び音源符号化部でそれぞれ求められ
た前記同方向及び逆方向の符号化音声スペクトル及び符
号化音源情報のうち、前記量子化誤差の小さい方の方向
についての符号化音声スペクトル及び符号化音源情報を
選択し、前記量子化誤差の小さい方の方向を示す時間方
向情報とともに出力する比較制御部と、を備えることを特徴とする音声符号化装置。
【請求項１５】入力音声を符号駆動線形予測符号化方
式で符号化する音声符号化装置と、この音声符号化装置
から出力された符号化データを符号駆動線形予測復号化
方式で復号化して音声を再生する音声復号化装置と、を
含む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定長のフレーム単位に分
割し、各フレームが有音フレーム、無音フレームのいず
れであるかを判定するとともに、この判定結果を示す有
音／無音情報を出力する有音／無音判定部と、入力音声の音声サンプル列を蓄積しフレーム単位で出力
するバッファであって、有音フレームについては、無音
フレームから次の無音フレームまでの間の連続する１以
上の有音フレームからなる有音フレーム区間を単位と
し、この有音フレーム区間の音声サンプル列を蓄積時と
同方向及び逆方向に順次出力するバッファと、このバッファから音声サンプル列を受け取るごとに、受
け取った音声サンプル列を符号駆動線形予測符号化方式
で符号化するとともに、この符号化処理に伴い内部的に
生成される合成音声のサンプル列と前記入力音声の音声
サンプル列との誤差を算出する音声符号化部と、前記有音フレーム区間については、前記各方向について
の前記誤差を比較し、前記音声符号化部で求められた符
号化データのうち前記誤差の小さい方の方向について求
められた符号化データを選択し、前記誤差の小さい方の
方向を示す時間方向情報とともに出力する比較制御部
と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された音声符号化データを
符号駆動線形予測復号化方式によって音声復号化する音
声復号化部と、この音声復号化部での復号化により得られた音声サンプ
ル列を蓄積しフレーム単位で出力するバッファであっ
て、前記音声符号化装置から取得した有音／無音情報に
基づき有音フレーム区間を検出し、この有音フレーム区
間については該区間を単位として前記音声符号化装置か
ら受け取った時間方向情報に応じた方向に音声サンプル
列を出力するバッファと、を備えることを特徴とする音声符号化復号化システム。
【請求項１６】入力音声の音声サンプル列を所定長の
フレーム単位に分割し、各フレームが有音フレーム、無
音フレームのいずれであるかを判定するとともに、この
判定結果を示す有音／無音情報を出力する有音／無音判
定部と、入力音声の音声サンプル列を蓄積しフレーム単位で出力
するバッファであって、有音フレームについては、無音
フレームから次の無音フレームまでの間の連続する１以
上の有音フレームからなる有音フレーム区間を単位と
し、この有音フレーム区間の音声サンプル列を蓄積時と
同方向及び逆方向に順次出力するバッファと、このバッファから音声サンプル列を受け取るごとに、受
け取った音声サンプル列を符号駆動線形予測符号化方式
で符号化するとともに、この符号化処理に伴い内部的に
生成される合成音声のサンプル列と前記入力音声の音声
サンプル列との誤差を算出する音声符号化部と、前記有音フレーム区間については、前記各方向について
の前記誤差を比較し、前記音声符号化部で求められた符
号化データのうち前記誤差の小さい方の方向について求
められた符号化データを選択し、前記誤差の小さい方の
方向を示す時間方向情報とともに出力する比較制御部
と、を備えることを特徴とする音声符号化装置。
【請求項１７】符号化データを符号駆動線形予測復号
化方式によって音声復号化する音声復号化部と、この音声復号化部での復号化により得られた音声サンプ
ル列を蓄積しフレーム単位で出力するバッファであっ
て、有音／無音情報に基づき有音フレーム区間を検出
し、この有音フレーム区間については該区間を単位とし
て時間方向情報に応じた方向に音声サンプル列を出力す
るバッファと、を備えることを特徴とする音声復号化装置。
【請求項１８】入力音声から音声スペクトルと音源情
報とを求めてそれぞれ符号化する音声符号化装置と、こ
の音声符号化装置から出力された符号化音声スペクトル
及び符号化音源情報を復号化し、この結果得られた音声
スペクトルと音源情報から音声を再生する音声復号化装
置と、を含む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定長のフレーム単位に分
割し、各フレームが有音フレーム、無音フレームのいず
れであるかを判定するとともに、この判定結果を示す有
音／無音情報を出力する有音／無音判定部と、入力音声の音声サンプル列を蓄積しフレーム単位で出力
するバッファであって、有音フレームについては、無音
フレームから次の無音フレームまでの間の連続する１以
上の有音フレームからなる有音フレーム区間を単位と
し、この有音フレーム区間の音声サンプル列を蓄積時と
同方向及び逆方向に順次出力するバッファと、このバッファから音声サンプル列を受け取るごとに、受
け取った音声サンプル列をフレーム毎にスペクトル分析
して音声スペクトルを求めるスペクトル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化するスペクトル符号化部と、前記バッファから出力された音声サンプル列から音源情
報を求めて符号化し、この結果得られた符号化音源情報
と前記スペクトル符号化部で求められた符号化音声スペ
クトルから合成音声を合成し、この合成音声のサンプル
列と前記入力音声の音声サンプル列との誤差を算出する
音源符号化部と、前記有音フレーム区間については、前記各方向について
の前記誤差を比較し、前記スペクトル符号化部及び音源
符号化部でそれぞれ求められた前記同方向及び逆方向の
符号化音声スペクトル及び符号化音源情報のうち、前記
誤差の小さい方の方向についての符号化音声スペクトル
及び符号化音源情報を選択し、前記誤差の小さい方の方
向を示す時間方向情報とともに出力する比較制御部と、を備え、前記音声復号化装置は、前記音声符号化装置から出力された符号化音声スペクト
ルを、以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて復号化するスペクトル復号化部
と、前記音声符号化装置から出力された符号化音源情報を復
号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報より音声を
合成する合成フィルタと、この合成フィルタで得られた音声サンプル列を蓄積しフ
レーム単位で出力するバッファであって、前記音声符号
化装置から取得した有音／無音情報に基づき有音フレー
ム区間を検出し、この有音フレーム区間については該区
間を単位として前記音声符号化装置から受け取った時間
方向情報に応じた方向に音声サンプル列を出力するバッ
ファと、を備えることを特徴とする音声符号化復号化システム。
【請求項１９】入力音声の音声サンプル列を所定長の
フレーム単位に分割し、各フレームが有音フレーム、無
音フレームのいずれであるかを判定するとともに、この
判定結果を示す有音／無音情報を出力する有音／無音判
定部と、入力音声の音声サンプル列を蓄積しフレーム単位で出力
するバッファであって、有音フレームについては、無音
フレームから次の無音フレームまでの間の連続する１以
上の有音フレームからなる有音フレーム区間を単位と
し、この有音フレーム区間の音声サンプル列を蓄積時と
同方向及び逆方向に順次出力するバッファと、このバッファから音声サンプル列を受け取るごとに、受
け取った音声サンプル列をフレーム毎にスペクトル分析
して音声スペクトルを求めるスペクトル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化するスペクトル符号化部と、前記バッファから出力された音声サンプル列から音源情
報を求めて符号化し、この結果得られた符号化音源情報
と前記スペクトル符号化部で求められた符号化音声スペ
クトルから合成音声を合成し、この合成音声のサンプル
列と前記入力音声の音声サンプル列との誤差を算出する
音源符号化部と、前記有音フレーム区間については、前記各方向について
の前記誤差を比較し、前記スペクトル符号化部及び音源
符号化部でそれぞれ求められた前記同方向及び逆方向の
符号化音声スペクトル及び符号化音源情報のうち、前記
誤差の小さい方の方向についての符号化音声スペクトル
及び符号化音源情報を選択し、前記誤差の小さい方の方
向を示す時間方向情報とともに出力する比較制御部と、を備えることを特徴とする音声符号化装置。
【請求項２０】符号化された音声スペクトルを、以前
の１又は複数のフレームの音声スペクトルによる予測処
理を用いて復号化するスペクトル復号化部と、符号化された音源情報を復号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報より音声を
合成する合成フィルタと、この合成フィルタで得られた音声サンプル列を蓄積しフ
レーム単位で出力するバッファであって、前記音声符号
化装置から取得した有音／無音情報に基づき有音フレー
ム区間を検出し、この有音フレーム区間については該区
間を単位として前記音声符号化装置から受け取った時間
方向情報に応じた方向に音声サンプル列を出力するバッ
ファと、を備えることを特徴とする音声復号化装置。
【請求項２１】入力音声から音声スペクトルと音源情
報とを求めてそれぞれ符号化する音声符号化装置と、こ
の音声符号化装置から出力された符号化音声スペクトル
及び符音源情報を復号化し、この結果得られた音声スペ
クトルと音源情報から音声を再生する音声復号化装置
と、を含む音声符号化復号化システムにおいて、前記音声符号化装置は、入力音声の音声サンプル列を所定長のフレーム単位に分
割し、各フレームが有音フレーム、無音フレームのいず
れであるかを判定するとともに、この判定結果を示す有
音／無音情報を出力する有音／無音判定部と、入力音声の音声サンプル列を蓄積しフレーム単位で出力
するバッファであって、有音フレームについては、無音
フレームから次の無音フレームまでの間の連続する１以
上の有音フレームからなる有音フレーム区間を単位と
し、この有音フレーム区間の音声サンプル列を蓄積時と
同方向及び逆方向に順次出力するバッファと、このバッファから音声サンプル列を受け取るごとに、受
け取った音声サンプル列をフレーム毎にスペクトル分析
して音声スペクトルを求めるスペクトル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化すると共に、この符号化処理の際
の音声スペクトルの量子化誤差を算出するスペクトル符
号化部と、前記バッファから出力された音声サンプル列から音源情
報を求めて符号化する音源符号化部と、前記有音フレーム区間については、前記各方向について
の前記誤差を比較し、前記スペクトル符号化部と音源符
号化部でそれぞれ求められた符号化音声スペクトル及び
符号化音源情報のうち前記量子化誤差の小さい方の方向
について求められた符号化音声スペクトル及び符号化音
源情報を選択し、前記量子化誤差の小さい方の方向を示
す時間方向情報とともに出力する比較制御部とを備え、前記音声復号化装置は、前記音声符号化装置から出力された符号化音声スペクト
ルを、以前の１又は複数のフレームの音声スペクトルに
よる予測処理を用いて復号化するスペクトル復号化部
と、前記音声符号化装置から出力された符号化音源情報を復
号化する音源復号化部と、前記スペクトル復号化部で復号化された音声スペクトル
と前記音源復号化部で復号化された音源情報より音声を
合成する合成フィルタと、この合成フィルタで得られた音声サンプル列を蓄積しフ
レーム単位で出力するバッファであって、前記音声符号
化装置から取得した有音／無音情報に基づき有音フレー
ム区間を検出し、この有音フレーム区間については該区
間を単位として前記音声符号化装置から受け取った時間
方向情報に応じた方向に音声サンプル列を出力するバッ
ファと、を備えることを特徴とする音声符号化復号化システム。
【請求項２２】入力音声の音声サンプル列を所定長の
フレーム単位に分割し、各フレームが有音フレーム、無
音フレームのいずれであるかを判定するとともに、この
判定結果を示す有音／無音情報を出力する有音／無音判
定部と、入力音声の音声サンプル列を蓄積しフレーム単位で出力
するバッファであって、有音フレームについては、無音
フレームから次の無音フレームまでの間の連続する１以
上の有音フレームからなる有音フレーム区間を単位と
し、この有音フレーム区間の音声サンプル列を蓄積時と
同方向及び逆方向に順次出力するバッファと、このバッファから音声サンプル列を受け取るごとに、受
け取った音声サンプル列をフレーム毎にスペクトル分析
して音声スペクトルを求めるスペクトル分析部と、このスペクトル分析部から出力される音声スペクトルを
以前の１又は複数のフレームの音声スペクトルによる予
測処理を用いて符号化すると共に、この符号化処理の際
の音声スペクトルの量子化誤差を算出するスペクトル符
号化部と、前記バッファから出力された音声サンプル列から音源情
報を求めて符号化する音源符号化部と、前記有音フレーム区間については、前記各方向について
の前記量子化誤差を比較し、前記スペクトル符号化部及
び音源符号化部でそれぞれ求められた前記同方向及び逆
方向の符号化音声スペクトル及び符号化音源情報のうち
前記量子化誤差の小さい方の方向についての符号化音声
スペクトル及び符号化音源情報を選択し、前記量子化誤
差の小さい方の方向を示す時間方向情報とともに出力す
る比較制御部と、を備えることを特徴とする音声符号化装置。