JP2017522608A - 音声符号化方法および関連装置 - Google Patents
音声符号化方法および関連装置 Download PDFInfo
- Publication number
- JP2017522608A JP2017522608A JP2017505140A JP2017505140A JP2017522608A JP 2017522608 A JP2017522608 A JP 2017522608A JP 2017505140 A JP2017505140 A JP 2017505140A JP 2017505140 A JP2017505140 A JP 2017505140A JP 2017522608 A JP2017522608 A JP 2017522608A
- Authority
- JP
- Japan
- Prior art keywords
- subband
- speech frame
- current speech
- threshold
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 230000003595 spectral effect Effects 0.000 claims abstract description 1569
- 230000008569 process Effects 0.000 claims abstract description 22
- 238000001228 spectrum Methods 0.000 claims abstract description 13
- 230000005284 excitation Effects 0.000 claims abstract description 11
- 238000006243 chemical reaction Methods 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrolytic Production Of Non-Metals, Compounds, Apparatuses Therefor (AREA)
- Stereophonic System (AREA)
Abstract
Description
サブバンドzの最大周波数ビンは臨界周波数ビンF1より大きく、サブバンドwの最大周波数ビンは臨界周波数ビンF1より大きく、サブバンドjの最大周波数ビンは臨界周波数ビンF2より大きく、サブバンドnの最大周波数ビンは臨界周波数ビンF2より大きく、
臨界周波数ビンF1の値範囲は6.4kHz乃至12kHzであり、
臨界周波数ビンF2の値範囲は4.8kHz乃至8kHzであり、
サブバンドiの最大周波数ビンはサブバンドjの最大周波数ビンより小さく、サブバンドmの最大周波数ビンはサブバンドnの最大周波数ビンより小さく、サブバンドxの最大周波数ビンはサブバンドyの最小周波数ビン以下であり、サブバンドpの最大周波数ビンはサブバンドqの最小周波数ビン以下であり、サブバンドrの最大周波数ビンはサブバンドsの最小周波数ビン以下であり、サブバンドeの最大周波数ビンはサブバンドfの最小周波数ビン以下である。
現在の音声フレームの符号化率が閾値T1より小さいこと、
サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T2以下であること、
サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T3以下であること、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T4以上であること、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T5以上であること、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T6以上であること、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T7以上であること、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1の中に入ること、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8以下であること、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2の中に入ること、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9以下であること、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入ること、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの差の絶対値が閾値T10以下であること、または
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以上であること
のうち少なくとも1つを含む。
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より大きいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より小さいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より大きいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より小さいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より大きいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T64より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より小さいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T66より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69以下であること、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71以下であること、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73以下であること、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75以下であること、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77以下であること、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79以下であること、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81以下であること、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83以下であること
のうち1つを含む。
現在の音声フレームの符号化率が閾値T1以上であること、
サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T2より大きいこと、
サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T3より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T4より小さいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T5より小さいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T6より小さいこと、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T7より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らないこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らないこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3に入らないこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きいこと、または
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11より小さいこと
のうち少なくとも1つを含む。
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より小さいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より大きいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より小さいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より大きいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より小さいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T64より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より大きいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T66より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より小さいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69より大きいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71より大きいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73より大きいこと、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77より大きいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79より大きいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81より大きいこと、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83より大きいこと
のうち1つを含む。
閾値T2が2以上であること、
閾値T4が1/1.2以下であること、
間隔R1が[1/2.25、2.25]であること、
閾値T44が1/2.56以下であること、
閾値T45が1.5以上であること、
閾値T46が1/2.56以上であること、
閾値T47が1.5以下であること、
閾値T68が1.25以下であること、または
閾値T69が2以上であること
のうち少なくとも1つが満たされる。
サブバンドzの最大周波数ビンは臨界周波数ビンF1より大きく、サブバンドwの最大周波数ビンは臨界周波数ビンF1より大きく、サブバンドjの最大周波数ビンは臨界周波数ビンF2より大きく、サブバンドnの最大周波数ビンは臨界周波数ビンF2より大きく、臨界周波数ビンF1の値範囲は6.4kHz乃至12kHzであり、臨界周波数ビンF2の値範囲は4.8kHz乃至8kHzであり、
サブバンドiの最大周波数ビンはサブバンドjの最大周波数ビンより小さく、サブバンドmの最大周波数ビンはサブバンドnの最大周波数ビンより小さく、サブバンドxの最大周波数ビンはサブバンドyの最小周波数ビン以下であり、サブバンドpの最大周波数ビンはサブバンドqの最小周波数ビン以下であり、サブバンドrの最大周波数ビンはサブバンドsの最小周波数ビン以下であり、サブバンドeの最大周波数ビンはサブバンドfの最小周波数ビン以下である。
現在の音声フレームの符号化率が閾値T1より小さいこと、
サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T2以下であること、
サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T3以下であること、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T4以上であること、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T5以上であること、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T6以上であること、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T7以上であること、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1の中に入ること、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8以下であること、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2の中に入ること、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9以下であること、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入ること、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの差の絶対値が閾値T10以下であること、または
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以上であること
のうち少なくとも1つを含む。
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より大きいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より小さいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より大きいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より小さいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より大きいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T64より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より小さいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T66より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69以下であること、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71以下であること、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73以下であること、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75以下であること、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77以下であること、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79以下であること、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81以下であること、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83以下であること
のうち1つを含む。
現在の音声フレームの符号化率が閾値T1以上であること、
サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T2より大きいこと、
サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T3より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T4より小さいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T5より小さいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T6より小さいこと、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T7より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らないこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らないこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3に入らないこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きいこと、または
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11より小さいこと
のうち少なくとも1つを含む。
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より小さいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より大きいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より小さいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より大きいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より小さいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T64より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より大きいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T66より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より小さいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69より大きいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71より大きいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73より大きいこと、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77より大きいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79より大きいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81より大きいこと、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83より大きいこと
のうち1つを含む。
以下の条件、即ち、
閾値T2が2以上であること、
閾値T4が1/1.2以下であること、
間隔R1が[1/2.25、2.25]であること、
閾値T44が1/2.56以下であること、
閾値T45が1.5以上であること、
閾値T46が1/2.56以上であること、
閾値T47が1.5以下であること、
閾値T68が1.25以下であること、または
閾値T69が2以上であること
のうち少なくとも1つが満たされる。
現在の音声フレームの符号化率が閾値T1より小さいこと(閾値T1が、例えば、24.4kbps、32kbps、64kbps、または別の速度以上であってもよい)、
サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T2以下であること(閾値T2が、例えば、1、2、3、5、または別の値以上であってもよい)、
サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T3以下であること(閾値T3が、例えば、10、20、35、または別の値以上であってもよい)、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T4以上であること(閾値T4が、例えば、0.5、1、2、3、または別の値以上であってもよい)、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T5以上であること(閾値T5が、例えば、10、20、51、100、または別の値以上であってもよい)、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T6以上であること(閾値T6が、例えば、0.5、1.1、2、3、または別の値以上であってもよい)、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T7以上であること(閾値T7が、例えば、11、20、50、101、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1の中に入ること(間隔R1が例えば、[0.5、2]、[0.4、2.5]、または別の値であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8以下であること(閾値T8が、例えば、1、2、3、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2の中に入ること(間隔R2が、例えば、[0.5、2]、[0.4、2.5]、または別の値であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9以下であること(閾値T9が、例えば、10、20、35、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入ること(間隔R3が、例えば、[0.5、2]、[0.4、2.5]、または別の値であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの差の絶対値が閾値T10以下であること(閾値T10が、例えば、11、20、50、101、または別の値以上であってもよい)、または
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以上であること(閾値T11が、例えば、0.5、0.8、0.9、1、または別の値であってもよい)
のうち少なくとも1つを含んでもよい。
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T12以上であること(閾値T12が、例えば、閾値T4以上であってもよく、閾値T12が、例えば、2、3、5、8、または別の値以上であってもよい)、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T13以上であること(閾値T13が、例えば、閾値T6以上であってもよく、閾値T13が、例えば、2、3、9、7、または別の値以上であってもよい)、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T14以下であること(閾値T14が、例えば、閾値T2以下であってもよく、閾値T14が、例えば、0.5、2、3、1.5、4、または別の値以下であってもよい)、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T15以下であること(閾値T15が、例えば、閾値T3以下であってもよく、閾値T15が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T16以上であること(閾値T16が、例えば、閾値T4以上であってもよく、閾値T16が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T17以上であること(閾値T17が例えば、閾値T6以上であってもよく、閾値T17が例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T18以下であること(閾値T18が、例えば、閾値T2以下であってもよく、閾値T18が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T19以下であること(閾値T19が、例えば、閾値T3以下であってもよく、閾値T19が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T20以上であること(閾値T20が、例えば、閾値T4以上であってもよく、閾値T20が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との間の差の絶対値が閾値T8より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T21以上であること(閾値T21が、例えば、閾値T6以上であってもよく、閾値T21が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との間の差の絶対値が閾値T8より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T22以下であること(閾値T22が、例えば、閾値T2以下であってもよく、閾値T22が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T23以下であること(閾値T23が、例えば、閾値T3以下であってもよく、閾値T23が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T24以上であること(閾値T24が、例えば、閾値T4以上であってもよく、閾値T24が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T25以上であること(閾値T25が、例えば、閾値T6以上であってもよく、閾値T25が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T26以下であること(閾値T26が、例えば、閾値T2以下であってもよく、閾値T26が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T27以下であること(閾値T27が、例えば、閾値T3以下であってもよく、閾値T27が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T28以上であること(閾値T28が、例えば、閾値T4以上であってもよく、閾値T28が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T29以上であること(閾値T29が、例えば、閾値T6以上であってもよく、閾値T29が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T30以下であること(閾値T30が、例えば、閾値T2以下であってもよく、閾値T30が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との間の差の絶対値が閾値T9より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T31以下であること(閾値T31が、例えば、閾値T3以下であってもよく、閾値T31が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T32以上であること(閾値T32が、例えば、閾値T4以上であってもよく、閾値T32が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T33以上であること(閾値T33が、例えば、閾値T6以上であってもよく、閾値T33が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T34以下であること(閾値T34が、例えば、閾値T2以下であってもよく、閾値T34が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T35以下であること(閾値T35が、例えば、閾値T3以下であってもよく、閾値T35が、例えば、5、8、9.5、10、15、20、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T36以上であること(閾値T36が、例えば、閾値T4以上であってもよく、閾値T36が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T37以上であること(閾値T37が、例えば、閾値T6以上であってもよく、閾値T37が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T38以下であること(閾値T38が、例えば、閾値T2以下であってもよく、閾値T38が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T39以下であること(閾値T39が、例えば、閾値T3以下であってもよく、閾値T39が、例えば、5、8、9.5、10、15、20、または別の値以下であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T40以上であること(閾値T40が、例えば、閾値T4以上であってもよく、閾値T40が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T41以上であること(閾値T41が例えば、閾値T6以上であってもよく、閾値T41が例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T42以下であること(閾値T42が、例えば、閾値T2以下であってもよく、閾値T42が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T43以下であること(閾値T43が、例えば、閾値T3以下であってもよく、閾値T43が、例えば、5、8、9.5、10、15、20、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく(閾値T44の値範囲が、例えば、1.5乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より小さいこと(閾値T45の値範囲が、例えば、1乃至3であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく(閾値T46の値範囲が、例えば、1.5乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より大きいこと(閾値T47の値範囲が、例えば、1乃至3であってもよい)、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく(閾値T48の値範囲が、例えば、−1乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より小さいこと(閾値T49の値範囲が、例えば、1乃至3であってもよい)、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく(閾値T50の値範囲が、例えば、−1乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より大きいこと(閾値T51の値範囲が、例えば、1乃至3であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく(閾値T52の値範囲が、例えば、1乃至3であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より小さいこと(閾値T53が、例えば、10、20、30、または別の値であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく(閾値T54の値範囲が、例えば、1乃至3であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より大きいこと(閾値T55が、例えば、10、20、30、または別の値であってもよい)、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく(閾値T54の値範囲が、例えば、−40乃至40であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より小さいこと(閾値T57が、例えば、10、20、30、または別の値であってもよい)、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく(閾値T58の値範囲が、例えば、−40乃至40であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より大きいこと(閾値T59が、例えば、10、20、30、または別の値であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく(閾値T60の値範囲が、例えば、1乃至3であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より小さいこと(閾値T61が、例えば、10、20、30、または別の値であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく(閾値T62の値範囲が、例えば、1乃至3であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より大きいこと(閾値T63が、例えば、10、20、30、または別の値であってもよい)、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープからサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープを引いた差が閾値T64より小さく(閾値T64の値範囲が、例えば、−40乃至40であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より小さいこと(閾値T65が、例えば、10、20、30、または別の値であってもよい)、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープからサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープを引いた差が閾値T66より大きく(閾値T66の値範囲が、例えば、−40乃至40であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より大きいこと(閾値T67が、例えば、10、20、30、または別の値であってもよい)、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり(閾値T68が、例えば、0.5、1、2、3、または別の値以下であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69以下であること(閾値T2が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり(閾値T70が、例えば、10、20、51、100、または別の値以下であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71以下であること(閾値T71が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり(閾値T72が、例えば、0.5、1.1、2、3、または別の値以上であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73以下であること(閾値T73が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり(閾値T74が、例えば、11、20、50、101、または別の値以上であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75以下であること(閾値T75が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり(閾値T76が、例えば、0.5、1、2、3、または別の値以下であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77以下であること(閾値T77が、例えば、10、20、35、または別の値以上であってもよい)、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり(閾値T78が、例えば、10、20、51、100、または別の値以下であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79以下であること(閾値T79が、例えば、10、20、35、または別の値以上であってもよい)、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり(閾値T80が、例えば、0.5、1.1、2、3、または別の値以上であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81以下であること(閾値T81が、例えば、10、20、35、または別の値以上であってもよい)、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり(閾値T82が、例えば、11、20、50、101、または別の値以上であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83以下であること(閾値T83が、例えば、10、20、35、または別の値以上であってもよい)
のうち1つを含んでもよい。
現在の音声フレームの符号化率が閾値T1以上であること、
サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T2より大きいこと、
サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T3より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T4より小さいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T5より小さいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T6より小さいこと、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T7より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らないこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らないこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3に入らないこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きいこと、または
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11より小さいこと
のうち少なくとも1つを含む。
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T12より小さいこと、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T13より小さいこと、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T14より大きいこと、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T15より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T16より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T17より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T18より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T19より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T20より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T21より小さいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T22より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T23より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T24より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T25より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T26より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T27より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T28より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T29より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T30より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T31より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T32より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T33より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T34より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T35より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T36より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T37より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T38より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T39より大きいこと、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T40より小さいこと、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T41より小さいこと、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T42より大きいこと、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T43より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より大きいこと、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より小さいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より大きいこと、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より小さいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より大きいこと、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より小さいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より大きいこと、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より小さいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より大きいこと、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より小さいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T64より小さく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より大きいこと、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープから引いた差が閾値T66より大きく、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より小さいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69より大きいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71より大きいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73より大きいこと、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75より大きいこと、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77より大きいこと、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79より大きいこと、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81より大きいこと、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83より大きいこと
のうち1つを含む。
910 時間周波数変換ユニット
920 取得ユニット
930 符号化ユニット
1000 音声符号化器
1001 プロセッサ
1003 ユーザ・インタフェース
1004 ネットワーク・インタフェース
1005 メモリ
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T12以上であること(閾値T12が、例えば、閾値T4以上であってもよく、閾値T12が、例えば、2、3、5、8、または別の値以上であってもよい)、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T13以上であること(閾値T13が、例えば、閾値T6以上であってもよく、閾値T13が、例えば、2、3、9、7、または別の値以上であってもよい)、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T14以下であること(閾値T14が、例えば、閾値T2以下であってもよく、閾値T14が、例えば、0.5、2、3、1.5、4、または別の値以下であってもよい)、
現在の音声フレームの符号化率が閾値T1以上であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T15以下であること(閾値T15が、例えば、閾値T3以下であってもよく、閾値T15が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T16以上であること(閾値T16が、例えば、閾値T4以上であってもよく、閾値T16が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T17以上であること(閾値T17が例えば、閾値T6以上であってもよく、閾値T17が例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T18以下であること(閾値T18が、例えば、閾値T2以下であってもよく、閾値T18が、例えば、以下0.5、2、3、1.5、4、5、または別の値であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との比が間隔R1に入らず、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T19以下であること(閾値T19が、例えば、閾値T3以下であってもよく、閾値T19が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T20以上であること(閾値T20が、例えば、閾値T4以上であってもよく、閾値T20が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との間の差の絶対値が閾値T8より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T21以上であること(閾値T21が、例えば、閾値T6以上であってもよく、閾値T21が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との間の差の絶対値が閾値T8より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T22以下であること(閾値T22が、例えば、閾値T2以下であってもよく、閾値T22が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比とサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比との差の絶対値が閾値T8より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T23以下であること(閾値T23が、例えば、閾値T3以下であってもよく、閾値T23が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T24以上であること(閾値T24が、例えば、閾値T4以上であってもよく、閾値T24が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T25以上であること(閾値T25が、例えば、閾値T6以上であってもよく、閾値T25が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T26以下であること(閾値T26が、例えば、閾値T2以下であってもよく、閾値T26が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との比が間隔R2に入らず、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T27以下であること(閾値T27が、例えば、閾値T3以下であってもよく、閾値T27が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T28以上であること(閾値T28が、例えば、閾値T4以上であってもよく、閾値T28が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T29以上であること(閾値T29が、例えば、閾値T6以上であってもよく、閾値T29が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との差の絶対値が閾値T9より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T30以下であること(閾値T30が、例えば、閾値T2以下であってもよく、閾値T30が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差とサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差との間の差の絶対値が閾値T9より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T31以下であること(閾値T31が、例えば、閾値T3以下であってもよく、閾値T31が、例えば、5、8、10、20、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T32以上であること(閾値T32が、例えば、閾値T4以上であってもよく、閾値T32が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T33以上であること(閾値T33が、例えば、閾値T6以上であってもよく、閾値T33が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T34以下であること(閾値T34が、例えば、閾値T2以下であってもよく、閾値T34が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの比が間隔R3の中に入り、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T35以下であること(閾値T35が、例えば、閾値T3以下であってもよく、閾値T35が、例えば、5、8、9.5、10、15、20、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T36以上であること(閾値T36が、例えば、閾値T4以上であってもよく、閾値T36が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T37以上であること(閾値T37が、例えば、閾値T6以上であってもよく、閾値T37が、例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T38以下であること(閾値T38が、例えば、閾値T2以下であってもよく、閾値T38が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープとサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープとの間の差の絶対値が閾値T10より大きく、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T39以下であること(閾値T39が、例えば、閾値T3以下であってもよく、閾値T39が、例えば、5、8、9.5、10、15、20、または別の値以下であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T40以上であること(閾値T40が、例えば、閾値T4以上であってもよく、閾値T40が、例えば、2、3、5、8、または別の値以上であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T41以上であること(閾値T41が例えば、閾値T6以上であってもよく、閾値T41が例えば、2、3、9、7、または別の値以上であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T42以下であること(閾値T42が、例えば、閾値T2以下であってもよく、閾値T42が、例えば、0.5、2、3、1.5、4、5、または別の値以下であってもよい)、
サブバンドp内に配置された現在の音声フレームのスペクトル係数とサブバンドq内に配置された現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値が閾値T11以下であり、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T43以下であること(閾値T43が、例えば、閾値T3以下であってもよく、閾値T43が、例えば、5、8、9.5、10、15、20、または別の値以下であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T44より小さく(閾値T44の値範囲が、例えば、1.5乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T45より小さいこと(閾値T45の値範囲が、例えば、1乃至3であってもよい)、
サブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比で除した商が閾値T46より大きく(閾値T46の値範囲が、例えば、1.5乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T47より大きいこと(閾値T47の値範囲が、例えば、1乃至3であってもよい)、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T48より小さく(閾値T48の値範囲が、例えば、−1乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T49より小さいこと(閾値T49の値範囲が、例えば、1乃至3であってもよい)、
サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比をサブバンドx内に配置された現在の音声フレームのスペクトル係数のピーク対平均比から引いた差が閾値T50より大きく(閾値T50の値範囲が、例えば、−1乃至3であってもよい)、サブバンドy内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T51より大きいこと(閾値T51の値範囲が、例えば、1乃至3であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T52より小さく(閾値T52の値範囲が、例えば、1乃至3であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T53より小さいこと(閾値T53が、例えば、10、20、30、または別の値であってもよい)、
サブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差で除した商が閾値T54より大きく(閾値T54の値範囲が、例えば、1乃至3であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T55より大きいこと(閾値T55が、例えば、10、20、30、または別の値であってもよい)、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T56より小さく(閾値T56の値範囲が、例えば、−40乃至40であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T57より小さいこと(閾値T57が、例えば、10、20、30、または別の値であってもよい)、
サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差をサブバンドr内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差から引いた差が閾値T58より大きく(閾値T58の値範囲が、例えば、−40乃至40であってもよい)、サブバンドs内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T59より大きいこと(閾値T59が、例えば、10、20、30、または別の値であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T60より小さく(閾値T60の値範囲が、例えば、1乃至3であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T61より小さいこと(閾値T61が、例えば、10、20、30、または別の値であってもよい)、
サブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープをサブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープで除した商が閾値T62より大きく(閾値T62の値範囲が、例えば、1乃至3であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T63より大きいこと(閾値T63が、例えば、10、20、30、または別の値であってもよい)、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープからサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープを引いた差が閾値T64より小さく(閾値T64の値範囲が、例えば、−40乃至40であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T65より小さいこと(閾値T65が、例えば、10、20、30、または別の値であってもよい)、
サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープからサブバンドe内に配置された現在の音声フレームのスペクトル係数のエンベロープを引いた差が閾値T66より大きく(閾値T66の値範囲が、例えば、−40乃至40であってもよい)、サブバンドf内に配置された現在の音声フレームのスペクトル係数のエンベロープが閾値T67より大きいこと(閾値T67が、例えば、10、20、30、または別の値であってもよい)、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T68以下であり(閾値T68が、例えば、0.5、1、2、3、または別の値以下であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T69以下であること(閾値T69が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T70以下であり(閾値T70が、例えば、10、20、51、100、または別の値以下であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T71以下であること(閾値T71が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T72以下であり(閾値T72が、例えば、0.5、1.1、2、3、または別の値以上であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T73以下であること(閾値T73が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T74以下であり(閾値T74が、例えば、11、20、50、101、または別の値以上であってもよい)、サブバンドz内に配置された現在の音声フレームのスペクトル係数のピーク対平均比が閾値T75以下であること(閾値T75が、例えば、1、2、3、5、または別の値以下であってもよい)、
サブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均で除した商が閾値T76以下であり(閾値T76が、例えば、0.5、1、2、3、または別の値以下であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T77以下であること(閾値T77が、例えば、10、20、35、または別の値以上であってもよい)、
サブバンドj内に配置された現在の音声フレームのスペクトル係数のエネルギ平均をサブバンドi内に配置された現在の音声フレームのスペクトル係数のエネルギ平均から引いた差が閾値T78以下であり(閾値T78が、例えば、10、20、51、100、または別の値以下であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T79以下であること(閾値T79が、例えば、10、20、35、または別の値以上であってもよい)、
サブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均で除した商が閾値T80以下であり(閾値T80が、例えば、0.5、1.1、2、3、または別の値以上であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T81以下であること(閾値T81が、例えば、10、20、35、または別の値以上であってもよい)、または
サブバンドn内に配置された現在の音声フレームのスペクトル係数の振幅平均をサブバンドm内に配置された現在の音声フレームのスペクトル係数の振幅平均から引いた差が閾値T82以下であり(閾値T82が、例えば、11、20、50、101、または別の値以上であってもよい)、サブバンドw内に配置された現在の音声フレームのスペクトル係数のエンベロープ偏差が閾値T83以下であること(閾値T83が、例えば、10、20、35、または別の値以上であってもよい)
のうち1つを含んでもよい。
Claims (16)
- 時間周波数変換処理を現在の音声フレームの時間領域信号に実施して、前記現在の音声フレームのスペクトル係数を取得するステップと、
前記現在の音声フレームの基準符号化パラメータを取得するステップと、
前記現在の音声フレームの前記取得された基準符号化パラメータが第1のパラメータ条件を満たす場合、前記現在の音声フレームの前記スペクトル係数を変換符号化励起アルゴリズムに基づいて符号化するか、または、前記現在の音声フレームの前記取得された基準符号化パラメータが第2のパラメータ条件を満たす場合、前記現在の音声フレームの前記スペクトル係数を高品質変換符号化アルゴリズムに基づいて符号化するステップと、
を含む、音声符号化方法。 - 前記基準符号化パラメータは以下のパラメータ、即ち、前記現在の音声フレームの符号化率、サブバンドz内に配置された前記現在の音声フレームのスペクトル係数のピーク対平均比、サブバンドw内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ偏差、サブバンドi内に配置された前記現在の音声フレームのスペクトル係数のエネルギ平均およびサブバンドj内に配置された前記現在の音声フレームのスペクトル係数のエネルギ平均、サブバンドm内に配置された前記現在の音声フレームのスペクトル係数の振幅平均およびサブバンドn内に配置された前記現在の音声フレームのスペクトル係数の振幅平均、サブバンドx内に配置された前記現在の音声フレームのスペクトル係数のピーク対平均比およびサブバンドy内に配置された前記現在の音声フレームのスペクトル係数のピーク対平均比、サブバンドr内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ偏差およびサブバンドs内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ偏差、サブバンドe内に配置された前記現在の音声フレームのスペクトル係数のエンベロープおよびサブバンドf内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ、またはサブバンドp内に配置された前記現在の音声フレームのスペクトル係数とサブバンドq内に配置された前記現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値のうち少なくとも1つを含み、
前記サブバンドzの最大周波数ビンは臨界周波数ビンF1より大きく、前記サブバンドwの最大周波数ビンは前記臨界周波数ビンF1より大きく、前記サブバンドjの最大周波数ビンは臨界周波数ビンF2より大きく、前記サブバンドnの最大周波数ビンは前記臨界周波数ビンF2より大きく、
前記臨界周波数ビンF1の値範囲は6.4kHz乃至12kHzであり、
前記臨界周波数ビンF2の値範囲は4.8kHz乃至8kHzであり、
前記サブバンドiの最大周波数ビンは前記サブバンドjの前記最大周波数ビンより小さく、前記サブバンドmの最大周波数ビンは前記サブバンドnの前記最大周波数ビンより小さく、前記サブバンドxの最大周波数ビンは前記サブバンドyの最小周波数ビン以下であり、前記サブバンドpの最大周波数ビンは前記サブバンドqの最小周波数ビン以下であり、前記サブバンドrの最大周波数ビンは前記サブバンドsの最小周波数ビン以下であり、前記サブバンドeの最大周波数ビンは前記サブバンドfの最小周波数ビン以下である、
請求項1に記載の方法。 - 以下の条件、即ち、前記サブバンドwの最小周波数ビンが前記臨界周波数ビンF1以上であること、前記サブバンドzの最小周波数ビンが前記臨界周波数ビンF1以上であること、前記サブバンドiの前記最大周波数ビンが前記サブバンドjの最小周波数ビン以下であること、前記サブバンドmの前記最大周波数ビンが前記サブバンドnの最小周波数ビン以下であること、前記サブバンドjの最小周波数ビンが前記臨界周波数ビンF2より大きいこと、または前記サブバンドnの最小周波数ビンが前記臨界周波数ビンF2より大きいことのうち少なくとも1つが満たされる、請求項2に記載の方法。
- 前記第1のパラメータ条件は以下の条件、即ち、
前記現在の音声フレームの前記符号化率が閾値T1より小さいこと、
前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T2以下であること、
前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T3以下であること、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した商が閾値T4以上であること、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた差が閾値T5以上であること、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した商が閾値T6以上であること、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた差が閾値T7以上であること、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との比が間隔R1の中に入ること、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との差の絶対値が閾値T8以下であること、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との比が間隔R2の中に入ること、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との差の絶対値が閾値T9以下であること、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの比が間隔R3の中に入ること、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの差の絶対値が閾値T10以下であること、または
前記サブバンドp内に配置された前記現在の音声フレームの前記スペクトル係数と前記サブバンドq内に配置された前記現在の音声フレームの前記スペクトル係数との間のスペクトル相関の前記パラメータ値が閾値T11以上であること
のうち少なくとも1つを含む、請求項2または3に記載の方法。 - 前記第1のパラメータ条件は以下の条件、即ち、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した商が閾値T44より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T45より小さいこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した商が閾値T46より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T47より大きいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた差が閾値T48より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T49より小さいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた差が閾値T50より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T51より大きいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した商が閾値T52より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T53より小さいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した商が閾値T54より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T55より大きいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた差が閾値T56より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T57より小さいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた差が閾値T58より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T59より大きいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した商が閾値T60より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T61より小さいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した商が閾値T62より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T63より大きいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた差が閾値T64より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T65より小さいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた差が閾値T66より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T67より大きいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商が閾値T68以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T69以下であること、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差が閾値T70以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T71以下であること、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商が閾値T72以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T73以下であること、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差が閾値T74以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T75以下であること、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商が閾値T76以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T77以下であること、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差が閾値T78以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T79以下であること、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商が閾値T80以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T81以下であること、または
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差が閾値T82以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T83以下であること
のうち1つを含む、請求項2乃至4の何れか1項に記載の方法。 - 前記第2のパラメータ条件は以下の条件、即ち、
前記現在の音声フレームの前記符号化率は前記閾値T1以上であること、
前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T2より大きいこと、
前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T3より大きいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商は前記閾値T4より小さいこと、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差は前記閾値T5より小さいこと、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商は前記閾値T6より小さいこと、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差は前記閾値T7より小さいこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との前記比は前記間隔R1に入らないこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との前記差の前記絶対値は前記閾値T8より大きいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との前記比は前記間隔R2に入らないこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との間の前記差の前記絶対値は前記閾値T9より大きいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの前記比は前記間隔R3に入らないこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの間の前記差の前記絶対値は前記閾値T10より大きいこと、または
前記サブバンドp内に配置された前記現在の音声フレームの前記スペクトル係数と前記サブバンドq内に配置された前記現在の音声フレームの前記スペクトル係数との間のスペクトル相関の前記パラメータ値は前記閾値T11より小さいこと
のうち少なくとも1つを含む、請求項2乃至5の何れか1項に記載の方法。 - 前記第2のパラメータ条件は以下の条件、即ち、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した前記商は前記閾値T44より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T45より大きいこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した前記商は前記閾値T46より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T47より小さいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた前記差は前記閾値T48より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T49より大きいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた前記差は前記閾値T50より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T51より小さいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した前記商は前記閾値T52より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T53より大きいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した前記商は前記閾値T54より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T55より小さいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた前記差は前記閾値T56より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T57より大きいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた前記差は前記閾値T58より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T59より小さいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した前記商は前記閾値T60より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T61より大きいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した前記商は前記閾値T62より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T63より小さいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた前記差は前記閾値T64より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T65より大きいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた前記差は前記閾値T66より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T67より小さいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商は前記閾値T68以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T69より大きいこと、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差は前記閾値T70以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T71より大きいこと、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商は前記閾値T72以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T73より大きいこと、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差は前記閾値T74以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T75より大きいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商は前記閾値T76以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T77より大きいこと、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差は前記閾値T78以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T79より大きいこと、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商は前記閾値T80以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T81より大きいこと、または
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差は前記閾値T82以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T83より大きいこと
のうち1つを含む、請求項2乃至6の何れか1項に記載の方法。 - 以下の条件、即ち、
前記閾値T2が2以上であること、
前記閾値T4が1/1.2以下であること、
前記間隔R1が[1/2.25、2.25]であること、
前記閾値T44が1/2.56以下であること、
前記閾値T45が1.5以上であること、
前記閾値T46が1/2.56以上であること、
前記閾値T47が1.5以下であること、
前記閾値T68が1.25以下であること、または
前記閾値T69が2以上であること
のうち少なくとも1つが満たされる、請求項4乃至7の何れか1項に記載の方法。 - 時間周波数変換処理を現在の音声フレームの時間領域信号に実施して、前記現在の音声フレームのスペクトル係数を取得するように構成された時間周波数変換ユニットと、
前記現在の音声フレームの基準符号化パラメータを取得するように構成された取得ユニットと、
前記取得ユニットにより取得された前記現在の音声フレームの前記基準符号化パラメータが第1のパラメータ条件を満たす場合、前記現在の音声フレームの前記スペクトル係数を変換符号化励起アルゴリズムに基づいて符号化するか、または、前記取得ユニットにより取得された前記現在の音声フレームの前記基準符号化パラメータが第2のパラメータ条件を満たす場合、前記現在の音声フレームの前記スペクトル係数を高品質変換符号化アルゴリズムに基づいて符号化するように構成された符号化ユニットと、
を備える、音声符号化器。 - 前記基準符号化パラメータは以下のパラメータ、即ち、前記現在の音声フレームの符号化率、サブバンドz内に配置された前記現在の音声フレームのスペクトル係数のピーク対平均比、サブバンドw内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ偏差、サブバンドi内に配置された前記現在の音声フレームのスペクトル係数のエネルギ平均およびサブバンドj内に配置された前記現在の音声フレームのスペクトル係数のエネルギ平均、サブバンドm内に配置された前記現在の音声フレームのスペクトル係数の振幅平均およびサブバンドn内に配置された前記現在の音声フレームのスペクトル係数の振幅平均、サブバンドx内に配置された前記現在の音声フレームのスペクトル係数のピーク対平均比およびサブバンドy内に配置された前記現在の音声フレームのスペクトル係数のピーク対平均比、サブバンドe内に配置された前記現在の音声フレームのスペクトル係数のエンベロープおよびサブバンドf内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ、サブバンドp内に配置された前記現在の音声フレームのスペクトル係数とサブバンドq内に配置された前記現在の音声フレームのスペクトル係数との間のスペクトル相関のパラメータ値、またはサブバンドr内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ偏差およびサブバンドs内に配置された前記現在の音声フレームのスペクトル係数のエンベロープ偏差のうち少なくとも1つを含み、
前記サブバンドzの最大周波数ビンは臨界周波数ビンF1より大きく、前記サブバンドwの最大周波数ビンは前記臨界周波数ビンF1より大きく、前記サブバンドjの最大周波数ビンは臨界周波数ビンF2より大きく、前記サブバンドnの最大周波数ビンは前記臨界周波数ビンF2より大きく、
前記臨界周波数ビンF1の値範囲は6.4kHz乃至12kHzであり、
前記臨界周波数ビンF2の値範囲は4.8kHz乃至8kHzであり、
前記サブバンドiの最大周波数ビンは前記サブバンドjの前記最大周波数ビンより小さく、前記サブバンドmの最大周波数ビンは前記サブバンドnの前記最大周波数ビンより小さく、前記サブバンドxの最大周波数ビンは前記サブバンドyの最小周波数ビン以下であり、前記サブバンドpの最大周波数ビンは前記サブバンドqの最小周波数ビン以下であり、前記サブバンドrの最大周波数ビンは前記サブバンドsの最小周波数ビン以下であり、前記サブバンドeの最大周波数ビンは前記サブバンドfの最小周波数ビン以下である、
請求項9に記載の音声符号化器。 - 以下の条件、即ち、前記サブバンドwの最小周波数ビンが前記臨界周波数ビンF1以上であること、前記サブバンドzの最小周波数ビンが前記臨界周波数ビンF1以上であること、前記サブバンドiの前記最大周波数ビンが前記サブバンドjの最小周波数ビン以下であること、前記サブバンドmの前記最大周波数ビンが前記サブバンドnの最小周波数ビン以下であること、前記サブバンドjの最小周波数ビンが前記臨界周波数ビンF2より大きいこと、または前記サブバンドnの最小周波数ビンが前記臨界周波数ビンF2より大きいことのうち少なくとも1つが満たされる、請求項10に記載の音声符号化器。
- 前記第1のパラメータ条件は以下の条件、即ち、
前記現在の音声フレームの前記符号化率が閾値T1より小さいこと、
前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T2以下であること、
前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T3以下であること、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した商が閾値T4以上であること、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた差が閾値T5以上であること、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した商が閾値T6以上であること、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた差が閾値T7以上であること、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との比が間隔R1の中に入ること、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との差の絶対値が閾値T8以下であること、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との比が間隔R2の中に入ること、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との差の絶対値が閾値T9以下であること、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの比が間隔R3の中に入ること、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの差の絶対値が閾値T10以下であること、または
前記サブバンドp内に配置された前記現在の音声フレームの前記スペクトル係数と前記サブバンドq内に配置された前記現在の音声フレームの前記スペクトル係数との間のスペクトル相関の前記パラメータ値が閾値T11以上であること
のうち少なくとも1つを含む、請求項10または11に記載の音声符号化器。 - 前記第1のパラメータ条件は以下の条件、即ち、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した商が閾値T44より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T45より小さいこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した商が閾値T46より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T47より大きいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた差が閾値T48より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T49より小さいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた差が閾値T50より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T51より大きいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した商が閾値T52より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T53より小さいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した商が閾値T54より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T55より大きいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた差が閾値T56より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T57より小さいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた差が閾値T58より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T59より大きいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した商が閾値T60より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T61より小さいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した商が閾値T62より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T63より大きいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた差が閾値T64より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T65より小さいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた差が閾値T66より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープが閾値T67より大きいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商が閾値T68以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T69以下であること、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差が閾値T70以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T71以下であること、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商が閾値T72以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T73以下であること、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差が閾値T74以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比が閾値T75以下であること、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商が閾値T76以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T77以下であること、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差が閾値T78以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T79以下であること、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商が閾値T80以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T81以下であること、または
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差が閾値T82以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差が閾値T83以下であること
のうち1つを含む、請求項10乃至12の何れか1項に記載の音声符号化器。 - 前記第2のパラメータ条件は以下の条件、即ち、
前記現在の音声フレームの前記符号化率は前記閾値T1以上であること、
前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T2より大きいこと、
前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T3より大きいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商は前記閾値T4より小さいこと、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差は前記閾値T5より小さいこと、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商は前記閾値T6より小さいこと、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差は前記閾値T7より小さいこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との前記比は前記間隔R1に入らないこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比と前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比との前記差の前記絶対値は前記閾値T8より大きいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との前記比は前記間隔R2に入らないこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差と前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差との間の前記差の前記絶対値は前記閾値T9より大きいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの前記比は前記間隔R3に入らないこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープと前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープとの間の前記差の前記絶対値は前記閾値T10より大きいこと、または
前記サブバンドp内に配置された前記現在の音声フレームの前記スペクトル係数と前記サブバンドq内に配置された前記現在の音声フレームの前記スペクトル係数との間のスペクトル相関の前記パラメータ値は前記閾値T11より小さいこと
のうち少なくとも1つを含む、請求項10乃至13の何れか1項に記載の音声符号化器。 - 前記第2のパラメータ条件は以下の条件、即ち、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した前記商は前記閾値T44より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T45より大きいこと、
前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比で除した前記商は前記閾値T46より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T47より小さいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた前記差は前記閾値T48より小さく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T49より大きいこと、
前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比を前記サブバンドx内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比から引いた前記差は前記閾値T50より大きく、前記サブバンドy内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T51より小さいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した前記商は前記閾値T52より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T53より大きいこと、
前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差で除した前記商は前記閾値T54より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T55より小さいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた前記差は前記閾値T56より小さく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T57より大きいこと、
前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差を前記サブバンドr内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差から引いた前記差は前記閾値T58より大きく、前記サブバンドs内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T59より小さいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した前記商は前記閾値T60より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T61より大きいこと、
前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープで除した前記商は前記閾値T62より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T63より小さいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた前記差は前記閾値T64より小さく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T65より大きいこと、
前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープを前記サブバンドe内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープから引いた前記差は前記閾値T66より大きく、前記サブバンドf内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープは前記閾値T67より小さいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商は前記閾値T68以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T69より大きいこと、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差は前記閾値T70以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T71より大きいこと、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商は前記閾値T72以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T73より大きいこと、
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差は前記閾値T74以下であり、前記サブバンドz内に配置された前記現在の音声フレームの前記スペクトル係数の前記ピーク対平均比は前記閾値T75より大きいこと、
前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均で除した前記商は前記閾値T76以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T77より大きいこと、
前記サブバンドj内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均を前記サブバンドi内に配置された前記現在の音声フレームの前記スペクトル係数の前記エネルギ平均から引いた前記差は前記閾値T78以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T79より大きいこと、
前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均で除した前記商は前記閾値T80以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T81より大きいこと、または
前記サブバンドn内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均を前記サブバンドm内に配置された前記現在の音声フレームの前記スペクトル係数の前記振幅平均から引いた前記差は前記閾値T82以下であり、前記サブバンドw内に配置された前記現在の音声フレームの前記スペクトル係数の前記エンベロープ偏差は前記閾値T83より大きいこと
のうち1つを含む、請求項10乃至14の何れか1項に記載の音声符号化器。 - 以下の条件、即ち、
前記閾値T2が2以上であること、
前記閾値T4が1/1.2以下であること、
前記間隔R1が[1/2.25、2.25]であること、
前記閾値T44が1/2.56以下であること、
前記閾値T45が1.5以上であること、
前記閾値T46が1/2.56以上であること、
前記閾値T47が1.5以下であること、
前記閾値T68が1.25以下であること、または
前記閾値T69が2以上であること
のうち少なくとも1つが満たされる、請求項12乃至15の何れか1項に記載の音声符号化器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410363905.5A CN104143335B (zh) | 2014-07-28 | 2014-07-28 | 音频编码方法及相关装置 |
CN201410363905.5 | 2014-07-28 | ||
PCT/CN2015/075645 WO2016015485A1 (zh) | 2014-07-28 | 2015-04-01 | 音频编码方法及相关装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019106061A Division JP6888051B2 (ja) | 2014-07-28 | 2019-06-06 | 音声符号化方法および関連装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017522608A true JP2017522608A (ja) | 2017-08-10 |
JP6538822B2 JP6538822B2 (ja) | 2019-07-03 |
Family
ID=51852493
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017505140A Active JP6538822B2 (ja) | 2014-07-28 | 2015-04-01 | 音声符号化方法および関連装置 |
JP2019106061A Active JP6888051B2 (ja) | 2014-07-28 | 2019-06-06 | 音声符号化方法および関連装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019106061A Active JP6888051B2 (ja) | 2014-07-28 | 2019-06-06 | 音声符号化方法および関連装置 |
Country Status (15)
Country | Link |
---|---|
US (4) | US10056089B2 (ja) |
EP (2) | EP3157010B1 (ja) |
JP (2) | JP6538822B2 (ja) |
KR (2) | KR101947127B1 (ja) |
CN (2) | CN106448688B (ja) |
AU (2) | AU2015296447B2 (ja) |
BR (1) | BR112016029904B1 (ja) |
CA (3) | CA3058990A1 (ja) |
ES (2) | ES2814154T3 (ja) |
MX (1) | MX360606B (ja) |
MY (1) | MY174461A (ja) |
PL (1) | PL3790007T3 (ja) |
RU (1) | RU2670790C9 (ja) |
SG (2) | SG10201805102PA (ja) |
WO (1) | WO2016015485A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106448688B (zh) | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
US20220254331A1 (en) * | 2021-02-05 | 2022-08-11 | Cambium Assessment, Inc. | Neural network and method for machine learning assisted speech recognition |
CN112767956B (zh) * | 2021-04-09 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 音频编码方法、装置、计算机设备及介质 |
EP4364137A1 (en) * | 2021-06-29 | 2024-05-08 | Telefonaktiebolaget LM Ericsson (publ) | Spectrum classifier for audio coding mode selection |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3364825B2 (ja) * | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6704705B1 (en) * | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
US6721280B1 (en) * | 2000-04-19 | 2004-04-13 | Qualcomm Incorporated | Method and apparatus for voice latency reduction in a voice-over-data wireless communication system |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
AU2002318813B2 (en) * | 2001-07-13 | 2004-04-29 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
CN1308913C (zh) * | 2002-04-11 | 2007-04-04 | 松下电器产业株式会社 | 编码设备、解码设备及其方法 |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
US7333930B2 (en) | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
GB0408856D0 (en) * | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
CN101184979B (zh) * | 2005-04-01 | 2012-04-25 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
WO2007083934A1 (en) | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
CN101496099B (zh) * | 2006-07-31 | 2012-07-18 | 高通股份有限公司 | 用于对有效帧进行宽带编码和解码的系统、方法和设备 |
CN101145345B (zh) * | 2006-09-13 | 2011-02-09 | 华为技术有限公司 | 音频分类方法 |
CN101145343B (zh) * | 2006-09-15 | 2011-07-20 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
KR101411901B1 (ko) * | 2007-06-12 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
US20090319261A1 (en) | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
WO2010003563A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
CN102089816B (zh) | 2008-07-11 | 2013-01-30 | 弗朗霍夫应用科学研究促进协会 | 音频信号合成器及音频信号编码器 |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2304723B1 (en) * | 2008-07-11 | 2012-10-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for decoding an encoded audio signal |
TWI520128B (zh) * | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
US8498874B2 (en) | 2009-09-11 | 2013-07-30 | Sling Media Pvt Ltd | Audio signal encoding employing interchannel and temporal redundancy reduction |
KR101425290B1 (ko) * | 2009-10-08 | 2014-08-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 멀티-모드 오디오 신호 디코더, 멀티-모드 오디오 신호 인코더 및 선형-예측-코딩 기반의 노이즈 성형을 사용하는 방법 및 컴퓨터 프로그램 |
RU2586841C2 (ru) * | 2009-10-20 | 2016-06-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Многорежимный аудио кодировщик и celp кодирование, адаптированное к нему |
EP2491556B1 (en) * | 2009-10-20 | 2024-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decoder, corresponding method and computer program |
JP5809066B2 (ja) * | 2010-01-14 | 2015-11-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声符号化装置および音声符号化方法 |
US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
WO2011158485A2 (ja) * | 2010-06-14 | 2011-12-22 | パナソニック株式会社 | オーディオハイブリッド符号化装置およびオーディオハイブリッド復号装置 |
WO2011156905A2 (en) | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
CN102074242B (zh) * | 2010-12-27 | 2012-03-28 | 武汉大学 | 语音音频混合分级编码中核心层残差提取系统及方法 |
CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
JPWO2013061584A1 (ja) * | 2011-10-28 | 2015-04-02 | パナソニック株式会社 | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 |
US9111531B2 (en) | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
ES2742481T3 (es) * | 2012-05-30 | 2020-02-14 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y medio de grabación |
CN106448688B (zh) | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
-
2014
- 2014-07-28 CN CN201611123625.2A patent/CN106448688B/zh active Active
- 2014-07-28 CN CN201410363905.5A patent/CN104143335B/zh active Active
-
2015
- 2015-04-01 CA CA3058990A patent/CA3058990A1/en active Pending
- 2015-04-01 KR KR1020167035938A patent/KR101947127B1/ko active IP Right Grant
- 2015-04-01 ES ES15826814T patent/ES2814154T3/es active Active
- 2015-04-01 BR BR112016029904-3A patent/BR112016029904B1/pt active IP Right Grant
- 2015-04-01 ES ES20159183T patent/ES2938742T3/es active Active
- 2015-04-01 KR KR1020197003520A patent/KR102022500B1/ko active IP Right Grant
- 2015-04-01 PL PL20159183.1T patent/PL3790007T3/pl unknown
- 2015-04-01 WO PCT/CN2015/075645 patent/WO2016015485A1/zh active Application Filing
- 2015-04-01 EP EP15826814.4A patent/EP3157010B1/en active Active
- 2015-04-01 SG SG10201805102PA patent/SG10201805102PA/en unknown
- 2015-04-01 EP EP20159183.1A patent/EP3790007B1/en active Active
- 2015-04-01 JP JP2017505140A patent/JP6538822B2/ja active Active
- 2015-04-01 SG SG11201610047RA patent/SG11201610047RA/en unknown
- 2015-04-01 MY MYPI2016704584A patent/MY174461A/en unknown
- 2015-04-01 AU AU2015296447A patent/AU2015296447B2/en active Active
- 2015-04-01 CA CA3064092A patent/CA3064092C/en active Active
- 2015-04-01 MX MX2017001039A patent/MX360606B/es active IP Right Grant
- 2015-04-01 CA CA2951321A patent/CA2951321C/en active Active
- 2015-04-01 RU RU2017101806A patent/RU2670790C9/ru active
-
2017
- 2017-01-18 US US15/408,442 patent/US10056089B2/en active Active
-
2018
- 2018-02-27 AU AU2018201411A patent/AU2018201411B2/en active Active
- 2018-05-23 US US15/986,839 patent/US10269366B2/en active Active
-
2019
- 2019-01-31 US US16/263,837 patent/US10504534B2/en active Active
- 2019-06-06 JP JP2019106061A patent/JP6888051B2/ja active Active
- 2019-10-30 US US16/668,177 patent/US10706866B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6888051B2 (ja) | 音声符号化方法および関連装置 | |
AU2014360038A1 (en) | Encoding method and apparatus | |
JP2021043453A (ja) | 信号処理方法及び装置 | |
CA2912477A1 (en) | Signal encoding and decoding methods and devices | |
JP5783395B2 (ja) | 信号処理方法およびデバイス |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170130 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6538822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |