CN102576542A - 从窄频带信号确定上频带信号 - Google Patents

从窄频带信号确定上频带信号 Download PDF

Info

Publication number
CN102576542A
CN102576542A CN201080047460XA CN201080047460A CN102576542A CN 102576542 A CN102576542 A CN 102576542A CN 201080047460X A CN201080047460X A CN 201080047460XA CN 201080047460 A CN201080047460 A CN 201080047460A CN 102576542 A CN102576542 A CN 102576542A
Authority
CN
China
Prior art keywords
band
narrow
lsf
confirm
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201080047460XA
Other languages
English (en)
Other versions
CN102576542B (zh
Inventor
文卡特什·克里希南
丹尼尔·J·辛德尔
阿南塔帕德玛纳班·阿拉桑尼帕莱·坎迪哈代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN102576542A publication Critical patent/CN102576542A/zh
Application granted granted Critical
Publication of CN102576542B publication Critical patent/CN102576542B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Abstract

本发明揭示一种用于从窄频带语音信号确定上频带语音信号的方法。从所述窄频带语音信号确定窄频带线频谱频率LSF的列表。确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。确定为所述第一对邻近窄频带LSF的平均值的第一特征。使用码簿映射基于至少所述第一特征来确定上频带LSF。

Description

从窄频带信号确定上频带信号
相关申请案
本申请案涉及且主张2009年10月23日申请的标题为“从窄频带信号确定上频带信号(Determining an Upperband Signal from a Narrowband Signal)”的第61/254,623号美国临时专利申请案的优先权。
技术领域
本发明大体上涉及通信系统。更具体来说,本发明涉及从窄频带信号确定上频带信号。
背景技术
无线通信系统已成为全球许多人进行通信所采用的重要手段。无线通信系统可为许多无线通信装置提供通信,每一无线通信装置可由一基站服务。无线通信装置能够使用多个协议且在多个频率下操作以在多个无线通信系统中通信。
为了容纳许多用户,使用不同技术来最大化无线通信系统内的效率。举例来说,常常将语音压缩到窄带宽中以供发射。此允许更多用户接入网络,但还导致接收器处的不良语音质量。因此,可通过用于从窄频带信号确定上频带信号的改进的系统和方法来实现益处。
发明内容
揭示一种用于从窄频带语音信号确定上频带语音信号的方法。从所述窄频带语音信号确定窄频带线频谱频率(LSF)的列表。确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。确定为所述第一对邻近窄频带LSF的平均值的第一特征。使用码簿映射基于至少所述第一特征来确定上频带LSF。
在一个配置中,可基于窄频带语音信号来确定窄频带激发信号。可基于所述窄频带激发信号来确定上频带激发信号。可基于所述上频带线频谱频率(LSF)来确定上频带线性预测(LP)滤波器系数。可使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号。可确定用于所述合成的上频带语音信号的增益。可将所述增益应用于所述合成的上频带语音信号。
如果当前语音帧为有话音帧,则可将窗应用于所述窄频带激发信号。可在所述窗内计算所述窄频带激发信号的窄频带能量。可将所述窄频带能量转换到对数域。可将所述对数窄频带能量线性地映射到对数上频带能量。可将所述对数上频带能量转换到非对数域。
如果当前语音帧为无话音帧,则可确定所述窄频带激发信号的窄频带傅立叶变换。可计算所述窄频带傅立叶变换的子频带能量。可将所述子频带能量转换到对数域。可基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量。可将所述对数上频带能量转换到非对数域。如果所述当前语音帧为静音帧,则可确定比所述窄频带激发信号的能量低20dB的上频带能量。
在另一配置中,可确定N个唯一邻近窄频带LSF对,以使得所述对的元素之间的绝对差呈递增次序。N可为预定数目。可确定为系列中的所述LSF对的平均值的N个特征。可使用码簿映射基于所述N个特征来确定上频带LSF。
为了确定上频带线频谱频率(LSF),可确定窄频带码簿中的最紧密匹配所述第一特征的条目,且可基于当前语音帧被分类为有话音、无话音还是静音来选择所述窄频带码簿。还可将所述窄频带码簿中的所述条目的索引映射到上频带码簿中的索引,且可基于所述当前语音帧被分类为有话音、无话音还是静音来选择所述上频带码簿。还可从所述上频带码簿提取所述上频带码簿中的所述索引处的上频带LSF。所述窄频带码簿可包括从窄频带语音导出的原型特征,且所述上频带码簿可包括原型上频带线频谱频率(LSF)。窄频带线频谱频率(LSF)的所述列表可按升序进行排序。
还揭示一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围。所述设备包括处理器,和与所述处理器进行电子通信的存储器。可执行指令存储于所述存储器中。所述指令可执行以基于所述窄频带语音信号使用线性预测编码(LPC)分析来确定窄频带线频谱频率(LSF)的列表。所述指令还可执行以确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。所述指令还可执行以确定为所述第一对邻近窄频带LSF的平均值的第一特征。所述指令还可执行以使用码簿映射基于至少所述第一特征来确定上频带LSF。
还揭示一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围。所述设备包括用于基于所述窄频带语音信号使用线性预测编码(LPC)分析来确定窄频带线频谱频率(LSF)的列表的装置。所述设备还包括用于确定第一对邻近窄频带LSF的装置,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。所述设备还包括用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的装置。所述设备还包括用于使用码簿映射基于至少所述第一特征来确定上频带LSF的装置。
还揭示一种用于从窄频带语音信号确定上频带语音信号的计算机程序产品,其中所述上频带语音比所述窄频带语音跨越更高的频率范围。所述计算机程序产品包含其上具有指令的计算机可读媒体。所述指令包括用于基于所述窄频带语音信号使用线性预测编码(LPC)分析来确定窄频带线频谱频率(LSF)的列表的代码。所述指令还包括用于确定第一对邻近窄频带LSF的代码,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。所述指令还包括用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的代码。所述指令还包括用于使用码簿映射基于至少所述第一特征来确定上频带LSF的代码。
附图说明
图1为说明使用盲带宽扩展的无线通信系统的方框图;
图2为说明语音信号的随频率而变的相对带宽的方框图;
图3为说明盲带宽扩展的方框图;
图4为说明用于盲带宽扩展的方法的流程图;
图5为说明估计上频带频谱包络的上频带线性预测编码(LPC)估计模块的方框图;
图6为说明用于从窄频带线频谱频率(LSF)列表提取特征的方法的流程图;
图7为说明上频带增益估计模块的方框图;
图8为说明上频带增益估计模块的另一方框图;
图9为说明非线性处理模块的方框图;
图10为说明从窄频带激发信号产生谐波扩展信号的频谱扩展器的方框图;以及
图11说明可包括于无线装置内的某些组件。
具体实施方式
收听宽频带语音(50Hz到8000Hz)是合意的(与窄频带语音相对比),因为其质量较高且一般听起来更好。然而,在许多情况下,仅窄频带语音可用,因为经由传统陆线和无线电话系统的语音通信常常限于300Hz到4000Hz的窄频带频率范围。宽频带语音发射和接收系统正变得越来越流行,但将需要对现有基础设施作出重大改变,其将耗费相当多的时间。同时,正在使用盲带宽扩展技术,其充当作用于接收到的窄频带语音的后处理模块以将窄频带语音的带宽扩展到宽频带频率范围而不需要来自编码器的任何旁侧信息。盲估计算法完全从窄频带信号估计上频带(3500Hz到8000Hz的频带)和低音(50Hz到300Hz)的内容。术语“盲”指代未从编码器接收任何旁侧信息的事实。
换句话说,最理想的宽频带语音质量解决方案为:在发射器处对宽频带信号进行编码,发射所述宽频带信号,和在接收器(即,无线通信装置)处对所述宽频带信号进行解码。然而,目前,基础设施和移动装置仅使用窄频带信号进行通信。因此,改变整个无线通信系统将需要对现有基础设施和移动装置做出代价高的改变。然而,本发明的系统和方法使用现有基础设施和通信协议进行操作。换句话说,本文中所揭示的配置可包括于现有装置中,其仅需微小改变且不需要改变现有基础设施,由此以最小成本增加接收器处的语音质量。
具体来说,本发明的系统和方法从窄频带信号估计上频带信号的上频带频谱包络和时间能量轮廓(temporal energy contour)。此外,还使用激发估计和上频带合成技术来产生上频带信号。
图1为说明使用盲带宽扩展的无线通信系统100的方框图。无线通信装置102与基站104通信。无线通信装置102的实例包括蜂窝式电话、个人数字助理(PDA)、手持式装置、无线调制解调器、膝上型计算机、个人计算机等。无线通信装置102可或者称为接入终端、移动终端、移动台、远程站、用户终端、终端、订户单元、移动装置、无线装置、订户站、用户设备或某一其它类似术语。基站104可或者称为接入点、节点B、演进型节点B,或某一其它类似术语。
基站104与无线电网络控制器106(还称为基站控制器或包控制功能)通信。无线电网络控制器106与移动交换中心(MSC)110、包数据服务节点(PDSN)108或网间互连功能(IWF)、公共交换电话网络(PSTN)114(通常为电话公司)和因特网协议(IP)网络112(通常为因特网)进行通信。移动交换中心110负责管理无线通信装置102与公共交换电话网络114之间的通信,而包数据服务节点108负责在无线通信装置102与IP网络112之间路由包。
无线通信装置102包括窄频带语音解码器116,窄频带语音解码器116接收所发射的信号且产生窄频带信号122。然而,对于收听者而言,窄频带语音常常听起来不自然。因此,通过后处理模块118来处理窄频带信号122。后处理模块118使用盲带宽扩展器120以从窄频带信号122估计上频带信号,且将所述上频带信号与窄频带信号122组合以产生宽频带信号124。为了估计上频带信号,盲带宽扩展器120使用来自窄频带信号122的特征来估计上频带频谱包络,且估计上频带时间能量(上频带增益)。无线通信装置102还可包括其它未图示的信号处理模块,即,解调器、解交错器等等。
图2为说明语音信号的随频率而变的相对带宽的方框图。如本文中所使用,术语“宽频带”指代具有50Hz到8000Hz的频率范围的信号,术语“低音”指代具有50Hz到300Hz的频率范围的信号,术语“窄频带”指代具有300Hz到4000Hz的频率范围的信号,且术语“上频带”或“高频带”指代具有3500Hz到8000Hz的频率范围的信号。因此,宽频带信号224为低音信号226、窄频带信号222和上频带信号228的组合。
所说明的上频带信号228和窄频带信号222具有明显的重叠,使得3.5kHz到4kHz的区域由所述两种信号描述。提供窄频带信号222与上频带信号228之间的重叠允许使用在重叠区域上具有平滑下降的低通和/或高通滤波器。此些滤波器较容易设计,具有较低计算复杂度,和/或比具有更急剧或“砖墙型(brick-wall)”响应的滤波器引入更少延迟。具有急剧转变区域的滤波器倾向于比具有平滑下降的类似阶的滤波器具有更高旁瓣(其可引起混叠)。具有急剧转变区域的滤波器还可能具有可引起振铃假象(ringing artifact)的长脉冲响应。
在一典型无线通信装置102中,传感器(即,麦克风,和耳机或扬声器)中的一者或一者以上在7kHz到8kHz的频率范围上可能缺少明显的响应。因此,虽然上频带信号228和宽频带信号224被展示为具有高达8000Hz的频率范围,但其可实际上具有7000Hz或7500Hz的最大频率。
图3为说明盲带宽扩展的方框图。由窄频带语音解码器316接收并解码所发射的信号330。所述所发射的信号330可能已被压缩到窄频带频率范围中以用于越过物理信道进行发射。窄频带语音解码器316产生窄频带语音信号322。窄频带语音信号322由盲带宽扩展器320接收为输入,盲带宽扩展器320从窄频带语音信号322估计上频带语音信号328。
窄频带线性预测编码(LPC)分析模块332导出(或获得)窄频带语音信号322的频谱包络以作为线性预测(LP)系数333的集合(例如,全极滤波器的系数1/A(z))。窄频带LPC分析模块332将所述窄频带语音信号322处理为一系列非重叠帧,其中针对每一帧计算LP系数333的新的集合。帧周期可为窄频带信号322在其内可预期为局部地固定的周期(例如,20毫秒)(等效于在8kHz的取样率下的160个样本)。在一个配置中,窄频带LPC分析模块332计算十个LP滤波器系数333的集合以表征每一20毫秒帧的共振峰结构。在一替代配置中,窄频带LPC分析模块332将窄频带语音信号322处理为一系列重叠帧。
窄频带LPC分析模块332可经配置以直接分析每一帧的样本,或可首先根据窗化函数(例如,汉明窗)对所述样本进行加权。所述分析还可在大于所述帧的窗(例如,30毫秒的窗)上执行。此窗可为对称的(例如,5-20-5,使得其包括紧接在20毫秒的帧之前和之后的5毫秒)或不对称的(例如,10-20,使得其包括前一帧的最后10毫秒)。窄频带LPC分析模块332可使用列文逊-杜宾(Levinson-Durbin)递归或雷勒克斯-盖冈(Leroux-Gueguen)算法来计算LP滤波器系数333。
窄频带LPC到LSF转换模块337将LP滤波器系数333的集合变换成窄频带线频谱频率(LSF)334的对应集合。LP滤波器系数333的集合与LSF 334的对应集合之间的变换可为可逆或不可逆的。
除了产生窄频带LP系数333之外,窄频带LPC分析模块332还产生窄频带残余信号340。音高滞后和音高增益估计器339从窄频带残余信号340产生音高滞后336和音高增益338。音高滞后336为最大化短期预测残余信号340的自相关功能(其受到某些约束)的延迟。此计算在两个估计窗上独立地进行。这些窗中的第一者包括残余信号340的第80个样本到第240个样本,第二个窗包括第160个样本到第320个样本。接着应用规则以将两个估计窗的延迟估计和增益进行组合。
话音活动检测器/模式决策模块341基于窄频带语音信号322、窄频带残余信号340或两者而产生模式决策382。此包括使用速率确定算法(RDA)将有效语音与背景噪声分离,所述RDA针对每一语音帧选择三个速率(速率1、速率1/2,或速率1/8)中的一者。通过使用所述速率信息,语音帧被分类为三个类型中的一者:有话音、无话音或静音(背景噪声)。在广义上将语音大致分类为语音和背景噪声之后,话音活动检测器/模式决策模块341进一步将语音的当前帧分类为有话音或无话音帧。将由RDA分类为速率1/8的帧指定为静音或背景噪声帧。接着由上频带LPC估计模块342使用模式决策382以在估计上频带LSF 344时选择有话音码簿或无话音码簿。模式决策382还由上频带增益估计模块346使用。
由上频带LPC估计模块342使用窄频带LSF 334来产生上频带LSF 344。此包括:从窄频带LSF 334提取一个或一个以上特征;确定适当的窄频带码簿;以及接着将所述窄频带码簿中的索引映射到上频带码簿以产生上频带LSF 344。换句话说,上频带LPC估计模块342将窄频带语音信号322中的频谱峰值(由所提取的特征指示)映射到上频带频谱包络,而非将窄频带频谱包络映射到上频带频谱包络。
非线性处理模块348将窄频带残余信号340转换成上频带激发信号350。此包括以谐波方式扩展窄频带残余信号340,以及将窄频带残余信号340与经调制的噪声信号进行组合。上频带LPC合成模块352使用上频带LSF 344来确定上频带LP滤波器系数,所述上频带LP滤波器系数用以对上频带激发信号350进行滤波以产生上频带合成信号354。
另外,上频带增益估计模块346产生上频带增益356,上频带增益356由时间增益模块358使用以按比例放大上频带合成信号354的能量,从而产生增益经调整的上频带信号328(即,上频带语音信号的估计)。
上频带增益外形为控制上频带信号每4毫秒的增益的参数。在跟在有话音帧之后的第一个无话音帧和跟在无话音帧之后的第一个有话音帧期间,将此参数向量(对于20毫秒的帧,5个增益包络参数的集合)设定为不同值。在一个配置中,将所述上频带增益外形设定为0.2。所述增益外形可控制上频带帧的4毫秒的片段(子帧)之间的相对增益。其可能不影响上频带能量,所述上频带能量独立地由上频带增益356参数控制。
合成滤波器组360接收增益经调整的上频带信号328和窄频带语音信号322。合成滤波器组360可上取样每一信号以增加信号的取样率(例如,通过补零和/或通过复制样本)。另外,合成滤波器组360可分别对经上取样的窄频带语音信号322和经上取样的增益经调整的上频带信号328进行低通滤波和高通滤波。接着对两个经滤波的信号进行求和以形成宽频带语音信号324。
图4为说明用于盲带宽扩展的方法400的流程图。换句话说,方法400从窄频带语音信号322估计上频带语音信号328。方法400由盲带宽扩展器320执行。盲带宽扩展器320接收(462)窄频带语音信号322。窄频带语音信号322可已从宽频带语音信号进行压缩以用于在物理媒体上发射。盲带宽扩展器320还基于窄频带语音信号322而确定(464)上频带激发信号350。此包括使用非线性处理。
盲带宽扩展器320还基于窄频带语音信号322而确定(466)窄频带线频谱频率(LSF)334的列表。此包括:从窄频带语音信号322确定窄频带线性预测(LP)滤波器系数;以及将所述LP滤波器系数映射到窄频带LSF 334中。盲带宽扩展器320还确定(468)第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于列表中的所有其它对邻近窄频带LSF之间的差异。具体来说,上频带LPC估计模块342在十个窄频带LSF 334(按升序排列)的列表中找到其间差异最小的两个邻近窄频带LSF 334。盲带宽扩展器320还确定(470)为第一对窄频带LSF 334的平均值的第一特征。在另一配置中,盲带宽扩展器320还确定类似于第一特征的第二和第三特征,即,第二特征为在将第一对从列表移除之后最接近的下一对窄频带LSF 334的平均值,且第三特征为在将第一对和第二对从列表移除之后最接近的下一对窄频带LSF的平均值。盲带宽扩展器320还使用码簿映射基于至少所述第一特征来确定(472)上频带LSF 344,即,使用第一特征(和第二和第三特征(如果已确定))来确定窄频带码簿中的索引,且将所述窄频带码簿的所述索引映射到上频带码簿中的索引。
盲带宽扩展器320还基于上频带LSF 344而确定(474)上频带LP滤波器系数。盲带宽扩展器320还使用上频带LP滤波器系数来对上频带激发信号350进行滤波(476)以产生合成的上频带语音信号354。盲带宽扩展器320还调整(478)所述合成的上频带语音信号354的增益以产生增益经调整的上频带信号328。此包括应用来自上频带增益估计模块346的上频带增益356。
图5为说明估计上频带频谱包络的上频带线性预测编码(LPC)估计模块542的方框图。从窄频带LSF 534估计上频带频谱包络(如由上频带线频谱频率(LSF)596、597参数化)。
通过对窄频带语音信号322执行线性预测编码(LPC)分析且将线性预测(LP)滤波器系数转换成线频谱频率而从窄频带语音信号322估计窄频带LSF 534。特征提取模块580从窄频带LSF 534估计三个特征参数584。为了提取第一特征584,计算连续窄频带LSF534之间的距离。接着,选择其间距离最小的一对窄频带LSF 534,且选择其间的中点作为第一特征584。在一个配置中,提取一个以上特征584。如果情况如此,则在对其它特征584的搜索过程中除去所选的窄频带LSF 534对,且对剩余窄频带LSF 534重复所述程序以估计额外特征584(即,向量)。
可基于从窄频带语音信号322中的所接收帧提取到的信息来确定模式决策582,其指示当前帧是有话音、无话音还是静音的。模式决策582可由码簿选择模块586接收以确定是使用有话音码簿还是无话音码簿。用于估计有话音和无话音帧的上频带LSF 596、597的码簿可彼此不同。或者,可基于特征584来选择所述码簿。
如果模式决策582指示有话音帧,则窄频带有话音码簿匹配器588可将特征584投射到具有原型特征的窄频带有话音码簿590上,即,匹配器588可在窄频带有话音码簿590中找到最佳地匹配特征584的条目。有话音索引映射程序592可将最佳匹配的索引映射到上频带有话音码簿594。换句话说,窄频带有话音码簿590中的最佳地匹配所述特征584的条目的索引可用以在包括原型LSF向量的上频带有话音码簿594中查找合适的上频带LSF 596向量。窄频带有话音码簿590可经训练有从窄频带语音导出的原型特征,而上频带有话音码簿594可包括原型上频带LSF向量,即,有话音索引映射程序592可从特征584映射到上频带有话音LSF 596。
类似地,如果模式决策582指示无话音帧,则窄频带无话音码簿匹配器589可将特征584投射到具有原型特征的窄频带无话音码簿591上,即,匹配器589可在窄频带无话音码簿591中找到最佳地匹配特征584的条目。无话音索引映射程序593可将最佳匹配的索引映射到上频带无话音码簿595。换句话说,窄频带无话音码簿591中的最佳地匹配特征584的条目的索引可用以在包括原型LSF向量的上频带无话音码簿595中查找合适的上频带无话音LSF 597向量。窄频带无话音码簿591可经训练有原型特征,而上频带无话音码簿595可包括原型上频带LSF向量,即,无话音索引映射程序593可从特征584映射到上频带无话音LSF 597。
图6为说明用于从窄频带线频谱频率(LSF)534的列表提取特征的方法600的流程图。方法600由特征提取模块580执行。特征提取模块580计算(602)邻近窄频带LSF 534对之间的差异。从窄频带LPC分析模块332接收窄频带LSF 534以作为十个值(按升序组织)的列表。因此,存在九个差异,即,第一与第二窄频带LSF 534之间的差异、第二与第三窄频带LSF 534之间的差异、第三与第四窄频带LSF 534之间的差异等等。特征提取模块580还选择(604)在窄频带LSF 534之间具有最小距离的窄频带LSF 534对。特征提取模块580还确定(606)为所选窄频带LSF 534对的平均值的特征584。在一个配置中,确定三个特征584。在此配置中,特征提取模块580确定(608)是否已识别了三个特征584。如果否,则特征提取模块580还从剩余窄频带LSF移除(612)所选窄频带LSF对,且再次计算(602)差异以找到至少又一个特征584。如果已识别了三个特征584,则特征提取模块580按升序对特征584进行排序(610)。在一替代配置中,识别多于或少于三个的特征584,且相应地调适方法600。
图7为说明上频带增益估计模块746的方框图。上频带增益估计模块746从窄频带信号能量估计上频带能量756,所述窄频带信号能量取决于语音帧被分类为有话音还是无话音。图7说明估计有话音上频带能量756(即,有话音上频带增益)。对于有话音帧,使用通过对训练数据库使用一阶回归分析而确定的线性变换函数。
窗化模块714可将窗应用于窄频带激发信号740。或者,上频带增益估计模块746可接收窄频带语音信号322以作为输入。能量计算器716可计算经窗化的窄频带激发信号715的能量。对数变换模块718可(例如)使用函数10log10()来将窄频带能量717转换到对数域。可接着用线性映射程序720将对数窄频带能量719映射到对数上频带能量721。在一个配置中,可根据等式(1)来执行线性映射:
gu=αg1+β(1)
其中,gu为对数上频带能量721,g1为对数窄频带能量719,α=0.84209,且β=-5.35639。可接着(例如)使用函数10(g/10)用非对数变换模块722将对数上频带能量721转换到非对数域以产生有话音上频带能量756。
窄频带语音信号当在编码器处经由LPC分析滤波器被滤波时,在所述编码器处,所述窄频带语音信号可产生窄频带残余信号。在解码器处,窄频带残余信号可再现为窄频带激发信号。在解码器处,经由LPC合成滤波器对所述窄频带激发信号进行滤波。此滤波的结果为经解码的合成的窄频带语音信号。
图8为说明上频带增益估计模块846的另一方框图。具体来说,图8说明估计无话音上频带能量856(即,无话音上频带增益)。对于无话音帧,使用涉及子频带增益和频谱倾斜的试探性度量来导出上频带能量856。
快速傅立叶变换(FFT)模块824可计算窄频带激发信号840的窄频带傅立叶变换825。或者,上频带增益估计模块846可接收窄频带语音信号322以作为输入。子频带能量计算器826可将窄频带傅立叶变换825分为三个不同子频带,且计算这些子频带中的每一者的能量。举例来说,所述频带可为280Hz到875Hz、875Hz到1780Hz,和1780Hz到3600Hz。对数变换模块818a到818c可(例如)使用函数10log10()将子频带能量827转换为对数子频带能量829。
子频带增益关系模块828可接着基于对数子频带能量829相关的方式连同频谱倾斜来确定对数上频带能量831。可由频谱倾斜计算器835基于窄频带线性预测系数(LPC)833来确定所述频谱倾斜。在一个配置中,通过将窄频带LPC参数833转换为反射系数的集合且选择第一反射系数作为频谱倾斜来计算频谱倾斜参数。举例来说,为了确定对数上频带能量831,子频带增益关系模块828可使用以下伪码:
Figure BDA0000155457270000101
Figure BDA0000155457270000111
其中,spectral_tilt为从窄频带LPC 833确定的频谱倾斜,gH为对数上频带能量831,g1为第一子频带的对数能量,g2为第二子频带的对数能量,g3为第三子频带的对数能量,且enhfact为在确定gH时使用的中间变量。
可接着(例如)使用函数10(g/10)用非对数变换模块822将对数上频带能量831转换到非对数域以产生无话音上频带能量856。此外,对于静音帧,可将上频带能量设定为比窄频带能量低20dB。
图9为说明非线性处理模块948的方框图。非线性处理模块948通过将窄频带激发信号940的频谱扩展到上频带频率范围中而产生上频带激发信号950。频谱扩展器952可基于窄频带激发信号940而产生谐波扩展信号954。第一组合器958可将由噪声产生器960产生的随机噪声信号961与由包络计算器956计算的时域包络957进行组合以产生经调制的噪声信号962。在一个配置中,包络计算器956计算谐波扩展信号954的包络。在一替代配置中,包络计算器856计算其它信号的时域包络957,例如,包络计算器956近似窄频带语音信号322或窄频带激发信号940的在时间上的能量分布。第二组合器964可接着混合谐波扩展信号954与经调制的噪声信号962以产生上频带激发信号950。
在一个配置中,频谱扩展器952对窄频带激发信号940执行频谱折叠操作(还称作镜射)以产生谐波扩展信号954。可通过对窄频带激发信号940进行补零且接着应用高通滤波以保持混叠来执行频谱折叠。在另一配置中,频谱扩展器952通过在频谱上将窄频带激发信号940转变到上频带中(例如,经由上取样和之后的与恒定频率余弦信号相乘)而产生谐波扩展信号954。
频谱折叠和转变方法可产生频谱扩展信号,所述频谱扩展信号的谐波结构与窄频带激发信号940的原始谐波结构在相位和/或频率上不连续。举例来说,此些方法可产生具有不大体上位于基频的倍数处的峰值的信号,其可在重建构的语音信号中引起金属音(tinny-sounding)噪声。这些方法还可产生具有不自然强的音高特性的高频谐波。此外,因为可在8kHz下取样来自公共交换电话网络(PSTN)的信号但频带限制在3400Hz左右,所以窄频带激发信号940的上部频谱可几乎不包括能量或不包括能量,使得根据频谱折叠或频谱转变操作而产生的扩展信号可能在3400Hz以上具有频谱空洞。
产生谐波扩展信号954的其它方法包括:识别窄频带激发信号940的一个或一个以上基频;以及根据那个信息产生谐音。举例来说,激发信号的谐波结构可由基频以及振幅和相位信息一起来表征。在另一配置中,非线性处理模块948基于基频和振幅(如由(例如)音高滞后336和音高增益338指示)来产生谐波扩展信号954。然而,除非谐波扩展信号954与窄频带激发信号940相位相干,否则所得的经解码语音的质量可为不可接受的。
可使用非线性函数来创建与窄频带激发信号940相位相干且保留谐波结构而无相位不连续性的上频带激发信号950。非线性函数还可在高频谐波之间提供增加的噪声水平,此倾向于比由例如频谱折叠和频谱转变的方法产生的音高高频谐波听起来更自然。可由频谱扩展器952的各种实施方案应用的典型无记忆非线性函数包括绝对值函数(还称作全波整流)、半波整流、自乘、立方和修剪(clipping)。频谱扩展器952还可经配置以应用具有记忆的非线性函数。
噪声产生器960可产生随机噪声信号961。在一个配置中,噪声产生器960产生单位方差白伪随机噪声信号961,然而在其它配置中,噪声信号961无需为白噪声且可具有随频率而变的功率密度。第一组合器958可根据由包络计算器956计算的时域包络957而对由噪声产生器960产生的噪声信号961进行振幅调制。举例来说,第一组合器958可实施为乘法器,所述乘法器经布置以根据由包络计算器956计算的时域包络957来缩放噪声产生器960的输出以产生经调制的噪声信号962。
图10为说明从窄频带激发信号1040产生谐波扩展信号1072的频谱扩展器1052的方框图。此包括应用非线性函数以扩展窄频带激发信号1040的频谱。
上取样器1066可对窄频带激发信号1040进行上取样。可需要对信号充分地进行上取样以最小化在应用非线性函数时的混叠。在一个特定实例中,上取样器1066可将信号上取样八倍。上取样器1066可通过对输入信号进行补零且对结果进行低通滤波而执行上取样操作。非线性函数计算器1068可将非线性函数应用于经上取样的信号1067。对于频谱扩展,绝对值函数优于其它非线性函数(例如,自乘)的一个潜在优点在于不需要能量归一化。在一些实施方案中,通过剥离或清除每一样本的正负号位,可有效地应用绝对值函数。非线性函数计算器1068还可对经上取样的信号1067或频谱扩展信号1069执行振幅扭曲(amplitude warping)。
下取样器1070可对从非线性函数计算器1068输出的频谱扩展信号1069进行下取样以产生经下取样的信号1071。下取样器1070还可执行带通滤波以在减小取样率之前选择频谱扩展信号1069的所要频带(例如,以减少或避免由非所要的图像引起的混叠或讹误)。还可能需要下取样器1070在一个以上级中减小取样率。
由非线性函数计算器1068产生的频谱扩展信号1069可随着频率增加而在振幅上具有明显下降。因此,频谱扩展器1052可包括频谱平坦化器1072以白化经下取样的信号1071。频谱平坦化器1072可执行固定白化操作或执行自适应白化操作。在使用自适应白化的配置中,频谱平坦化器1072包括:LPC分析模块,其经配置以从经下取样的信号1071计算一组四个LP滤波器系数;以及四阶分析滤波器,其经配置以根据那些系数来白化经下取样的信号1071。或者,频谱平坦化器1072可在下取样器1070之前对频谱扩展信号1069进行操作。
图11说明可包括于无线装置1101内的某些组件。无线装置1101可为无线通信装置102或基站104。
无线装置1101包括处理器1103。处理器1103可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1103可称为中央处理单元(CPU)。虽然在图11的无线装置1101中仅展示单一处理器1103,但在替代配置中,可使用处理器(例如,ARM和DSP)的组合。
无线装置1101还包括存储器1105。存储器1105可为能够存储电子信息的任何电子组件。存储器1105可体现为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器包括在一起的板上存储器、EPROM存储器、EEPROM存储器、寄存器等,包括其组合。
数据1107和指令1109可存储于存储器1105中。指令1109可由处理器1103执行以实施本文中所揭示的方法。执行指令1109可涉及使用存储于存储器1105中的数据1107。当处理器1103执行指令1109时,可将指令的各部分1109a加载到处理器1103上,且可将各条数据1107a加载到处理器1103上。
无线装置1101还可包括发射器1111和接收器1113,以允许在无线装置1101与远程位置之间发射和接收信号。发射器1111和接收器1113可共同地称为收发器1115。天线1117可电耦合到收发器1115。无线装置1101还可包括多个发射器、多个接收器、多个收发器和/或多个天线(未图示)。
无线装置1101的各种组件可通过一个或一个以上总线而耦合在一起,所述一个或一个以上总线可包括电力总线、控制信号总线、状态信号总线、数据总线等。为清晰起见,在图11中将各种总线说明为总线系统1119。
本文中所描述的技术可用于各种通信系统,包括基于正交多路复用方案的通信系统。此些通信系统的实例包括正交频分多址(OFDMA)系统、单载波频分多址(SC-FDMA)系统等。OFDMA系统利用正交频分多路复用(OFDM),正交频分多路复用(OFDM)为一种将整个系统带宽分割为多个正交副载波的调制技术。这些副载波还可称作音调、频段等。在OFDM情况下,每一副载波可独立地由数据调制。SC-FDMA系统可利用经交错的FDMA(IFDMA)以在分布于系统带宽上的副载波上发射,利用局部化的FDMA(LFDMA)以在邻近副载波的块上发射,或利用增强型FDMA(EFDMA)以在邻近副载波的多个块上发射。一般来说,用OFDM在频域中发送调制符号,且用SC-FDMA在时域中发送调制符号。
在以上描述中,有时结合各种术语使用参数数字。在结合参数数字使用术语的情况下,此打算指代在所述图式中的一者或一者以上中展示的具体元件。在没有参数数字的情况下使用术语时,此打算大体上指代所述术语而不限于任何特定图。
术语“确定”涵盖广泛多种动作,且因此“确定”可包括推算、计算、处理、导出、研究、查找(例如,在表、数据库或另一数据结构中查找)、断定等。而且,“确定”可包括接收(例如,接收信息)、存取(例如,存取存储器中的数据)等。而且,“确定”可包括解析、选择、挑选、建立等。
除非另有明确指定,否则短语“基于”不意味着“仅基于”。换句话说,短语“基于”描述“仅基于”与“至少基于”两者。
应将术语“处理器”广泛地解译为涵盖通用处理器、中央处理单元(CPU)、微处理器、数字信号处理器(DSP)、控制器、微控制器、状态机等。在一些情况下,“处理器”可指代专用集成电路(ASIC)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)等。术语“处理器”可指代处理装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器,或任何其它此类配置。
应将术语“存储器”广泛地解译为涵盖能够存储电子信息的任一电子组件。术语存储器可指代各种类型的处理器可读媒体,例如,随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除PROM(EEPROM)、快闪存储器、磁性或光学数据存储装置、寄存器等。如果处理器可从存储器读取信息和/或将信息写入到存储器,则称存储器与处理器进行电子通信。与处理器成一体的存储器与所述处理器进行电子通信。
应将术语“指令”和“代码”广泛地解释为包括任一类型的计算机可读语句。举例来说,术语“指令”和“代码”可指代一个或一个以上程序、例程、子例程、函数、程序等。“指令”和“代码”可包含单一计算机可读语句或许多计算机可读语句。
可以硬件、软件、固件或其任何组合来实施本文中所描述的功能。如果以软件实施,则可将所述功能作为一个或一个以上指令存储于计算机可读媒体上。术语“计算机可读媒体”指代可由计算机存取的任何可用媒体。举例来说而非限制,计算机可读媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以载运或存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。如本文中所使用,磁盘和光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和
Figure BDA0000155457270000151
光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。
还可经由传输媒体来传输软件或指令。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL),或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源来传输软件,则同轴电缆、光纤缆线、双绞线、DSL,或例如红外线、无线电和微波的无线技术包括于传输媒体的定义中。
本文中所揭示的方法包含用于实现所描述方法的一个或一个以上步骤或动作。方法步骤和/或动作可在不脱离权利要求书的范围的情况下彼此互换。换句话说,除非正在描述的方法的适当操作需要步骤或动作的特定次序,否则可在不脱离权利要求书的范围的情况下修改特定步骤和/或动作的次序和/或使用。
此外,应了解,可由装置下载和/或以其它方式获得用于执行本文中所描述的方法和技术(例如,由图4和6说明的方法和技术)的模块和/或其它适当装置。举例来说,装置可耦合到服务器以促进传送用于执行本文中所描述的方法的装置。或者,可经由存储装置(例如,随机存取存储器(RAM)、只读存储器(ROM)、例如压缩光盘(CD)或软盘的物理存储媒体等)来提供本文中所描述的各种方法,以使得装置可在将存储装置耦合或提供到所述装置后获得各种方法。此外,可利用用于将本文中所描述的方法和技术提供到装置的任何其它合适技术。
应理解,权利要求书不限于上文所说明的精确配置和组件。可在不脱离权利要求书的范围的情况下在本文中所描述的系统、方法和设备的布置、操作和细节方面作出各种修改、改变和变化。

Claims (32)

1.一种用于从窄频带语音信号确定上频带语音信号的方法,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述方法包含:
基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率LSF的列表;
确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异;
确定为所述第一对邻近窄频带LSF的平均值的第一特征;以及
使用码簿映射基于至少所述第一特征来确定上频带LSF。
2.根据权利要求1所述的方法,其进一步包含:
基于所述窄频带语音信号来确定窄频带激发信号;以及
基于所述窄频带激发信号来确定上频带激发信号。
3.根据权利要求2所述的方法,其进一步包含:
基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数;
使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号;
确定用于所述合成的上频带语音信号的增益;以及
将所述增益应用于所述合成的上频带语音信号。
4.根据权利要求3所述的方法,其中所述确定所述增益包含:
在当前语音帧为有话音帧的情况下:
将窗应用于所述窄频带激发信号;
在所述窗内计算所述窄频带激发信号的窄频带能量;
将所述窄频带能量转换到对数域;
将所述对数窄频带能量线性地映射到对数上频带能量;以及
将所述对数上频带能量转换到非对数域。
5.根据权利要求3所述的方法,其中所述确定所述增益进一步包含:
在所述当前语音帧为无话音帧的情况下:
确定所述窄频带激发信号的窄频带傅立叶变换;
计算所述窄频带傅立叶变换的子频带能量;
将所述子频带能量转换到对数域;
基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量;以及
将所述对数上频带能量转换到非对数域。
6.根据权利要求3所述的方法,其中所述确定所述增益进一步包含:
在所述当前语音帧为静音帧的情况下:
确定比所述窄频带激发信号的能量低20dB的上频带能量。
7.根据权利要求1所述的方法,其进一步包含:
确定N个唯一邻近窄频带LSF对以使得所述对的元素之间的绝对差呈递增次序,其中N为预定数目;
确定为系列中的所述LSF对的平均值的N个特征;以及
使用码簿映射基于所述N个特征来确定上频带LSF。
8.根据权利要求1所述的方法,其中所述确定上频带线频谱频率LSF包含:
确定窄频带码簿中的最紧密匹配所述第一特征的条目,其中基于当前语音帧是被分类为有话音、无话音还是静音来选择所述窄频带码簿;
将所述窄频带码簿中的所述条目的索引映射到上频带码簿中的索引,其中基于所述当前语音帧是被分类为有话音、无话音还是静音来选择所述上频带码簿;以及
从所述上频带码簿提取所述上频带码簿中的所述索引处的上频带LSF。
9.根据权利要求8所述的方法,其中所述窄频带码簿包含从窄频带语音导出的原型特征,且所述上频带码簿包含原型上频带线频谱频率LSF。
10.根据权利要求1所述的方法,其进一步包含按升序对窄频带线频谱频率LSF的所述列表进行排序。
11.一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述设备包含:
处理器;
存储器,其与所述处理器进行电子通信;
存储于所述存储器中的指令,所述指令可由所述处理器执行以:
基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率LSF的列表;
确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异;
确定为所述第一对邻近窄频带LSF的平均值的第一特征;且
使用码簿映射基于至少所述第一特征来确定上频带LSF。
12.根据权利要求11所述的设备,其进一步包含可执行以进行以下操作的指令:
基于所述窄频带语音信号来确定窄频带激发信号;以及
基于所述窄频带激发信号来确定上频带激发信号。
13.根据权利要求12所述的设备,其进一步包含可执行以进行以下操作的指令:
基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数;
使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号;
确定用于所述合成的上频带语音信号的增益;以及
将所述增益应用于所述合成的上频带语音信号。
14.根据权利要求13所述的设备,其中所述可执行以确定所述增益的指令包含可执行以进行以下操作的指令:
在当前语音帧为有话音帧的情况下:
将窗应用于所述窄频带激发信号;
在所述窗内计算所述窄频带激发信号的窄频带能量;
将所述窄频带能量转换到对数域;
将所述对数窄频带能量线性地映射到对数上频带能量;以及
将所述对数上频带能量转换到非对数域。
15.根据权利要求13所述的设备,其中所述可执行以确定所述增益的指令进一步包含
可执行以进行以下操作的指令:
在所述当前语音帧为无话音帧的情况下:
确定所述窄频带激发信号的窄频带傅立叶变换;
计算所述窄频带傅立叶变换的子频带能量;
将所述子频带能量转换到对数域;
基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量;以及
将所述对数上频带能量转换到非对数域。
16.根据权利要求13所述的设备,其中所述可执行以确定所述增益的指令进一步包含可执行以进行以下操作的指令:
在所述当前语音帧为静音帧的情况下:
确定比所述窄频带激发信号的能量低20dB的上频带能量。
17.根据权利要求11所述的设备,其进一步包含可执行以进行以下操作的指令:
确定N个唯一邻近窄频带LSF对以使得所述对的元素之间的绝对差呈递增次序,其中N为预定数目;
确定为系列中的所述LSF对的平均值的N个特征;以及
使用码簿映射基于所述N个特征来确定上频带LSF。
18.根据权利要求11所述的设备,其中所述可执行以确定上频带线频谱频率LSF的指令包含可执行以进行以下操作的指令:
确定窄频带码簿中的最紧密匹配所述第一特征的条目,其中基于当前语音帧是被分类为有话音、无话音还是静音来选择所述窄频带码簿;
将所述窄频带码簿中的所述条目的索引映射到上频带码簿中的索引,其中基于当前语音帧是被分类为有话音、无话音还是静音来选择所述上频带码簿;以及
从所述上频带码簿提取所述上频带码簿中的所述索引处的上频带LSF。
19.根据权利要求18所述的设备,其中所述窄频带码簿包含从窄频带语音导出的原型特征,且所述上频带码簿包含原型上频带线频谱频率LSF。
20.根据权利要求11所述的设备,其进一步包含可执行以按升序对窄频带线频谱频率LSF的所述列表进行排序的指令。
21.一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述设备包含:
用于基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率LSF的列表的装置;
用于确定第一对邻近窄频带LSF的装置,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异;
用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的装置;以及
用于使用码簿映射基于至少所述第一特征来确定上频带LSF的装置。
22.根据权利要求21所述的设备,其进一步包含:
用于基于所述窄频带语音信号来确定窄频带激发信号的装置;以及
用于基于所述窄频带激发信号来确定上频带激发信号的装置。
23.根据权利要求22所述的设备,其进一步包含:
用于基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数的装置;
用于使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号的装置;
用于确定用于所述合成的上频带语音信号的增益的装置;以及
用于将所述增益应用于所述合成的上频带语音信号的装置。
24.根据权利要求23所述的设备,其中所述用于确定所述增益的装置包含:
在当前语音帧为有话音帧的情况下:
用于将窗应用于所述窄频带激发信号的装置;
用于在所述窗内计算所述窄频带激发信号的窄频带能量的装置;
用于将所述窄频带能量转换到对数域的装置;
用于将所述对数窄频带能量线性地映射到对数上频带能量的装置;以及
用于将所述对数上频带能量转换到非对数域的装置。
25.根据权利要求23所述的设备,其中所述用于确定所述增益的装置进一步包含:
在所述当前语音帧为无话音帧的情况下:
用于确定所述窄频带激发信号的窄频带傅立叶变换的装置;
用于计算所述窄频带傅立叶变换的子频带能量的装置;
用于将所述子频带能量转换到对数域的装置;
用于基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量的装置;以及
用于将所述对数上频带能量转换到非对数域的装置。
26.根据权利要求23所述的设备,其中所述用于确定所述增益的装置进一步包含:
在所述当前语音帧为静音帧的情况下:
用于确定比所述窄频带激发信号的能量低20dB的上频带能量的装置。
27.一种用于从窄频带语音信号确定上频带语音信号的计算机程序产品,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述计算机程序产品包含其上具有指令的非暂时性计算机可读媒体,所述指令包含:
用于基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率LSF的列表的代码;
用于确定第一对邻近窄频带LSF的代码,所述邻近窄频带LSF之间的差异低于
所述列表中的所有其它对邻近窄频带LSF之间的差异;
用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的代码;以及
用于使用码簿映射基于至少所述第一特征来确定上频带LSF的代码。
28.根据权利要求27所述的计算机程序产品,其进一步包含:
用于基于所述窄频带语音信号来确定窄频带激发信号的代码;以及
用于基于所述窄频带激发信号来确定上频带激发信号的代码。
29.根据权利要求28所述的计算机程序产品,其进一步包含:
用于基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数的代码;
用于使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号的代码;
用于确定用于所述合成的上频带语音信号的增益的代码;以及
用于将所述增益应用于所述合成的上频带语音信号的代码。
30.根据权利要求29所述的计算机程序产品,其中所述用于确定所述增益的代码包含:
在当前语音帧为有话音帧的情况下:
用于将窗应用于所述窄频带激发信号的代码;
用于在所述窗内计算所述窄频带激发信号的窄频带能量的代码;
用于将所述窄频带能量转换到对数域的代码;
用于将所述对数窄频带能量线性地映射到对数上频带能量的代码;以及
用于将所述对数上频带能量转换到非对数域的代码。
31.根据权利要求29所述的计算机程序产品,其中所述用于确定所述增益的代码进一步包含:
在所述当前语音帧为无话音帧的情况下:
用于确定所述窄频带激发信号的窄频带傅立叶变换的代码;
用于计算所述窄频带傅立叶变换的子频带能量的代码;
用于将所述子频带能量转换到对数域的代码;
用于基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量的代码;以及
用于将所述对数上频带能量转换到非对数域的代码。
32.根据权利要求29所述的计算机程序产品,其中所述用于确定所述增益的代码进一步包含:
在所述当前语音帧为静音帧的情况下:
用于确定比所述窄频带激发信号的能量低20dB的上频带能量的代码。
CN201080047460.XA 2009-10-23 2010-10-23 从窄频带信号确定上频带信号的方法和设备 Expired - Fee Related CN102576542B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US25462309P 2009-10-23 2009-10-23
US61/254,623 2009-10-23
US12/910,564 2010-10-22
US12/910,564 US8484020B2 (en) 2009-10-23 2010-10-22 Determining an upperband signal from a narrowband signal
PCT/US2010/053882 WO2011050347A1 (en) 2009-10-23 2010-10-23 Determining an upperband signal from a narrowband signal

Publications (2)

Publication Number Publication Date
CN102576542A true CN102576542A (zh) 2012-07-11
CN102576542B CN102576542B (zh) 2014-02-12

Family

ID=43899157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080047460.XA Expired - Fee Related CN102576542B (zh) 2009-10-23 2010-10-23 从窄频带信号确定上频带信号的方法和设备

Country Status (7)

Country Link
US (1) US8484020B2 (zh)
EP (1) EP2491558B1 (zh)
JP (1) JP5551258B2 (zh)
KR (1) KR101378696B1 (zh)
CN (1) CN102576542B (zh)
TW (1) TW201140563A (zh)
WO (1) WO2011050347A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104517610A (zh) * 2013-09-26 2015-04-15 华为技术有限公司 频带扩展的方法及装置
CN104981871A (zh) * 2013-02-15 2015-10-14 高通股份有限公司 个人化带宽扩展
CN107787510A (zh) * 2015-06-18 2018-03-09 高通股份有限公司 高频带信号产生
CN108701463A (zh) * 2016-02-03 2018-10-23 杜比国际公司 音频译码中的高效格式转换

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101238239B1 (ko) * 2007-11-06 2013-03-04 노키아 코포레이션 인코더
CA2704807A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
CN103026407B (zh) * 2010-05-25 2015-08-26 诺基亚公司 带宽扩展器
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
US9589576B2 (en) 2011-11-03 2017-03-07 Telefonaktiebolaget Lm Ericsson (Publ) Bandwidth extension of audio signals
CN103295578B (zh) * 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
US20130235985A1 (en) * 2012-03-08 2013-09-12 E. Daniel Christoff System to improve and expand access to land based telephone lines and voip
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US10043535B2 (en) * 2013-01-15 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
KR101775084B1 (ko) 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830056A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US9858941B2 (en) * 2013-11-22 2018-01-02 Qualcomm Incorporated Selective phase compensation in high band coding of an audio signal
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US10043534B2 (en) * 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
EP3091536B1 (en) * 2014-01-15 2019-12-11 Samsung Electronics Co., Ltd. Weight function determination for a quantizing linear prediction coding coefficient
CN104934035B (zh) * 2014-03-21 2017-09-26 华为技术有限公司 语音频码流的解码方法及装置
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
CN107607783B (zh) * 2017-09-01 2019-09-20 广州辰创科技发展有限公司 一种高效灵活的雷达频谱显示方法
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
CN112201261B (zh) * 2020-09-08 2024-05-03 厦门亿联网络技术股份有限公司 基于线性滤波的频带扩展方法、装置及会议终端系统
US11985179B1 (en) * 2020-11-23 2024-05-14 Amazon Technologies, Inc. Speech signal bandwidth extension using cascaded neural networks

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416563A (zh) * 2000-11-09 2003-05-07 皇家菲利浦电子有限公司 用于更高感觉质量的电话语音的宽带扩展
US6691083B1 (en) * 1998-03-25 2004-02-10 British Telecommunications Public Limited Company Wideband speech synthesis from a narrowband speech signal
EP1970900A1 (en) * 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP3696091B2 (ja) 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
GB2351889B (en) 1999-07-06 2003-12-17 Ericsson Telefon Ab L M Speech band expansion
KR20010101422A (ko) * 1999-11-10 2001-11-14 요트.게.아. 롤페즈 매핑 매트릭스에 의한 광대역 음성 합성
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
PL1864101T3 (pl) 2005-04-01 2012-11-30 Qualcomm Inc Systemy, sposoby i urządzenia do generowania górnopasmowego pobudzenia
EP1772855B1 (en) * 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
ATE528748T1 (de) * 2006-01-31 2011-10-15 Nuance Communications Inc Verfahren und entsprechendes system zur erweiterung der spektralen bandbreite eines sprachsignals
JP2007310296A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域拡張装置及び方法
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6691083B1 (en) * 1998-03-25 2004-02-10 British Telecommunications Public Limited Company Wideband speech synthesis from a narrowband speech signal
CN1416563A (zh) * 2000-11-09 2003-05-07 皇家菲利浦电子有限公司 用于更高感觉质量的电话语音的宽带扩展
EP1970900A1 (en) * 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
J. EPPS,ET AL.: "SPEECH ENHANCEMENT USING STC-BASED BANDWIDTH EXTENSION", 《ICSLP"98》 *
NIKLAS ENBOM, ET AL.: "Bandwidth expansion of speech based on vector quantization of the mel frequency cepstral coefficients", 《1999 IEEE WORKSHOP ON SPEECH CODING PROCEEDINGS》 *
RONGQIANG HU,ET AL.: "Speech Bandwidth Extension by Improved Codebook Mapping Towards Increased Phonetic Classification", 《9TH EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY, INTERSPEECH 2005, INTERNATIONAL SPEECH AND COMMUNICATION ASSOCIATION》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104981871A (zh) * 2013-02-15 2015-10-14 高通股份有限公司 个人化带宽扩展
CN104981871B (zh) * 2013-02-15 2018-01-02 高通股份有限公司 个人化带宽扩展
CN104517610A (zh) * 2013-09-26 2015-04-15 华为技术有限公司 频带扩展的方法及装置
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN108172239A (zh) * 2013-09-26 2018-06-15 华为技术有限公司 频带扩展的方法及装置
US10186272B2 (en) 2013-09-26 2019-01-22 Huawei Technologies Co., Ltd. Bandwidth extension with line spectral frequency parameters
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN107787510A (zh) * 2015-06-18 2018-03-09 高通股份有限公司 高频带信号产生
CN107787510B (zh) * 2015-06-18 2019-08-30 高通股份有限公司 高频带信号产生
CN108701463A (zh) * 2016-02-03 2018-10-23 杜比国际公司 音频译码中的高效格式转换
CN108701463B (zh) * 2016-02-03 2020-03-10 杜比国际公司 音频译码中的高效格式转换

Also Published As

Publication number Publication date
US20110099004A1 (en) 2011-04-28
KR20120090086A (ko) 2012-08-16
JP2013508783A (ja) 2013-03-07
EP2491558B1 (en) 2013-07-24
EP2491558A1 (en) 2012-08-29
TW201140563A (en) 2011-11-16
JP5551258B2 (ja) 2014-07-16
US8484020B2 (en) 2013-07-09
WO2011050347A1 (en) 2011-04-28
CN102576542B (zh) 2014-02-12
KR101378696B1 (ko) 2014-03-27

Similar Documents

Publication Publication Date Title
CN102576542B (zh) 从窄频带信号确定上频带信号的方法和设备
CN1750124B (zh) 带限音频信号的带宽扩展
CN100454389C (zh) 声音编码设备和声音编码方法
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
CN102667920B (zh) Sbr比特流参数缩混
US8738372B2 (en) Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band
CN102652336B (zh) 声音信号复原装置以及声音信号复原方法
CN101421780B (zh) 用于编码和解码时变信号的方法和设备
US20150262584A1 (en) Voice decoding apparatus of adding component having complicated relationship with or component unrelated with encoding information to decoded voice signal
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
CN101183527A (zh) 用于对高频信号进行编码和解码的方法和设备
CN103026407A (zh) 带宽扩展器
EP2071565B1 (en) Coding apparatus and decoding apparatus
JP2003323199A (ja) 符号化装置、復号化装置及び符号化方法、復号化方法
CN104956438B (zh) 执行噪声调制和增益调节的系统和方法
CN104981870A (zh) 声音增强装置
EP1239458A2 (en) Voice recognition system, standard pattern preparation system and corresponding methods
KR20070085532A (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법
JP2002222000A (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
CN114333893A (zh) 一种语音处理方法、装置、电子设备和可读介质
CN114333891B (zh) 一种语音处理方法、装置、电子设备和可读介质
CN100585700C (zh) 语音编码装置及其方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4517262B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
JP2005258478A (ja) 符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140212

CF01 Termination of patent right due to non-payment of annual fee