摘 要:为满足恶劣无线环境下低速率语音通信需要,针对混合激励线性预测(MELP)提出了一种基于信道软译码的差错隐藏算法。利用软译码所得对数似然概率比估计比特错误概率,提出了利用比特错误概率和信源残留冗余,基于最大后验概率(MAP)估计合成端语音清浊音模式。对不同的清浊音模式,选择不同的参数重构方案,浊音帧时,利用对数似然概率比基于最小均方误差(MMSE)准则进行参数重构;清音帧时,硬判决对数似然概率比,由硬判决结果通过映射直接重构参数,在信道编码为递归系统卷积码和并行级联卷积码情况下,采用PESQ测试了提出的差错隐藏算法误码条件下合成语音质量。测试结果表明,与近年来提出的针对MELP的差错隐藏算法相比,该算法具有更好的性能。
恶劣无线环境下低速率语音通信系统多采用信道编码来提高语音抗误码能力,例如野外无线通信和保密通信等。信道编码采用软译码方案时,译码结果中包含大量的软值信息,传统方法对信道软译码结果直接进行硬判决,合成端直接根据硬判决结果进行语音参数重构。硬判决导致软译码结果中大量的软值信息丢失,导致误码条件下合成语音质量不佳。
混合激励线性预测(MELP)语音编码算法[1,2]是美国国防部选定的2.4 kb/s语音编码算法标准,该算法大量应用于无线、保密等通信方式中。MELP算法对浊音帧和清音帧采用不同的编码方式,在合成端,算法首先根据基音周期参数值判断语音帧的清浊音模式,然后根据不同的清浊音模式选择不同的方式合成语音。研究表明,MELP算法编码后语音参数间仍然残留较大冗余[3]。软译码条件下,采用合适的差错隐藏技术,利用信道软译码信息和语音编码后参数间残留冗余,能有效提高误码条件下MELP编码算法合成语音质量[3~7]。文献[4]提出的基于卷积码软译码的差错隐藏算法,利用软译码所得对数似然概率比估计信道译码所得码流错误概率,利用一阶马尔科夫模型描述帧间线谱对参数、增益参数和基音周期参数残留冗余。语音合成时根据比特错误概率和一阶马尔科夫模型,基于最小均方误差准则进行参数重构,提高了线谱对参数比特、增益参数比特和基音周期参数比特抗信道误码能力。但是,文献[4]软语音合成算法并未考虑帧内参数间冗余,算法冗余利用率不高。在利用一阶马尔科夫模型描述线谱对参数帧间转移概率基础上,文献[5,6]提出利用一阶马尔科夫模型描述帧内相邻级线谱对参数间转移概率,合理地利用了帧内参数冗余,但是算法仅讨论了线谱对参数重构问题,且未考虑信道软译码条件下参数重构所需的比特错误概率估计问题。本文在文献[4~6]算法基础上,利用软译码所得对数似然概率比估计比特错误概率。为保证合成端的清浊音模式判决准确度,提出基于最大后验概率的清浊音模式判决算法,有效提高了低信噪比条件下清浊音模式判决准确度。参数重构时,由于MELP算法对清音帧重要比特都采用了汉明保护[2],清音帧本身具有较强的抗误码能力,清音帧参数直接根据硬判决所得码流通过映射重构,浊音帧参数基于MMSE准则进行重构。
1 信源信道模型
图1、2分别为系统顶层结构和基于信道软译码的参数重构模块结构框图。文中用下标代表帧号,上标代表帧中参数号,Yn代表MELP算法分析端第n帧参数,YNI代表第i号参数值,Yikn代表第i号参数的第k比特,In代表分析端提取的参数量化后码流,Xn代表信道编码后比特序列,I^n代表信道译码后码流,Y^n代表合成端重构的第n帧参数。
第n帧比特码流In包含一系列量化后参数,为方便算法推导,按表1对各参数进行编号,表1中所有参数组成集合{I}。
MELP算法对清音帧和浊音帧采用了不同的编码结构。浊音帧时,分析端提取了抖动参数、残差谱参数和分带清浊音判决参数;清音帧时,该3组参数共13 bit为量化后第1级LSP参数、主增益参数和副增益参数校验比特[2]。其校验关系如表2所示,im代表第m号参数部分比特,如i1{6,5,4,3}代表第1号参数第6比特、第5比特、第4比特和第3比特。
2 软语音重构模块
2.1 比特错误概率估计
信道译码采用基于最大后验概率的软译码算法[8],式(1)给出了软译码结果,)代表软译码所得第号参数的第k比特对数似然概率比。同文献[4],根据估计得到I误比特概率如式(2):
假设信道满足无记忆性,号参数比特数,间转移概率为:
2.2 清浊音模式判决
定义条件概率p(mode I^n-1,I^n,I^n+1),mode的值取0或1分别代表浊音模式或清音模式,基于MAP算法的清浊音模式判决等效为使p(mode I^n-1,I^n,I^n+1)取最大值,p(mode I^n-1,I^n,I^n+1)可展成式(5)形式,i0代表基音周期对应参数号。
其中:C代表常量;{I}i0代表除i0号参数外剩余参数集合。
为降低计算复杂度,本算法仅考虑基音周期参数帧间相关性,忽略清浊音模式与其它帧参数间相关性,式(5)等效为:p(Ii0n I^i0n-1,I^i0n,I^i0n+1)代表利用基音周期参数帧间转移概率得出的第n帧基音周期为Ii0n的后验概率。同文献[6],其值如式(7)所示:
其中:p(Ii0n+1 Ii0n)代表基音周期参数的帧间转移概率,通过离线训练得到,p(I^i0n Ii0n)和p(I^i0n+1 Ii0n+1)同式(4)(8)为一阶马尔科夫模型性质。mode∈{0,1}, p(mode Ii0n)代表分析端语音编码模式转移概率,定义ξv代表浊音空间。
p(I^ {I}i0n mode)代表一定清浊音模式下接收比特条件分布概率,清浊音模式决定了比特间是否存在校验关系。忽略接收比特间相关性,p(I^ {I}i0n mode)可展成式(10)形式:
2.3 参数重构
基于MMSE的LSP参数重构方法同文献[5],如式(15)(16)所示:
p(Iikn I^n-1,I^n,I^n+1)代表第k级矢量量化索引值为Iikn的条件概率,在LSP参数重构时,考虑LSP参数的帧间转移概率和帧内相邻级LSP参数间转移概率[5]。根据式(17)将p(Iikn I^n-1,I^n,I^n+1)转换成p(Iikn I^ikn-1,I^ikn,I^ikn+1)和p(I^ik-1n,I^ik+1n Iikn)两部分之积。p(Iikn I^ikn-1,I^ikn,I^ikn+1)同式(7)所示,p(I^ik-1n,I^ik+1n Iikn)值由式(18)确定,式(18)中p(Iik-1n Iikn)和p(Iik+1n Iikn)代表帧内相邻级LSP参数间转移概率[5],通过离线训练得到,P(I^ik-1n Iik-1n)和p(I^ik+1n Iik+1n)代表参数误码转移概率,由式(4)得到。
基于MMSE的增益参数和基音周期参数重构算法对应式(16),由于仅考虑参数帧间相关性,式(16)中p(Iikn I^n-1,I^n,I^n+1)计算如式(19)所示,
3 测试仿真
本文采用PESQ (perceptual evaluation of
speech quality)客观评价文献[4,5]算法和文中提出算法合成语音质量。离线转移概率训练时,训练语音为一段选自汉语语音库的30 min长的标准男声,用时间平均代替统计平均的方法来得到参数间转移概率。文献[5]仅讨论了LSP参数重构问题,为便于比较软译码条件下文献[5]算法和本文算法性能,仿真文献[5]算法时,对线谱对以外参数采用文献[4]方法重构,参数重构所需的比特错误概率采用文献[4]方法估计。信道编码选取的递归系统卷积码(RSC)码率为1/2,约束长度为5,生成多项式为(37,21)8。
信道编码选取的并行级联卷积码(PCCC)子码结构同上,子码间交织器为随机交织,删余后最终码率为1/2。仿真选择调制方式为BPSK,信道模型为加性高斯白噪声信道,仿真语音为一段选自汉语语音库的长度为2 min的标准男声。
图3为递归系统卷积码和并行级联卷积码下,本文算法与文献[4,5]算法清浊音模式判决性能仿真对比图。结果表明,在递归系统卷积码和并行级联卷积码下,本文算法清浊音模式判决错误概率de均优于直接根据基音周期判断的文献[4,5]算法。
表3、4给出了低信噪比下各算法合成语音PESQ客观评价得分结果。表3对应信道编码为递归系统卷积码情况,表4应信道编码为并行级联卷积码情况。由表3、4可以看出,基于信道软译码的差错隐藏算法明显提高了误码条件下MELP算法合成语音质量,本文提出的差错隐藏算法性能优于文献[4,5]算法。
4 结 语
本文提出一种基于信道软译码的差错隐藏算法。在模型建立时,算法综合考虑文献[4,5]算法,考虑对帧内相邻级线谱对参数间转移概率建模,提高了冗余信息利用率。在语音合成时,利用对数似然概率比估计比特错误概率,提出利用比特错误概率和参数间转移概率基于MAP判断清浊音模式,有提高了清浊音模式判决准确度。仿真结果表明,本文算法有效的解决了软信道译码条件下语音合成问题,在低信噪比条件下,算法性能优于近年来提出的两种针对MELP的差错隐藏算法。




