多带模型论文-黄其征

多带模型论文-黄其征

导读:本文包含了多带模型论文开题报告文献综述及选题提纲参考文献,主要关键词:语音增强,多带激励模型,码书驱动,深度神经网络

多带模型论文文献综述

黄其征[1](2018)在《基于多带激励模型的语音增强方法研究》一文中研究指出近些年,基于先验知识的语音增强方法成为了研究热点,它对于非平稳噪声能够得到良好的增强效果。码书驱动方法就是其中的代表。在码书驱动方法中,语音和噪声的自回归(Autoregressive,AR)系数和激励方差被看作随机变量,采用贝叶斯最小均方误差(Minimum Mean Squared Error,MMSE)估计准则,将所有码矢量的概率进行加权组合作为估计参数,最后用获得的参数构建维纳滤波器进行语音增强。但是该方法仍然存在不能去除谐波间噪声以及需要噪声分类等问题。为此,本文提出了相应的解决方法。本文的研究工作主要包括以下两部分内容:(1)首先对多带激励(Multi-Band Excitation,MBE)语音编码技术进行了深入研究。在此基础上,结合码书驱动方法,本文提出了一种基于多带激励模型的码书驱动语音增强方法。本方法首先对含噪语音通过贝叶斯码书驱动方法进行预增强,然后对每一帧的预增强谱提取叁个多带激励模型特征参数,包括基音周期、谐波幅度以及每个频带的清浊判决,然后根据清浊判决对浊音和清音采取不同的策略进行合成。为了使获得的多带激励模型特征参数更为准确,本文还在码书方法中引入了语音存在概率来修正维纳滤波器。通过实验可以得知,所提方法能够提高语音质量,去除谐波间和静音段的噪声。(2)针对多带激励模型参数估计不准确的问题,本文提出一种基于深度神经网络的多带激励语音增强方法。根据深度神经网络(Deep Neural Network,DNN)理论,在线下训练两个DNN模型,以估计两个MBE模型特征参数,包括谐波幅度和每个频带的误差函数。本文采取线性内插的方法处理谐波幅度,作为神经网络的训练目标;而对于每个频带的误差函数,整个频带被分为八部分,对每一部分提取误差函数作为训练目标。对于基音周期,含噪语音首先通过多带谱减方法进行预处理,然后通过MBE分析方法提取基音周期。实验证明,所提方法能够提高语音的质量和可懂度。本文采用语谱图,语音感知质量(Perceptual Evaluation of Speech Quality,PESQ),分段信噪比(Segment Signal to Noise Ratio,SSNR),对数谱失真(Log-Spectral Distortion,LSD),短时客观可懂度(Short-Time Objective Intelligibility,STOI)对所提语音增强方法进行了性能测试,实验结果表明,本文所提方法均优于参考方法。(本文来源于《北京工业大学》期刊2018-05-01)

吴涛[2](2013)在《基于多带激励模型的语音编码算法研究》一文中研究指出飞速发展的数字通信业务尤其是无线通信业务使得通信网络用户的数量不断增长,通信信道越发拥挤,频带资源越发珍贵。语音编码作为数字通信过程中重要的组成部分,在降低所需信道资源方面也扮演着重要的角色。在各种的语音编码算法中,多带激励语音编码算法是对语音信号进行压缩和处理的最好算法之一。为了理解多带激励语音编码模型的原理并将其应用到不同的语音处理应用当中,本文做了如下工作。首先,根据公开可查的参考文献,对MBE模型及其相关语音分析与合成算法的理论和原理进行了深入的研究。其次,依据模型原理设计了语音分析及合成算法,并用C语言实现了算法。再者,基于MBE语音分析合成模型,设计了一个简单的8kbps编码算法,设计该编码算法的目的在于验证模型的有效性。最后,对MBE语音处理模型及8kbps语音编码算法进行了仿真及质量评价。实验结果表明,MBE语音模型能够通过少量的几个参数,如基音周期、频带清浊信息和谱包络,就能有效地表达语音信号,而且该模型也能够提供较高质量的合成语音。8kbps的语音编码算法也验证了MBE模型的良好性能。(本文来源于《西安电子科技大学》期刊2013-03-01)

郭新,赵海峰,穆晓敏[3](2014)在《基于主用户活跃性的多带联合频谱感知模型》一文中研究指出针对以往的多带联合优化模型没有考虑检测周期对认知网络性能影响问题,提出了一种新的基于主用户活跃性的多带联合优化模型,将问题建模为干扰量、虚警和漏检概率等约束条件的非凸优问题,以最大化机会接入吞吐量为目标联合优化检测周期、感知时间和判决门限,并通过分层优化方法对其进行求解。数值分析表明,引入主用户活跃性影响后,在满足上述约束条件的同时,在保护主用户和机会接入吞吐量之间有了更好的权衡。(本文来源于《计算机工程与应用》期刊2014年07期)

李烨[4](2011)在《基于多带激励模型的低速率语音编码技术研究》一文中研究指出随着无线通信技术的不断发展和无线通信需求的日益增长,无线通信业务得到了越来越广泛的普及和应用。在众多无线通信服务中,语音是最基本、最常用的服务。为了降低传输成本、提高传输效率,从而实现在低码率或低存储空间情况下高质量传输语音,模拟语音信号通常经过数字化处理以比特流的形式传输,这个过程称为语音编码。参量编码是众多语音编码算法中的一类,它的特点是能够实现低码率。因此参量编码广泛应用于保密通信、卫星通信和语音信箱等诸多领域。语音信号的参量主要包括基音周期、频谱包络和清/浊音信息。参量的提取、量化精度直接影响合成语音质量。近年来,许多专家学者对参量提取和量化进行了广泛研究。在此基础上,本文针对多带激励(Multi-Band Excitation,MBE)语音编码模型、参量提取算法和参量量化等关键技术进行了深入研究,提出了若干改进算法,主要创新性成果如下:1.提出一种基于线性预测系数(Linear Predictive Coefficient,LPC)自适应前后向量化的MBE算法。该算法由MBE算法和(LPC系数)自适应前后向量化组成。MBE算法用于提取语音模型参量;自适应前后向量化利用语音信号相邻帧统计特性的相似性实现LPC系数的变速率编码,降低编码速率。提出一种基于线性预测系数自适应前后向量化的MBE算法的改进方案。改进方案增设一个线谱频率(Linear Spectral Frequency,LSF)系数自适应后向码本,并通过对该码本中相邻帧的LSF系数进行线性内插的方法,提高LPC系数自适应后向码本的精度。客观测试结果表明,与基于LPC系数自适应前后向量化的MBE算法相比,改进算法提高了平均后向量化使用率,进一步降低了平均编码速率。2.针对子带快速傅里叶反变换的线性误差对真实包络估计器(True Envelope Estimator,TE)实时算法的影响,提出一种采用修正因子消除线性误差的改进型TE实时算法。首先,推导出TE算法及其实时算法的累加型实现方案;然后,根据累加型TE实时算法分析出,子带快速傅里叶反变换的线性误差会导致TE实时算法所提取包络的精度降低,TE实时算法的收敛速度减慢;最后,推导出子带快速傅里叶反变换的线性误差的误差公式和修正因子的计算公式。提出一种基于美尔卷曲的改进型TELPC(TE-Linear Predictive Coding)频谱包络估计实时算法。该算法以改进型TE实时算法为基础,并根据人耳对频谱低频段分辨率更高的听觉特性,将提取的频谱包络映射到美尔刻度进行线性预测分析,并采用幅度压缩技术减小卷曲频谱包络的动态范围。客观测试结果表明,与改进型TELPC实时算法相比,基于美尔卷曲的改进型TELPC实时算法有效减小了所提取包络在低频段的拟合误差。3.提出一种采用时间加权均方误差准则的LSF系数轨迹压缩算法。在轨迹压缩算法的基础上,该算法利用人耳对浊音帧和高能量帧感知更加敏感的特性,采用对均方误差准则不等权重加权的方法,提高曲线对感知重要帧LSF系数的拟合精度,从而改善合成语音质量。在由MBE-LPC语音编码算法构成的测试系统中,与原轨迹压缩算法相比,LSF系数时间加权轨迹压缩算法可以提高合成语音MOS(Mean Opinion Score,MOS)分数约0.022。4.提出一种用于信号边缘检测的经验模式分解域自适应滤波方法。该方法由经验模式分解(Empirical Mode Decomposition,EMD)和空域自适应滤波两个部分组成。经验模式分解用于获得原信号的各级残差分量的一阶导数信号;空域自适应滤波利用空间相关函数增强残差分量一阶导数中信号边缘所对应峰值,抑制噪声。同时,给出EMD域自适应滤波方法中噪声功率阈值的两种估计方法:基于一致性EMD的噪声功率估计方法;基于中位数绝对离差的噪声功率估计方法。仿真实验表明EMD域自适应滤波方法可以准确提取信号边缘信息,并可应用于语音信号的基音周期检测。提出一种基于集合EMD域多尺度乘积的基音周期检测算法。该算法通过集合EMD域相邻多个尺度上残差分量一阶导数信号直接相乘来增强声门闭合时刻峰值;通过对多尺度乘积信号进行自相关分析来提取基音周期。客观测试结果表明该方法在安静和噪声环境中都可以提供较高的基音周期检测正确率。(本文来源于《西安电子科技大学》期刊2011-04-01)

曹耀钦,李光明,宋建社[5](2006)在《网格计算的多带主动存储计算模型及应用》一文中研究指出针对网格计算的需要,对主动存储计算机模型的功能进行了扩充,提出了一种应用于网格计算的多带主动存储计算模型,使之更直观有效地描述网格计算。该模型不仅可用来描述网格计算,还可描述并行计算,具有通用性和扩充性,已应用于导弹装备综合保障应用网格系统的设计中。(本文来源于《计算机应用研究》期刊2006年12期)

孙暐,吴镇扬[6](2006)在《多带同步模型用于噪声环境下语音识别》一文中研究指出根据人耳听觉特性,提出新的同步多带最大似然线性回归算法用于噪声环境下语音识别。该算法采用最大似然作为参数估计准则,利用各频带信号同步感知和噪声污染假定的方法进行语音模型补偿,有效地提高了识别系统在噪声环境下的识别性能。(本文来源于《中国工程科学》期刊2006年03期)

黄秀轩,韦岗[7](2003)在《基于双基频多带激励分离模型的元音分离》一文中研究指出听觉场景分析(AuditorySceneAnalysis,ASA)是一种模仿人的听觉特性实现对混迭声音信号进行分离的方法。作为ASA的基础研究,论文针对各种ASA系统存在的相近频带信号无法有效分离问题,提出了一种新的基于双基频多带激励分离模型的元音分离系统,该系统利用两语音信号的基音轨迹特性提取多带激励分离模型中两基频对应的语音的各次谐波参数,将两组参数代入多带激励合成模型从而得到两个分离的语音信号。文中给出了算法的原理与具体描述。仿真实验结果表明,系统对存在基音频率差异的元音信号能实现有效的分离。(本文来源于《计算机工程与应用》期刊2003年10期)

杨明,邱锋海,莫福源[8](2001)在《一种利用多带激励模型改进的低速率线性预测语音编码算法》一文中研究指出提出了一种利用多带激励(MBE)模型改进的低速率线性预测(LPC)语音编码算法.文中介绍了该算法的参数提取、量化编码及语音合成的具体方案,并用C语言构造了一个基于该算法的速率为1,6 kb/s的语音编码/解码系统.主观测听表明,该系统性能与 2.4 kb/s的 MELP算法接近或相当。(本文来源于《声学学报》期刊2001年04期)

付强,田斌,田红心,易克初[9](1999)在《语音多带激励模型基音搜索算法的一种改进》一文中研究指出深入分析了MBE模型分析算法的复杂度,认为原算法中的双闭环基音搜索结构有很大的改进余地,提出了一种基于B-样条二进离散子波变换(B-SDyWT)基音检测法的改进MBE模型分析算法.其关键在于利用B-SDyWT 基音检测原理将这种双闭环搜索算法改造成先开环后闭环的结构.理论分析说明,这种改造可以大幅度地降低基音搜索的复杂度,而不降低其性能.通过仿真实验对改进前、后的MBE模型基音搜索算法的复杂度、准确度以及抗噪声能力等方面进行了全面的对比分析.得出的结论是改进算法与原算法相比各项性能均不低于原算法甚至有所改善,特别是证实了理论分析中的复杂度降低作用.(本文来源于《西安电子科技大学学报》期刊1999年05期)

张连海,王杰锋,王炳锡[10](1999)在《基于语音多带激励模型的基音周期估计算法研究》一文中研究指出本文详细讨论了一种基于语音多带激励(MBE)模型的基音周期估计算法。该算法应用了前向跟踪和后向跟踪算法,保证了基音周期的慢时变特性,同时,该算法中的细搜索过程又保证了基音周期的精度,可以使基音周期精确到四分之一样点。本文最后给出了该算法的测试结果及优缺点。(本文来源于《第九届全国信号处理学术年会(CCSP-99)论文集》期刊1999-10-01)

多带模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

飞速发展的数字通信业务尤其是无线通信业务使得通信网络用户的数量不断增长,通信信道越发拥挤,频带资源越发珍贵。语音编码作为数字通信过程中重要的组成部分,在降低所需信道资源方面也扮演着重要的角色。在各种的语音编码算法中,多带激励语音编码算法是对语音信号进行压缩和处理的最好算法之一。为了理解多带激励语音编码模型的原理并将其应用到不同的语音处理应用当中,本文做了如下工作。首先,根据公开可查的参考文献,对MBE模型及其相关语音分析与合成算法的理论和原理进行了深入的研究。其次,依据模型原理设计了语音分析及合成算法,并用C语言实现了算法。再者,基于MBE语音分析合成模型,设计了一个简单的8kbps编码算法,设计该编码算法的目的在于验证模型的有效性。最后,对MBE语音处理模型及8kbps语音编码算法进行了仿真及质量评价。实验结果表明,MBE语音模型能够通过少量的几个参数,如基音周期、频带清浊信息和谱包络,就能有效地表达语音信号,而且该模型也能够提供较高质量的合成语音。8kbps的语音编码算法也验证了MBE模型的良好性能。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多带模型论文参考文献

[1].黄其征.基于多带激励模型的语音增强方法研究[D].北京工业大学.2018

[2].吴涛.基于多带激励模型的语音编码算法研究[D].西安电子科技大学.2013

[3].郭新,赵海峰,穆晓敏.基于主用户活跃性的多带联合频谱感知模型[J].计算机工程与应用.2014

[4].李烨.基于多带激励模型的低速率语音编码技术研究[D].西安电子科技大学.2011

[5].曹耀钦,李光明,宋建社.网格计算的多带主动存储计算模型及应用[J].计算机应用研究.2006

[6].孙暐,吴镇扬.多带同步模型用于噪声环境下语音识别[J].中国工程科学.2006

[7].黄秀轩,韦岗.基于双基频多带激励分离模型的元音分离[J].计算机工程与应用.2003

[8].杨明,邱锋海,莫福源.一种利用多带激励模型改进的低速率线性预测语音编码算法[J].声学学报.2001

[9].付强,田斌,田红心,易克初.语音多带激励模型基音搜索算法的一种改进[J].西安电子科技大学学报.1999

[10].张连海,王杰锋,王炳锡.基于语音多带激励模型的基音周期估计算法研究[C].第九届全国信号处理学术年会(CCSP-99)论文集.1999

标签:;  ;  ;  ;  

多带模型论文-黄其征
下载Doc文档

猜你喜欢