中低码率语音论文-江文斌

中低码率语音论文-江文斌

导读:本文包含了中低码率语音论文开题报告文献综述及选题提纲参考文献,主要关键词:语音信号处理,极低码率语音编码器,语音增强,波束形成

中低码率语音论文文献综述

江文斌[1](2018)在《面向复杂场景的极低码率语音编解码和语音增强关键技术研究》一文中研究指出近年来,随着信号处理技术的发展,语音通信系统和语音识别系统在理想条件下取得了良好的效果。然而,在面向宽带资源有限条件下的低码率语音通信、强噪声干扰条件下的语音识别等复杂应用场景,现有系统的性能会大大降低。低码率语音编码会由于量化误差导致语音可懂度的下降,并会随着码率的降低进一步恶化,这对高可懂度的低码率语音编解码提出了更高的要求。实际应用系统中的环境噪声干扰会使得通话质量和识别率大大降低,这对语音增强(或降噪)技术也提出了越来越高的要求。本文对复杂场景下低码率语音编解码和语音增强两大问题展开研究。针对极低码率语音编码问题,分析了语音信号不同感知层的表示方法及对应的编码方法,研究了只需要单一量化编码参数的参数层低码率语音编码方法,并以此为基础实现了语义层高可懂度编解码方法,具体研究内容如下:实现了采用梅尔倒谱系数的低码率语音编解码方法。该方法只需要一种参数表示语音信号,使得实现极低码率量化编码时不需要考虑参数间联合矢量量化的问题,从而极大地简化了量化器的设计。为了实现基于梅尔倒谱系数的高质量语音信号重建,在解码端实现了采用混合高斯模型的清浊分类和基音周期估计,并使用此信息实现了一种改进型幅度谱迭代逼近的方法重建时域信号。该重建方法充分利用了语音信号本身的特点,信号初始化为最小相位信号或者合成相位信号,从而实现了高质量语音的重建并加速了迭代算法的收敛速度。在基于梅尔倒谱系数编码方法的基础上,实现了一种采用深度神经网络的语义层低码率编解码方法,并对其中的基于语音参数重构信号和高维度数据量化两大关键技术问题展开研究。研究了受限波尔兹曼机结构的深度神经网络用于语音信号语义层的特征提取,实现了信号功率谱的语义层重构;研究了深度自动编码器用于高维度数据量化,实现了一种融合传统量化编码器和神经网络解码器的矢量量化方法。基于深度神经网络进行信号重构和高维度矢量量化,实现了语义层高可懂度的极低码率语音编解码器。针对复杂环境下的语音降噪问题,本文研究了单/多通道语音增强算法,实现了融合特定人信息的单通道语音增强方法,并实现了不依赖波达方向估计的噪声鲁棒性多通道空间滤波方法,具体内容如下:实现了一种融合特定人信息的单通道语音增强算法。该算法分别对噪声估计、噪声分类、噪声鲁棒的说话人识别、特定人信息的提取及融合进行了研究,实现了基于自适应混合高斯模型的噪声估计方法、采用参数域特征的噪声分类方法、针对典型的噪声环境分别建立对应说话人模型的话者识别方法、以及从说话人模型提取信息融合到语音增强算法的方法,从而减少了对噪声估计算法的依赖,有效提升了增强后语音信号的质量。研究了噪声鲁棒性阵列信号空间滤波算法,包括不依赖于波达方向估计的改进型最小方差无失真响应波束形成算法和基于广义特征值分解的盲波束形成算法,并分析得出噪声鲁棒性波束形成算法的关键是信号和噪声的时频掩膜估计。针对现有时频掩膜估计算法的种种不足,实现了一种功率谱域实高斯模型的时频掩膜估计算法,该算法较传统复高斯模型的时频掩膜估计方法大大降低了计算复杂度;实现了一种基于深度神经网络时频掩膜估计算法,该方法采用多目标训法并融合了阵列空间信息,较同类方法大大提高了时频掩膜的精度。综上所述,本文对复杂环境下的极低码率语音编码器和语音增强关键技术问题进行了深入研究和分析,研究了基于梅尔倒谱系数的语音编码方法并实现了语义层编解码器、研究了融合特定人信息的语音增强算法并实现了噪声鲁棒性空间降噪方法。本文为极低码率语音编码器和语音增强技术的应用提供了理论依据和实践参考。(本文来源于《上海交通大学》期刊2018-05-01)

卫振琦[2](2016)在《面向多通道低码率语音编解码应用的众核处理器设计及其核间通信关键问题研究》一文中研究指出在军事与安全领域,由于无线信道带宽受限于环境噪声、频带复用、保密通信等一系列因素,低码率数字语音编解码器即声码器被广泛使用。随着语音码率降低达到300~600bps,声码器算法由于计算复杂度上升使得实时处理性能需求达到数百甚至上千MIPS(Million Instruction Per Second,每秒百万条指令),而其内存开销也因为语音参数量化码本数据的增加而超过了200kB,使得在嵌入式处理器上以较低工作频率和较少片上内存实现低码率语音实时编解码变得越来越多困难。另外,在作战指挥通信和多人语音会议等实际应用场景中需要同时处理多路语音,成倍增长的性能和内存需求为处理器设计带来了更大的挑战。面向特定应用,ASIP(Application Specific Instruction Processor,专用指令处理器)通过对指令集和流水线架构进行定制和优化,可实现比GPP(General Purpose Processor,通用处理器)或通用DSP(Digital Signal Processor,数字信号处理器)更高的执行效率,同时又拥有ASIC(Application Specific Integrated Circuit,专用集成电路)所欠缺的可编程性和可配置性。而针对应用的并行执行需求,基于异构众核架构的处理器可实现较高的处理性能和功耗效率。因此,本文采用ASIP的设计方法对面向多通道低码率MELPe(Enhanced Mixed Excitation Linear Prediction,增强型混合激励线性预测)声码器应用的异构众核处理器进行研究和实现。本文首先通过定位声码器应用性能瓶颈制定了异构多核协同执行策略,并对异构众核处理器的性能加速比和功耗效率进行建模和研究。本文设计了一款面向多通道低码率声码器应用的异构众核ASIP,在NoC(Network on Chip,片上网络)中集成了大小异构处理核和共享内存核。针对应用性能瓶颈,本文为处理核设计了一种专用ISE(Instruction Set Extension,指令集扩展),可在单条指令内完成定点数计算与后处理,并且采用了一种“流水级跳跃”技术提升扩展指令执行效率。另外,本文还提出一种嵌套循环加速技术,采用循环体自动计数和跳转有效减少了处理核执行循环运算的时间。然后,本文对面向NoC众核处理器的核间通信问题进行研究。最后,本文基于SMIC 40nm工艺完成了异构众核ASIP的芯片实现,并对应用进行移植和优化,在较低工作频率下实现了低码率声码器应用在异构众核ASIP上的实时处理。本文对NoC众核处理器的多核同步控制和核间数据传输这两个核间通信关键问题进行了研究,并取得了如下技术创新。在多核同步控制方面,针对采用集中式锁同步方案带来的核间通信阻塞问题,本文提出了一种分布式排队锁同步技术。通过对取锁队列中不同处理核的同步控制单元进行分布式轮询访问,实现了排队锁的获取与释放。同步控制单元内采用FIFO存储同步请求,通过本地轮询减少了核间通信量。本文提出的锁同步技术在处理核增加时依然具有较低的同步延迟。本文针对以往栅栏同步方案不支持多栅栏并发执行以及扩展性不高的问题,提出了一种基于PS(Packet Switching,包交换)和CS(Circuit Switching,电路交换)混合交换NoC的栅栏同步技术。当栅栏同步请求在PS子网络中传输时,可同时在CS子网络中建立专用通路减少传输延迟。通过在CS crossbar(交叉开关)中动态合并同步请求可有效减少核间通信量。该技术对比以往方案具有更低的同步延迟,并且支持并发栅栏的高效执行。在核间数据传输方面,针对CS NoC专用通路建立时间过长导致通信效率下降的问题,本文提出了一种基于PS-CS混合交换NoC的低延迟核间DMA(Direct Memory Access,直接内存访问)传输技术。当在PS子网络中传输数据时,通过配置crossbar的双向传输端口可在CS子网络中建立部分专用通路。根据后续传输请求可动态延长通路,从而进一步减少数据传输延迟。当多个DMA传输并发执行时,采用该技术可显着提升核间数据传输效率。综上所述,本文设计了一款面向多通道低码率声码器应用的异构众核ASIP,并对面向NoC众核处理器的核间通信关键问题进行了研究。本文为面向特定应用的高功耗效率ASIP实现提供了理论依据和设计参考。(本文来源于《上海交通大学》期刊2016-09-01)

肖东,莫福源,陈庚,马力[3](2016)在《低码率语音编码中过渡帧对合成语音的影响》一文中研究指出过渡段对语音清晰度、可懂度和人耳听觉感知都起到不可忽视的作用。参数语音编码中,包含有过渡段的语音帧能否得到恰当处理,是决定其合成语音是否清晰可懂的关键。本文以混合激励线性预测编码为参考,将其中的语音帧划分为静音、清音、浊音、过渡四大类后分别处理,在以往低码率语音编码(<1 kbps)工作基础上,比较了八种过渡帧划分方法对合成语音PESQ MOS的影响。经分析后发现:不同的过渡帧对PESQ MOS的贡献也不同。由清、静音向浊音变化的过渡帧的贡献最大;介于浊辅音与元音之间的过渡帧的贡献也不应被忽略。(本文来源于《应用声学》期刊2016年01期)

涂卫平[4](2011)在《低码率语音编码器实现中的片上Cache分配策略》一文中研究指出针对DSP上低码率语音编码器的实现和优化问题,研究了片上Cache的分配策略。根据指令Cache的大小,以及程序处理的数据量的大小,将程序分成大小合理的段,分阶段载入Cache中。对数据Cache的分配考虑了Cache结构和数据本身的特点,使有限的数据Cache得到充分的利用。全面考察数据的生命期,使已经载入数据Cache的数据尽可能得到重复利用,从而有效地减少片外存储器和Cache之间的数据传送。(本文来源于《电声技术》期刊2011年11期)

王军敏,卫亚博[5](2010)在《一种低码率的语音通信系统设计》一文中研究指出由于信息技术的发展和频率资源的日趋宝贵,语音通信朝着多模式、低码率的方向发展.采用高性能的语音编解码芯片AMBE-2000、模数转换芯片AD73311、DSP芯片可以容易地实现低码率的语音通信系统设计,并取得了良好的语音质量.(本文来源于《平顶山学院学报》期刊2010年05期)

李锐[6](2010)在《低码率语音编码MELP的SOPC实现》一文中研究指出讨论了低码率语音编码MELP的编解码过程,有效降低了语音编码码率并能使说话者个人语音特征减弱,特别适合需要弱化说话者语音特点的场合。给出了其FPGA的硬件实现框图,据此可进行具体的硬件设计。同时给出了MELP编解码框图,可用于进一步的软件编制。(本文来源于《微型机与应用》期刊2010年07期)

何鹏[7](2010)在《井下智能交通系统中低码率语音传输的研究与实现》一文中研究指出随着语音技术应用的发展,语音信号数字处理的实时性要求越来越突出。这就要求在系统设计中,对系统的硬件环境要求更高。随着语音处理算法的日益复杂,用普通处理器对语音信号进行实时处理,己经不能满足需要。专用语音信号处理芯片能解决实时性的要求,同时对器件的资源要求也是最低的。本文利用新一代可编制逻辑器件在数字信号处理领域的优势,对语音信号低码率编码的FPGA实现进行了深入研究。第一章综述了低码率语音编码的现状,然后在第二章对LPC的声码器的编解码原理进行了较为详细的分析,并对其不足之处进行了一些分析,在此基础上,对LPC-10声码器进行了仿真,得到了处理过后的数据。最后,通过使用残差激励代替周期脉冲—随机噪声二元激励,让合成语音的质量得到了一定的提升。第叁章对电子系统的设计趋势进行了分析,指出了FPGA是未来电子设计主流实现手段。然后对可编程逻辑器件的内部结构进行了介绍,接着详细讨论了EDA设计流程的内容。最后对关系设计电路性能的的静态时序分析进行了详细分析,以及对异步时钟域间的数据同步问题给出了解决方案。在第四章用硬件实现了自相关、舒尔递推、离散余弦变换等关键模块。最后对低码率编码的后续工作给出了一些参考意见。(本文来源于《电子科技大学》期刊2010-04-01)

梁艳[8](2009)在《中低码率语音信息隐藏算法研究与实现》一文中研究指出在信息安全领域,信息隐藏作为传统加密算法的有效补充手段引起人们越来越多的关注,以其独具的安全,透明,鲁棒等特性,广泛应用于多媒体版权保护和隐秘通信。在信息隐藏的各种载体中,语音是人类最重要、最有效、最常用和最方便的形式,尤其是军事通信等需要保密的通信场合,基于语音的信息隐藏算法得到广泛的应用。因此该领域的研究,对于保障国家安全和社会稳定具有重要的意义。针对公开信道语音传输过程中非法截取,窃听,伪装,篡改信息等诸多不安全因素的影响,本文主要研究基于GSM和G.729中低码率的压缩域语音信息隐藏算法。在对目前该领域各种主要理论问题和具体技术问题研究的基础上,力求提高算法嵌入容量,同时保证透明性和安全性;另外研发出语音信息隐藏传输系统演示平台。论文的主要工作和研究成果为:首先介绍了第二代移动通信语音编码标准GSM(RPE-LTP),引出了GSM编码码流可修改比特位的选择,在此基础上介绍了基于单位增广矩阵和矩阵编码的信息隐藏算法,并对上述两种算法进行了仿真实验和结果分析。实验结果表明,基于矩阵编码的信息隐藏算法优于基于单位增广矩阵的信息隐藏算法。其次,本文介绍了中低码率下较为优秀的编码标准G.729和基于G.729语音编码的修改基音周期的信息隐藏算法。针对G.729编码码流的特性,本文提出了修改线谱对系数的信息隐藏算法,并结合单位增广矩阵,矩阵编码和修改基音周期的信息隐藏算法,提出了一种修改基音周期和修改线谱对系数的信息隐藏算法-MPL算法。实验表明该算法在保证听觉失真较小的情况下,提高了隐藏信息的嵌入容量。最后,本文在已研究的语音编码压缩域信息隐藏算法的基础上,结合网络平台,设计并实现了基于语音信息隐藏的传输演示系统。该系统的核心功能实现了语音信息的采集、秘密信息的嵌入、携密语音的传输和秘密信息的提取。实验结果表明,本文设计的信息隐藏算法可以在网络环境下有效运行。(本文来源于《哈尔滨工业大学》期刊2009-06-01)

潘桐[9](2009)在《G.726语音压缩算法在低码率下的改进与实现》一文中研究指出G.726协议制定的ADPCM音频压缩算法在语音数字通信领域应用广泛。通过对G.726算法流程的分析,提出了一种改进算法编码器的方案,并通过编程与测试,证明了此改进方法的可行性,该方案可提高G.726算法在低码率下的语音还原质量。(本文来源于《微计算机应用》期刊2009年04期)

刘鹏[10](2009)在《一种低码率水下语音通信方法的合成算法研究》一文中研究指出随着语音压缩技术、宽带网络技术和无线宽带技术的发展,水下语音通信的传输速率已达到一定水准。由于水声信道自身的特点,难以做到高速率、远距离传输。利用语音识别和语音合成技术对信源编码与解码的方法,使信息在信道中低码率传输,能够解决水声信道容量有限的问题。但是在接收端语音合成的质量却不甚理想。本文给出了一种利用语音编码实现语音合成、利用语音韵律参数来优化语音合成效果的方法,具有合成质量高、所需音库容量小的特点,适于低码率的嵌入式水下语音通信系统,具有一定的工程实用价值。论文主要研究G.729A协议标准和词汇间韵律参数的调节规律,仿真G.729A协议的主体算法——根据协议的编码算法压缩音库,译码算法实现语音合成。此外,本文还完成调值、强度、时长和尾音等韵律参数的调节算法,并分析词汇间韵律参数的调节规律,最后构建小词汇量文语转换系统。通过对该文语转换系统的主观听辨测试,结果表明其重建的语音清晰可辨,合成语音质量的自然度较好,且算法复杂度适中,延时较小,适用于水下微小型载体和潜水员进行无缆语音通信的嵌入式系统。(本文来源于《哈尔滨工程大学》期刊2009-02-01)

中低码率语音论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在军事与安全领域,由于无线信道带宽受限于环境噪声、频带复用、保密通信等一系列因素,低码率数字语音编解码器即声码器被广泛使用。随着语音码率降低达到300~600bps,声码器算法由于计算复杂度上升使得实时处理性能需求达到数百甚至上千MIPS(Million Instruction Per Second,每秒百万条指令),而其内存开销也因为语音参数量化码本数据的增加而超过了200kB,使得在嵌入式处理器上以较低工作频率和较少片上内存实现低码率语音实时编解码变得越来越多困难。另外,在作战指挥通信和多人语音会议等实际应用场景中需要同时处理多路语音,成倍增长的性能和内存需求为处理器设计带来了更大的挑战。面向特定应用,ASIP(Application Specific Instruction Processor,专用指令处理器)通过对指令集和流水线架构进行定制和优化,可实现比GPP(General Purpose Processor,通用处理器)或通用DSP(Digital Signal Processor,数字信号处理器)更高的执行效率,同时又拥有ASIC(Application Specific Integrated Circuit,专用集成电路)所欠缺的可编程性和可配置性。而针对应用的并行执行需求,基于异构众核架构的处理器可实现较高的处理性能和功耗效率。因此,本文采用ASIP的设计方法对面向多通道低码率MELPe(Enhanced Mixed Excitation Linear Prediction,增强型混合激励线性预测)声码器应用的异构众核处理器进行研究和实现。本文首先通过定位声码器应用性能瓶颈制定了异构多核协同执行策略,并对异构众核处理器的性能加速比和功耗效率进行建模和研究。本文设计了一款面向多通道低码率声码器应用的异构众核ASIP,在NoC(Network on Chip,片上网络)中集成了大小异构处理核和共享内存核。针对应用性能瓶颈,本文为处理核设计了一种专用ISE(Instruction Set Extension,指令集扩展),可在单条指令内完成定点数计算与后处理,并且采用了一种“流水级跳跃”技术提升扩展指令执行效率。另外,本文还提出一种嵌套循环加速技术,采用循环体自动计数和跳转有效减少了处理核执行循环运算的时间。然后,本文对面向NoC众核处理器的核间通信问题进行研究。最后,本文基于SMIC 40nm工艺完成了异构众核ASIP的芯片实现,并对应用进行移植和优化,在较低工作频率下实现了低码率声码器应用在异构众核ASIP上的实时处理。本文对NoC众核处理器的多核同步控制和核间数据传输这两个核间通信关键问题进行了研究,并取得了如下技术创新。在多核同步控制方面,针对采用集中式锁同步方案带来的核间通信阻塞问题,本文提出了一种分布式排队锁同步技术。通过对取锁队列中不同处理核的同步控制单元进行分布式轮询访问,实现了排队锁的获取与释放。同步控制单元内采用FIFO存储同步请求,通过本地轮询减少了核间通信量。本文提出的锁同步技术在处理核增加时依然具有较低的同步延迟。本文针对以往栅栏同步方案不支持多栅栏并发执行以及扩展性不高的问题,提出了一种基于PS(Packet Switching,包交换)和CS(Circuit Switching,电路交换)混合交换NoC的栅栏同步技术。当栅栏同步请求在PS子网络中传输时,可同时在CS子网络中建立专用通路减少传输延迟。通过在CS crossbar(交叉开关)中动态合并同步请求可有效减少核间通信量。该技术对比以往方案具有更低的同步延迟,并且支持并发栅栏的高效执行。在核间数据传输方面,针对CS NoC专用通路建立时间过长导致通信效率下降的问题,本文提出了一种基于PS-CS混合交换NoC的低延迟核间DMA(Direct Memory Access,直接内存访问)传输技术。当在PS子网络中传输数据时,通过配置crossbar的双向传输端口可在CS子网络中建立部分专用通路。根据后续传输请求可动态延长通路,从而进一步减少数据传输延迟。当多个DMA传输并发执行时,采用该技术可显着提升核间数据传输效率。综上所述,本文设计了一款面向多通道低码率声码器应用的异构众核ASIP,并对面向NoC众核处理器的核间通信关键问题进行了研究。本文为面向特定应用的高功耗效率ASIP实现提供了理论依据和设计参考。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

中低码率语音论文参考文献

[1].江文斌.面向复杂场景的极低码率语音编解码和语音增强关键技术研究[D].上海交通大学.2018

[2].卫振琦.面向多通道低码率语音编解码应用的众核处理器设计及其核间通信关键问题研究[D].上海交通大学.2016

[3].肖东,莫福源,陈庚,马力.低码率语音编码中过渡帧对合成语音的影响[J].应用声学.2016

[4].涂卫平.低码率语音编码器实现中的片上Cache分配策略[J].电声技术.2011

[5].王军敏,卫亚博.一种低码率的语音通信系统设计[J].平顶山学院学报.2010

[6].李锐.低码率语音编码MELP的SOPC实现[J].微型机与应用.2010

[7].何鹏.井下智能交通系统中低码率语音传输的研究与实现[D].电子科技大学.2010

[8].梁艳.中低码率语音信息隐藏算法研究与实现[D].哈尔滨工业大学.2009

[9].潘桐.G.726语音压缩算法在低码率下的改进与实现[J].微计算机应用.2009

[10].刘鹏.一种低码率水下语音通信方法的合成算法研究[D].哈尔滨工程大学.2009

标签:;  ;  ;  ;  

中低码率语音论文-江文斌
下载Doc文档

猜你喜欢