投机并行论文-于海荣

投机并行论文-于海荣

导读:本文包含了投机并行论文开题报告文献综述及选题提纲参考文献,主要关键词:自动并行化,编译优化,动态分析,预取算法

投机并行论文文献综述

于海荣[1](2016)在《多核环境下针对不规则应用程序的非投机并行策略》一文中研究指出多核处理器成为主流的通用处理器,具有计算能力强、功耗低和设计复杂度低等优点。不规则应用程序中含有大量复杂的控制流和数据流,难以充分利用多核处理器带来的宝贵资源。自动并行化技术可有效地解决这一问题,将串行程序转换为可以并发执行的多线程程序,发挥多核潜能。投机并行是自动并行化技术的一个研究热点。研究人员通过在程序中加入投机因素,增加并行的机会。然而,投机并行需要花费额外的代价处理误投机。因此,非投机并行成为新的研究热点。目前,非投机并行可以从不规则应用程序中提取独立多线程、流水线多线程以及环型多线程。但是,当前技术经常面临处理器负载不均衡、扩展性差以及线程间通信延迟敏感等问题。而且,非投机并行主要采用静态分析(编译器),应用程序中由指针别名引起的问题难以解决影响并行程序的执行效率。为了解决上述问题,提出一系列新的措施和解决方案:针对传统环型多线程技术对线程间通信延迟敏感的问题,提出一个自动并行化算法DOcyclial。DOcyclial利用基于优先权的动态调度策略降低线程间通信频率,避免通信延迟出现在并行程序执行的关键路径,增强程序对通信延迟的抵抗性。此外,DOcyclial将基于优先权的动态调度与节点融合策略相结合还可以保持处理器负载尽可能均衡。为了验证DOcyclical算法的有效性,利用两套标准测试程序(SPECCPU2006和StreamIt)分别在二、四、六核处理器进行测试,实验结果表明DOcyclical算法对线程间通信延迟极不敏感。而且,DOcyclical算法可以超过当前经典算法,如DSWP、PS-DSWP和HELIX,平均21-50%、1-27%、15-25%的性能。针对静态分析不能消除程序中冗余的依赖关系且难以对程序执行重用性分析的问题,提出一个动态分析框架DSspirit。DSspirit利用基于哈希的策略消除程序中冗余的数据依赖关系,利用基于值的策略分析程序的重用性,确定经常引起缓存缺失(cache misses)的指令,并向编译器提供可预取的对象。为了验证DSspirit的有效性,利用叁套标准测试应用程序(SPEC CPU2006、MPI2007和OMP2012)在Intel i7-4700处理器进行测试。实验结果表明DSspirif可以克服静态分析的缺陷,消除程序中冗余的依赖关系,并提供有预取价值的对象。而且,自动并行化技术中利用动态分析框架DSspirit可以获取平均20%的性能提升。针对缓存缺失(cache misses)总是影响并行程序执行效率的问题,提出一个基于动态分析的预取算法,该算法利用运行时环境确定经常引起缓存缺失的指令,并根据指令的访问特征制定不同的预取方案。为了验证预取算法的有效性,利用两套标准测试程序(SPEC CPU2006和MPI2007)在Intel i7-4700处理器进行测试。实验结果表明预取算法可以明显地提升并行程序的缓存命中率,缩短程序的总体执行时间。为了保证多线程程序对通信延迟不敏感且具有较高的缓存命中率,设计一个自动并行化系统HSparallel,该系统首先利用动态分析框架DSspirit确定具有预取价值的对象,然后利用自动并行化算法DOcyclical避免通信延迟出现在并行程序执行的关键路径,同时利用预取算法提高程序的缓存命中率。为了验证HSparallel的有效性,利用两套标准测试程序(SPEC CPU2006和MPI2007)在Intel i7-4700处理器进行测试。实验结果表明HSparallel可以带来显着的性能提升。而且,HSparallel超过当前主流算法,如Paralax和文献[1,2],平均19%、21%和17%的性能。最后,以上所有算法、框架和系统都完全开发于LLVM编译器,并写入到该编译器的后端。(本文来源于《华中科技大学》期刊2016-05-01)

刘剑[2](2014)在《投资与投机并行》一文中研究指出无论把股票交易的本质说成是投机还是投资,不说是错误的,至少也是不全面不准确的。在股市中,很难区别投机与投资。人们一般有惯于把短期买卖扎平操作称为投机,把长期的买卖扎平操作称为投资。人们对投机行为通常加以指责,而对投资者给予鼓励。他们认为:若是投机风气盛行(本文来源于《证券时报》期刊2014-08-30)

刘雷,李晶,陈莉,冯晓兵[3](2014)在《基于进程投机并行的运行时系统设计与优化》一文中研究指出投机并行化是解决遗留串行代码并行化的重要技术,但以往投机并行化运行时系统面临着诸多的性能问题,如任务分配不均衡、通信频繁、冲突代价高,以及进程启动,结柬频繁而导致开销过高等。为此,提出一种基于进程实现的投机并行化运行时系统。采用隐式单程序多数据的并行任务划分和执行模式。通过实现重甩进程的投机任务调度策略和委托正确性检查技术,降低投机进程启动/结束和通信的开销,提高投机进程的利用率,同时利用守护进程与投机进程协同执行的方式,确保在投机进程出现异常情况时程序也能正确执行。实验结果表明,该基于进程实现的投机运行时系统比同类型系统的性能提高231%。(本文来源于《计算机工程》期刊2014年03期)

刘剑[4](2012)在《投资与投机并行》一文中研究指出股市到底是投资还是投机呢?其实无论把股票交易的本质说成是投机还是投资,不说是错误的,至少也是不全面不准确的。在股市中,很难区别投机与投资。人们一般有惯于把短期买卖扎平操作称为投机,把长期的的买卖扎平操作称为投资。人们对投机行为通常加以指责,而对投资者给予鼓励。他们认为:若是投机风气盛行的话,股价暴涨暴(本文来源于《金融经济》期刊2012年17期)

张少斌[5](2011)在《硬件加速的并行投机XML解析器》一文中研究指出XML技术作为信息交换的有力工具,近年来在数据库和网络服务等领域得到广泛应用。XML解析是XML技术中的关键任务,关系着XML应用的性能。已有的市场化XML解析器通常都是软件实现,串行方式进行解析。为了加速XML解析,已有研究者引进了软件并行解析方法,提供多线程提升性能。不过限于处理器个数与性能,软件实现方法还是不能完全满足大量并行应用的需求。通过硬件提升处理性能是一种可行的技术手段。近年来有研究者使用FPGA执行XML解析,为一个XML文档提供硬件进行串行解析,没有充分利用硬件高度并行的特点,因此性能提高有限。本文提出了并行投机XML解析的思想,以细粒度并行的方法加速解析过程。本文设计了子文件划分算法,把一个XML文件划分为多个子任务分配给并行硬件执行单元进行并行解析。在不确定XML文件语法语义正确的情况下,投机在内存中构造DOM树并交给硬件执行,以加大资源利用率与提升性能。本文在ML 505 FPGA板子上实现了并行投机XML硬件解析器PSDXP,包括并行语法检查、并行DOM树构造、并行语义检查叁个模块,支持125 MHZ频率下运行,并测试了两进程并行版本PSDXPx2和四进程并行版本PSDXPx4。PSDXPx2使用了5%的Slice Register,9%的Slice LUT,8%的Block RAM,和XPA相比,Slice Register是其2.657倍,Slice LUT是其2.639倍。PSDXPx4使用了11%的Slice Register,19%的Slice LUT, 17%的Block RAM,和XPA相比,Slice Register是其6.416倍,Slice LUT是其5.895倍。实验表明,与3.16 GHZ频率下运行的现今性能最优的软件实现XML解析器RapidXML相比,PSDXPx4平均Gbps是RapidXML的1.342倍,平均CPB是35.93倍。和同主频运行的FPGA实现XML解析器XPA相比,PSDXPx4性能是XPA的3.992倍。因而本文提出的硬件加速的并行投机XML解析器,在性能上明显优于软件实现与现有硬件实现的XML解析器,且资源使用较少,有很好的扩展能力。(本文来源于《浙江工业大学》期刊2011-10-20)

李莹,孙煦雪,袁新宇,徐印成[6](2010)在《基于交互信息的投机并行化方法》一文中研究指出针对投机并行化中如何权衡策略并确定合适的执行模型来获取理想性能的问题,提出了一种基于交互信息的投机并行化方法,利用交互信息来确定投机并行化的执行模型,建立相关评价模型,并着重从线程抽取创建角度提出了相应的策略及对应的性能评价。通过实验表明,基于交互信息进行"按需"并行化,可以达到所需的性能要求。(本文来源于《计算机应用研究》期刊2010年06期)

陈煜[7](2009)在《延迟判断型投机执行并行处理方式的评价》一文中研究指出对多处理器的延迟判断式投机执行并行计算方式进行了评价,将该方式适用于实际程序时,通过模拟得到了执行时间最大可以缩减33%的结果。(本文来源于《南京工业职业技术学院学报》期刊2009年04期)

张小强[8](2008)在《基于事务的软件投机并行机制研究》一文中研究指出随着CPU芯片上集成的计算核心不断增加,计算机系统峰值性能不断攀升。近年来,多核处理器已经占据桌面,众核处理器即将普及。但是应用程序的并行开发远远滞后于硬件的发展,大部分商业程序并非可扩展的并行应用,因此很难充分利用多核系统的计算能力。由于并行应用开发尚未成为主流,现有的语言机制、库、设计模式等各方面都没有对并行程序开发提供良好的支持。如何有效利用众核处理器的潜在计算能力,已经成为软件工业所面临的巨大挑战。挑战之一是如何简化并行应用程序的开发。事务内存(Transactional Memory,TM)提供一种更高层次抽象机制,有效简化了并行程序的开发。基于事务内存,可以实现对共享数据的并发访问,而没有死锁、不可组合、扩展性差等问题,程序员仅需要考虑事务内代码的正确性问题,而不用考虑各并行任务之间由于复杂同步引发的问题,被认为是一种极具前景的并行程序设计方法。挑战之二是如何尽量将已有串行程序并行化,并尽可能地提高并行程序执行的效率。作为现有自动并行化技术的延伸,多线程投机并行技术(Speculative Parallel Threading, SPT)可以让传统方法难以并行的程序投机并行执行,进一步挖掘程序中的内在并行性,有效提高应用程序的可扩展性。论文主要围绕如何有效利用众核CPU的计算能力,重点从事务内存实现和串行程序投机并行优化两个方面展开研究。基于以上研究,面向Cell异构多核系统,构建了一个OpenMP扩展编程环境TRANSPECT。针对如何高效实现软件事务内存(Software Transactional Memory, STM)提出了一种STM语义模型。基于该模型,提出了一种基于数据版本目录的软件事务性内存实现算法LDSTM,该算法通过在目录中维护版本信息,可以在读取各个共享对象的时候快速确定事务的内存视图是否处于一致状态,极大地减少了冲突检测和验证的开销。对比测试表明,LDSTM比目前极具影响的RSTM快1.53倍以上。结合现有高级语言的内存模型,提出了基于因果一致性的事务内存实现算法CCSTM,有效地解决了事务和非事务代码之间的“私有化”数据竞争问题,降低了事务之间的冲突概率。针对STMBench7的测试表明,对于高度竞争事务,在4CPU情况下,提交失败率由89.4%降低81.3%。基于事务内存思想,提出了一种线程级投机并行算法LLSM (Loop level Speculative Multithreading)。和对具有广泛影响的循环级投机算法LRPD(Loop Reduction Privatizing Doall)算法比较,LLSM能够处理指针访问等情况;避免了LRPD的伪冲突问题;能够自行消解投机线程间W-W和R-W冲突,仅仅W-R冲突会导致LLSM投机失败,极大地提高了投机并行的成功率。而且即使投机失败,LLSM仅仅需要发生冲突的投机线程重新执行,不需要串行执行整个循环。对Spec测试集中183.equake和177.mesa的核心测试表明,基于LLSM算法投机并行,2线程加速比达1.57以上。针对LLSM中W-R冲突导致投机失败的问题,提出了一种对可能产生冲突的变量进行线程间数据传输和同步的点点同步算法IsSignalSynPos,通过编译器自动在存在数据依赖的源线程和目的线程之间插入signal和wait函数,创建点-点通讯路径跨线程传输数据,进一步减少了投机失败发生的概率,挖掘了循环中的部分并行性。基于LLSM和LDSTM隔离性实现机制,面向Cell系统,提出了一种OpenMP语言的扩展TRANSPECT,在更高抽象层次上挖掘投机并行程序中的数据局部性,在本地存储访存延迟较大的Cell系统上取得了较好的结果,为充分利用多核处理器的性能优势做出了有益的探索。(本文来源于《国防科学技术大学》期刊2008-12-01)

姚震,郑启龙,陈国良,杨晓奇[9](2008)在《基于事务性执行的投机并行多线程软件模拟》一文中研究指出基于事务性执行的投机并行多线程是一种适合未来多核微处理器架构的新型并行程序设计和编译技术.但在此基础上的并行程序执行过程更为复杂,程序执行过程的模拟成为关键问题之一.本文提出利用二进制代码级动态插桩技术对投机并行多线程程序进行功能性模拟,设计并实现了完整的软件平台,可精确地模拟和监控并行程序的线程级投机执行过程,检测访存冲突,从而实现投机并行多线程的语义.该软件平台同时可以作为进一步研究投机多线程并行程序真实执行过程的基础,并有效支持投机并行多线程编译器的设计和分析.(本文来源于《小型微型计算机系统》期刊2008年03期)

陈煜,殷凤华[10](2007)在《基于分散内存式多处理器系统的延迟判断式投机执行并行处理方式的提案》一文中研究指出针对并行计算机进行并行处理时条件分支会影响程序并行性的问题,提出了一种基于分散内存系统的延迟判断式投机执行并行处理方式。这种并行处理方式有处理时间(overhead)短,对硬件依赖性小等优点。(本文来源于《南京工业职业技术学院学报》期刊2007年04期)

投机并行论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

无论把股票交易的本质说成是投机还是投资,不说是错误的,至少也是不全面不准确的。在股市中,很难区别投机与投资。人们一般有惯于把短期买卖扎平操作称为投机,把长期的买卖扎平操作称为投资。人们对投机行为通常加以指责,而对投资者给予鼓励。他们认为:若是投机风气盛行

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

投机并行论文参考文献

[1].于海荣.多核环境下针对不规则应用程序的非投机并行策略[D].华中科技大学.2016

[2].刘剑.投资与投机并行[N].证券时报.2014

[3].刘雷,李晶,陈莉,冯晓兵.基于进程投机并行的运行时系统设计与优化[J].计算机工程.2014

[4].刘剑.投资与投机并行[J].金融经济.2012

[5].张少斌.硬件加速的并行投机XML解析器[D].浙江工业大学.2011

[6].李莹,孙煦雪,袁新宇,徐印成.基于交互信息的投机并行化方法[J].计算机应用研究.2010

[7].陈煜.延迟判断型投机执行并行处理方式的评价[J].南京工业职业技术学院学报.2009

[8].张小强.基于事务的软件投机并行机制研究[D].国防科学技术大学.2008

[9].姚震,郑启龙,陈国良,杨晓奇.基于事务性执行的投机并行多线程软件模拟[J].小型微型计算机系统.2008

[10].陈煜,殷凤华.基于分散内存式多处理器系统的延迟判断式投机执行并行处理方式的提案[J].南京工业职业技术学院学报.2007

标签:;  ;  ;  ;  

投机并行论文-于海荣
下载Doc文档

猜你喜欢