算法代码论文-张凌浩,桂盛霖,穆逢君,王胜

导读:本文包含了算法代码论文开题报告文献综述及选题提纲参考文献，主要关键词:代码克隆,二进制可执行文件,后缀树,性能优化

算法代码论文文献综述

张凌浩,桂盛霖,穆逢君,王胜^[1]（2019）在《基于后缀树的二进制可执行代码的克隆检测算法》一文中研究指出如何发现代码克隆,是软件维护和软件侵权纠纷案件中的一个关键问题。由于商业保密等原因,在商业软件的侵权纠纷案中往往无法使用基于源代码比对的克隆检测技术。因此,针对这类无法获得源代码进行代码克隆检测的场景,文中提出一种针对二进制可执行文件分析的代码克隆检测方法。首先,通过反编译与指令类型抽象得到二进制可执行目标文件的指令类型序列;然后,对指令类型序列构建后缀树,利用后缀树的性质获取函数级的指令序列间的克隆信息,并通过消除沙砾指令进一步提高检测性能;最后,基于MIPS32指令集,使用Linux内核和经过混淆处理的代码分别作为克隆级别0-级别2与级别1-级别4的二进制可执行文件代码克隆测试样本,并与源代码检测工具进行对比测试。结果表明,所提算法在缺少源代码的场景下同样能进行细粒度的克隆分析,且对各级代码克隆均具有较好的检测性能。(本文来源于《计算机科学》期刊2019年10期）

梁子财^[2]（2019）在《数控加工G代码程序图形点位信息提取算法》一文中研究指出由于零件结构、加工工艺日益复杂,数控加工G代码程序的质量成为影响加工质量和效率的重要因素。如今数控技术与计算机仿真技术相结合,技术人员可以利用相关的G代码仿真加工软件对G代码的加工效果和正确性进行验证,而无需进行机床试加工,省时省材。针对G代码仿真加工软件的开发,关键在于正确提取G代码程序中的点位信息。因此本文基于Qt平台提出一种数控加工G代码程序图形点位信息提取算法。(本文来源于《科技视界》期刊2019年21期）

王卫红,谷永亮,毛怡伟,张政豪^[3]（2019）在《基于Ad-Sim算法的代码克隆检测方法》一文中研究指出代码克隆检测在代码抄袭检测、代码审查、软件更迭和错误检测等方面有重要作用。为提高代码克隆检测的准确率,结合TF-IDF及马尔科夫模型提出了一种改进的Simhash算法Ad-Sim。该算法首先对代码进行归一化预处理;其次在Simhash计算指纹签名的过程中使用TF-IDF计算各关键词权重,并利用马尔科夫模型优化关键词权重;最后比较待检测代码指纹签名的汉明距离相似度,从而判断待检测代码是否为克隆代码。实验结果表明:Ad-Sim算法在代码克隆检测上的准确率及召回率相比Simhash有所提升,尤其在少量代码的检测准确率上提升更明显。(本文来源于《浙江工业大学学报》期刊2019年04期）

殷康麒^[4]（2019）在《基于差异代码克隆搜索的代码块补全推荐算法研究》一文中研究指出代码补全推荐是软件工程领域的热门研究,可以提升软件开发效率。现有的代码补全推荐算法大都是针对关键词与语句粒度的,这种粒度的推荐所能提供的代码信息量较小,因此存在效率不高的问题,而现代软件开发更需要若干代码行(称之为代码块)这样大粒度的代码推荐以提升代码推荐效率。为了实现大粒度代码补全推荐,需要在代码库中搜索出与待补全代码相似的代码,但由于待补全代码的不完整造成与完整代码有较大的差异,从而导致难以搜索出相似代码。近期一种新的能发现大差异(Large-gap)代码克隆的算法CCAligner被提出,使代码块粒度的代码补全推荐成为了可能。本文基于差异代码克隆算法改造,以及对现有大量的、高质量源码库的利用,提出了一种全新的代码块补全推荐算法。论文的主要工作和贡献如下:(1)差异代码克隆技术研究及改造本文通过使用大差异代码克隆算法在代码库中搜索出与待补全代码块相似的候选代码块,但由于大差异代码克隆算法是用于在一个代码集合中去发现彼此是克隆的所有差异代码对,而本文是在代码集合中搜索出与某个待补全代码块相似的差异代码块,两者对算法搜索的要求不同,因此需要进行改造以降低计算成本和提升针对性。针对上述问题,我们将大差异代码克隆算法的查找模式从多对多改为一对多,增加预处理将与待补全代码块无关的代码块全部过滤,并通过计算实验选取优化的算法参数。实验结果表明,改造后的算法在5M行的代码库中的相似代码检测时间只有原算法的10.7%;对于滑动窗口数为5、误配数为1、相似度阈值为0.5的算法参数,可以将原算法参数的F值提升10%以上。(2)代码块补全推荐算法设计与实现在上面的工作基础上,我们进一步对搜索结果中候选代码块进行补全推荐算法设计。由于代码库中存在大量重复代码,为防止相同或相近的候选代码被重复推荐,因此本文通过对搜索出的结果(候选代码)进行聚类使得相同或相近的代码块作为一类推荐。此外,为保证推荐代码的有用性,需要对聚类后的候选代码块进行打分排序,让相关性高的候选代码块优先被推荐。本文根据问题特点选取DBSCAN作为聚类算法对搜索结果进行聚类,聚类后我们从每个类别中选取一个代码块作为代表,然后从代码出现的频率、代码的语法与语义相似度叁个方面对代码块进行相关性打分,并按照得分顺序对代码进行补全推荐。实验结果表明,在收集的Android Social Network数据集上本文方法进行了放回和不放回计算实验,Top-3准确率分别达到93.75%和68.75%;本文方法相对于仅能尾部代码块补全推荐方法进行了比较,Top-1准确率提升了20%至30%。(本文来源于《中国科学技术大学》期刊2019-05-30）

周鹏^[5]（2019）在《软件FUZZ中代码分支检测算法研究与实现》一文中研究指出随着互联网技术的进一步发展,计算机系统上承载着越来越多的数据,因此其安全性日益重要。软件漏洞是危害计算机信息系统安全的重要原因之一,攻击者可以通过软件漏洞实现对未授权系统的访问及更改。尽管在软件开发的各个环节都有代码安全性测试,但多方面因素导致程序漏洞无法避免。二进制程序中常见的漏洞类型有缓冲区溢出、格式化字符串、整数溢出、越界读写、条件竞争和逻辑漏洞等,不同漏洞在原理上和利用方式上会有所区别,但最终的目标都是控制程序EIP寄存器。模糊测试是发现软件漏洞的重要方法之一。目前具有代表性的模糊测试工具是AFL,通过代码插桩反馈的程序分支信息筛选种子,有效提高了种子变异的效率。尽管AFL结合了业界广泛使用的种子变异算法和程序插桩技术,但AFL在处理程序中的数据校验代码时依然乏力。为了解决这类问题,研究人员尝试在模糊测试中引入动态符号执行技术,但在使用中同样受到了其他因素的限制,例如路径爆炸、运行环境依赖复杂、效率低下等。本文旨在解决符号执行在模糊测试中应用的难点问题,创新性地提出了基于符号执行的代码分支检测算法,并在此基础之上设计了一套模糊测试系统。本文针对符号执行引擎的特点提出了基于数据流的状态切割技术和镜像种子树状态追踪算法。首先将程序执行状态按照输入流片段进行切割,在此基础上建立可追踪状态依赖关系的镜像种子树,最终实现了运行环境的快速恢复。同时从软件优化的角度提出了库函数模拟执行优化技术,有效提升了库函数调用速度,从而提升了符号执行模拟器子系统的运行速度。本文最终实现了一套原型测试系统SymbolFuzz,并从公开CTF比赛中选取了 10道不同种类的赛题作为测试样本,将实验结果与AFL在代码覆盖率、漏洞数量、平均漏洞时间叁个方面进行了对比。从实验效果来看,本文提出并实现的SymbolFuzz系统相对于AFL可以在更短时间内达到更高的代码覆盖率和漏洞数,从而验证了本文设计思路的有效性及可行性。(本文来源于《北京邮电大学》期刊2019-05-28）

李翼宏,刘方正,杜镇宇^[6]（2019）在《一种改进主动学习的恶意代码检测算法》一文中研究指出传统的恶意代码检测技术依赖于大量的已标记样本,然而新出现的恶意代码的标记数量往往较少,使得传统的机器学习检测方法难以取得较好的检测效果。针对该问题,研究了一种改进主动学习的恶意代码检测算法,提出了基于最大距离(Maximum Distance)的样本选择策略和基于最小估计风险(Minimum Risk Estimate)的样本标记策略,实现了已标记样本较少情况下的恶意代码检测。实验结果显示,相比于未使用主动学习的方法,该算法的总体检测效果更好,在已标记样本数量占比为10%的情况下,其比随机选择策略的主动学习的效果更好,在时间性能上比人工标记策略的主动学习效果更好。(本文来源于《计算机科学》期刊2019年05期）

郎大鹏,丁巍,姜昊辰,陈志远^[7]（2019）在《基于多特征融合的恶意代码分类算法》一文中研究指出针对多数恶意代码分类研究都基于家族分类和恶意、良性代码分类,而种类分类比较少的问题,提出了多特征融合的恶意代码分类算法。采用纹理图和反汇编文件提取3组特征进行融合分类研究,首先使用源文件和反汇编文件提取灰度共生矩阵特征,由n-gram算法提取操作码序列;然后采用改进型信息增益(IG)算法提取操作码特征,其次将多组特征进行标准化处理后以随机森林(RF)为分类器进行学习;最后实现了基于多特征融合的随机森林分类器。通过对九类恶意代码进行学习和测试,所提算法取得了85%的准确度,相比单一特征下的随机森林、多特征下的多层感知器和Logistic回归算法分类器,准确率更高。(本文来源于《计算机应用》期刊2019年08期）

梁欢,朱宸震,刘金波,杨志发^[8]（2019）在《基于太阳能电池车内降温方法算法原理及程序代码》一文中研究指出为了创造舒适的驾驶环境、减轻因车内高温环境所造成的意外情况和生命危险,需有效的控制车内温度。本文在基于太阳能电池车内降温方法工作原理介绍的基础上,研究了车内保持温度的基本算法、编写计算机程序语言,为设计车内保温和降温产品设计提供理论支持。(本文来源于《吉林交通科技》期刊2019年01期）

刘艳斌^[9]（2019）在《基于深度学习框架的代码自动生成算法研究》一文中研究指出根据设计图编写计算机代码是开发人员为客户构建网站和移动应用程序而进行的一项非常典型任务,但编写代码是一件非常烦闷和重复的事情,消耗程序员大量的时间和精力。Pix2code是一个端对端的深度学习模型框架,输入图像用户页面自动生成代码,正确率达77%。但Pix2Code模型由相对简单的算法组成,其使用的数据集也很小,无法投入真正的实际使用。本文首先对传统代码自动生成技术和深度学习基础理论进行了探讨,并试图使用更复杂的算法和一些正则化方法改进模型。Pix2code主要分叁大模块,使用卷积神经网络的视觉模型,使用长短期记忆网络的语言模型和解码层,结合两种算法的优势生成代码。新算法在测试集的正确率从原始模型的77%提升到了85%。结果也表明:(1)残差网络的特征提取能力强,使在视觉模型运用了该算法以后整个系统的稳定性有所提升,泛化能力增强,但是测试集的正确率提升不太明显。在没有增加训练的轮数下训练集的正确率得到了比较大的提升,增加了系统以后提升的可能性。(2使用双向长短期记忆网络优化视觉模型和解码层以后,系统的鲁棒性提升明显,模型也变得更加稳定,测试集的正确率大幅度提升。通过加入正则化也能减轻过拟合的情况。在原始系统解码层中加入dropout正则化就没有明显的效果。双向长短期记忆网络在处理这种上下文内容有明显结构和内容关联的任务有比较明显的优势。虽然基于深度学习算法来生成代码还处于初级的研究阶段,通过本研究已显示出巨大的潜力,随着研究的不断进行,最终完全由计算机系统编写能上线运行的大型程序将成为现实。(本文来源于《重庆邮电大学》期刊2019-03-12）

傅依娴,芦天亮,张学军^[10]（2019）在《基于Cuckoo平台的HDBSCAN恶意代码聚类算法》一文中研究指出泛在网络日益受到各种各样的恶意代码攻击,已经严重威胁到各个领域的信息安全和网络安全。为了分析不同种类恶意代码之间的异同性,通过搭建Cuckoo沙箱平台模拟恶意代码运行环境研究其聚类情况,以此来获得恶意样本模拟运行的行为分析报告;在特征提取上为了全面覆盖恶意代码的主要行为,结合了动态行为特征和内存特征;之后利用t-SNE机器学习算法来对特征属性实现非线性降维;最后对传统的DBSCAN算法进行改进,将改进后的算法HDBSCAN结合恶意代码的行为特征来完成恶意代码的聚类。实验结果表明,相比于经典聚类算法,改进后的聚类算法提高了聚类质量,获得了更好的聚类效果,因此具有较高的可行性。(本文来源于《信息技术与网络安全》期刊2019年01期）

算法代码论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

由于零件结构、加工工艺日益复杂,数控加工G代码程序的质量成为影响加工质量和效率的重要因素。如今数控技术与计算机仿真技术相结合,技术人员可以利用相关的G代码仿真加工软件对G代码的加工效果和正确性进行验证,而无需进行机床试加工,省时省材。针对G代码仿真加工软件的开发,关键在于正确提取G代码程序中的点位信息。因此本文基于Qt平台提出一种数控加工G代码程序图形点位信息提取算法。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

算法代码论文参考文献

[1].张凌浩,桂盛霖,穆逢君,王胜.基于后缀树的二进制可执行代码的克隆检测算法[J].计算机科学.2019

[2].梁子财.数控加工G代码程序图形点位信息提取算法[J].科技视界.2019

[3].王卫红,谷永亮,毛怡伟,张政豪.基于Ad-Sim算法的代码克隆检测方法[J].浙江工业大学学报.2019

[4].殷康麒.基于差异代码克隆搜索的代码块补全推荐算法研究[D].中国科学技术大学.2019

[5].周鹏.软件FUZZ中代码分支检测算法研究与实现[D].北京邮电大学.2019

[6].李翼宏,刘方正,杜镇宇.一种改进主动学习的恶意代码检测算法[J].计算机科学.2019

[7].郎大鹏,丁巍,姜昊辰,陈志远.基于多特征融合的恶意代码分类算法[J].计算机应用.2019

[8].梁欢,朱宸震,刘金波,杨志发.基于太阳能电池车内降温方法算法原理及程序代码[J].吉林交通科技.2019

[9].刘艳斌.基于深度学习框架的代码自动生成算法研究[D].重庆邮电大学.2019

[10].傅依娴,芦天亮,张学军.基于Cuckoo平台的HDBSCAN恶意代码聚类算法[J].信息技术与网络安全.2019

标签：代码克隆; 二进制可执行文件; 后缀树; 性能优化;

算法代码论文-张凌浩,桂盛霖,穆逢君,王胜

算法代码论文文献综述

算法代码论文开题报告

算法代码论文参考文献

猜你喜欢