最长公共子串论文-叶心

最长公共子串论文-叶心

导读:本文包含了最长公共子串论文开题报告文献综述及选题提纲参考文献,主要关键词:近似匹配,编辑距离,动态规划,后缀数组

最长公共子串论文文献综述

叶心[1](2014)在《支持编辑距离约束的近似最长公共子串匹配及其优化算法》一文中研究指出目前许多信息都以文本的形式存放在计算机中,所以基于文本的信息检索技术,如最长公共子串匹配问题一直是文本管理、程序分析等领域的经典问题,长期以来受到广泛地关注与研究。然而最长公共子串的要求过于严格,在实际应用中,两个局部非常相似的文本其中的公共部分往往不是完全精确匹配的,因此需要提供支持近似匹配的最长公共子串匹配方法。目前尚未有相关技术的报道。因此,本文重点研究支持编辑距离约束的近似最长公共子串匹配问题。本文首先综述了现有的字符串近似匹配技术,并基于此,提出了一种基于动态规划的算法,这个算法首先用最长公共子串的动态规划算法求出公共子串,再用编辑距离和最长公共子序列的动态规划方法,计算具有公共前缀的子串组成的比对区域,找到所有支持编辑距离约束的近似公共子串,最后进行长度验证找到支持编辑距离约束的近似最长公共子串。该算法可以保证O(kmn)的时间复杂度。为了进一步提高算法的效率,本文提出了基于后缀数组的公共子串匹配优化算法。该算法先采用后缀数组的方法求出所有公共子串,再将相邻连接距离不大于编辑距离阈的公共子串连接起来构造验证集,在构造验证集的过程中采用了基于公共子串位置和基于公共子串间距离的过滤策略,最后用启发式的方法在验证集中找出支持编辑距离约束的近似最长公共子串,提高了查询效率。最后,本文在叁个不同的真实数据集上测试了这两种算法的性能,基于动态规划的算法,由于需要对所有具有相同前缀开始的比对区域进行动态规划计算,所以算法的性能比基于公共子串的查询算法差。实验发现,基于公共子串的算法由于采用了基于公共子串位置和公共子串间距离的过滤技术,所以该算法的性能跟两个串的公共子串的个数和长度有关系,如果公子串个数比较少,且长度都比较长,算法的性能越好。(本文来源于《东北大学》期刊2014-06-01)

王开云,孔思淇,付云生,潘泽友,马卫东[2](2013)在《两种基于双向比较的最长公共子串算法》一文中研究指出查找两个给定字符串的最长公共子串(LCSstr)是一类重要字符串分析问题,在字符串近似匹配、计算机病毒特征码对比等方面有着广泛的用途.最长公共子串算法目前主要包括动态规划算法(LCSstrDP)和后缀数组算法(LCSstrSA),分别用于短串和长串的最长公共子串计算.前者代码简洁,但计算速度较慢,后者速度很快但算法非常复杂.提出两种基于双向比较的最长公共子串算法,即LCSstrSeL和LCSstrSCeL.LCSstrSeL跨越已有的最长公共子串长度,与LCSstrDP相比,代码同样简洁,平均计算效率提高近一个数量级,并且不需要额外的存储空间.LCSstrSCeL是在LCSstrSeL的基础上,增加字符跨越、连续同值区间跨越等机制,平均效率较LCSstrSeL亦有一定程度的提高,内存开销与LCSstrDP相近,在中小长度的字符串LCSstr计算中,平均计算效率高于LCSstrSA,某些情况下的计算效率可达到亚线性的速度.(本文来源于《计算机研究与发展》期刊2013年11期)

王开云[3](2013)在《两种基于双向比较的最长公共子串算法》一文中研究指出查找两个给定字符串的最长公共子串(LCSstr)是一类重要字符串分析问题,在字符串近似匹配、计算机病毒特征码对比等方面有着广泛的用途。最长公共子串算法目前主要包括动态规划算法(LCSstrDP)和后缀数组算法(LCSstrSA),分别用于短串和长串的最长公共子串计算。前者代码简洁、但计算速度较(本文来源于《中国工程物理研究院科技年报:2013年版》期刊2013-11-01)

赵福生[4](2011)在《求最长公共子串的两类解法比较》一文中研究指出在字符串的运算中,求两个字符串的最长公共子串是一个重要的算法,有着广泛的应用价值。一般认为一共有两大类解法,之所以叫两大类,是因为每一类都可以再细致划分。前一类易理解,占用内存单元大,时间复杂度低,后一类复杂,最好和KMP算法结合。(本文来源于《现代计算机(专业版)》期刊2011年25期)

张毅超,车玫,马骏[5](2007)在《求最长公共子串问题的算法分析》一文中研究指出高效求解2个字符串的最长公共子串(Longest Common Substring)是实现很多字符串算法的关键。文中首先给出了求解LCP问题的动态规划算法,广义后缀树算法,研究并分析了这两种算法,得出动态规划算法易于理解,但时间复杂度较高;广义后缀树算法的时间复杂度较低,但实现较为复杂并且广义后缀树占用的空间也较多。最后提出了一个新算法,该算法使用2个字符串的广义后缀数组,在保持和广义后缀树时间复杂度相等的基础上,可以简单地实现并且占用较少的空间。(本文来源于《计算机仿真》期刊2007年12期)

殷新春,陈凌[6](1998)在《求最长公共子串长度的算法》一文中研究指出给出求2个字符串最长公共子串(LCS)长度的递归算法、递推算法和心动阵列算法.对2个长度分别为n,m(n≥m)的字符串,递归算法的最坏时空复杂性为(m+n)!/(m!n!),而递推算法的时空复杂性分别仅为m+nm+O(1),2m+O(1).在心动阵列算法中,需m个PE和n+m的时间.最后给出了一个应用实例.(本文来源于《东南大学学报》期刊1998年06期)

左恩栋,胡庆[7](1988)在《最长公共子串的快速搜索算法》一文中研究指出本文提出了两个字符串之间最长公共子串这一概念,并在对它进行理论分析的基础上,给出了两种求取最长公共子串的快速算法。(本文来源于《南京理工大学学报(自然科学版)》期刊1988年01期)

最长公共子串论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

查找两个给定字符串的最长公共子串(LCSstr)是一类重要字符串分析问题,在字符串近似匹配、计算机病毒特征码对比等方面有着广泛的用途.最长公共子串算法目前主要包括动态规划算法(LCSstrDP)和后缀数组算法(LCSstrSA),分别用于短串和长串的最长公共子串计算.前者代码简洁,但计算速度较慢,后者速度很快但算法非常复杂.提出两种基于双向比较的最长公共子串算法,即LCSstrSeL和LCSstrSCeL.LCSstrSeL跨越已有的最长公共子串长度,与LCSstrDP相比,代码同样简洁,平均计算效率提高近一个数量级,并且不需要额外的存储空间.LCSstrSCeL是在LCSstrSeL的基础上,增加字符跨越、连续同值区间跨越等机制,平均效率较LCSstrSeL亦有一定程度的提高,内存开销与LCSstrDP相近,在中小长度的字符串LCSstr计算中,平均计算效率高于LCSstrSA,某些情况下的计算效率可达到亚线性的速度.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

最长公共子串论文参考文献

[1].叶心.支持编辑距离约束的近似最长公共子串匹配及其优化算法[D].东北大学.2014

[2].王开云,孔思淇,付云生,潘泽友,马卫东.两种基于双向比较的最长公共子串算法[J].计算机研究与发展.2013

[3].王开云.两种基于双向比较的最长公共子串算法[C].中国工程物理研究院科技年报:2013年版.2013

[4].赵福生.求最长公共子串的两类解法比较[J].现代计算机(专业版).2011

[5].张毅超,车玫,马骏.求最长公共子串问题的算法分析[J].计算机仿真.2007

[6].殷新春,陈凌.求最长公共子串长度的算法[J].东南大学学报.1998

[7].左恩栋,胡庆.最长公共子串的快速搜索算法[J].南京理工大学学报(自然科学版).1988

标签:;  ;  ;  ;  

最长公共子串论文-叶心
下载Doc文档

猜你喜欢