零序列的子序列论文-朱志静

零序列的子序列论文-朱志静

导读:本文包含了零序列的子序列论文开题报告文献综述及选题提纲参考文献,主要关键词:时间序列,分段线性表示,趋势,相似度量

零序列的子序列论文文献综述

朱志静[1](2019)在《基于趋势和特征子序列的时间序列数据挖掘研究》一文中研究指出在当今的万物互联的大数据时代下,人类活动的各行各业都会产生数据,随着科技一次又一次的革新和发展及随着时间的流逝,数据量正在极速增长中。这些数据广泛存在于商业、气象学、农业、生物科学以及生态学等方面。例如商业市场中我们观察每周的利润,月度价格指数,年度销售数量;气象学中观察每日高温和低温,年降水量和干旱指数以及每小时风速等。这些数据中包含着很多有用的信息,若能将其完整且细致的挖掘出来,将对人类社会做出极大的贡献。但是由于这些数据范围广、数据量大,导致原始序列具有数据维度高,干扰因素多以及实时更新动态变化等特性。这些特性直接导致从原始序列中直接进行知识挖掘成为了一项复杂度极高,准确度极低甚至不可取的工作。为了能解决这些特性带来的数据挖掘上的问题,我们需要对原始数据进行有效的预处理步骤。时间序列预处理步骤的关键部分就是时间序列的分段线性表示工作以及时间序列的相似性度量工作。故而,本文将对这两个方面的工作进行相应的研究,以期数据预处理工作能达到更好的效果。本文前两章综述了本文的研究背景及意义和研究现状。本文的主要研究创新点和相应的工作主要在叁、四、五叁章中,可以总结为以下几方面内容:(1)针对目前数据的数据量巨大、高维度高复杂度的特点,以及目前已有方法分段压缩率不够高的缺点,本文的第叁章通过分析时间序列的几何形态特征,研究时间序列向上、向下趋势的几何形态,提出了上、下滤波点及上、下滤波线概念。利用上、下滤波点线对趋势的几何特性进行了分析,提出一种基于全局趋势判断方法。进一步提出一种基于趋势的时间序列分段线性表示方法,该方法的复杂度为(7)(8)On,便于编程实现。实验结果表明,与其他同类算法比较,本文算法得到的线段数目较少,逼近程度也不错。(2)针对传统欧式距离队序列值依赖较高的缺点,本文第四章统筹运用几何学中的点,角,边叁要素,点值差距,序列趋势变化以及形态差异,将几个方面都考虑到位。所提算法整合点值差距,序列趋势变化以及形态差异叁个几何特征,构建出叁角形形态距离,以此为阈值去分析两条序列的微观点距离和宏观趋势距离,从而度量出两条序列的相似性。我们将其命名为基于自适应叁角形距离的算法(Adaption Triangle Distance,ATD)算法。ATD算法实验结果表明,ATD算法对时间序列对的度量效率进行大幅度的提升。于此同时,本方法的对时间序列对的度量准确度比传统的度量算法高很多。(3)针对传统相似性度量算法无法动态处理翘楚的问题,本文第五章提出了一种基于趋势的特征子序列的时间序列度量方法。该方法引入信号中的尺度空间理论,从随机位置和长度中选择多个子序列被划分为较短的间隔用以捕获时间序列数据的信息。对于每个间隔,提取拟合回归线的趋势、值的平均差和方差等特征用以提供序列的形态、分布的情况。从这些子序列中计算出的特征生成一个新的数据集,其中每个子序列的特征提供一个实例,每个时间序列形成一个包。为每个实例定义一个标签此来度量不同位置的属性和原始序列的拓展。这提供了一个不同于DTW却和其一样可以处理翘曲的基于特征的方法。我们称之为基于自适应特征子序列的时间序列相似度量算法(Adaption and Feature Sentence,AFS)算法。与主流算法和ATD算法相比,当需要进行度量的两条时间序列长度不相同或者时间跨度不相同时,算法可以动态且自动地完成时间序列相似度量工作而无需额外的人工对序列进行维度对等处理。很大程度上降低了时间和空间复杂度。(本文来源于《江南大学》期刊2019-06-01)

王雁楠,杨育峰,杨国红,张莉,陈献功[2](2019)在《甘薯IbSSI基因启动子序列的克隆及瞬时表达分析》一文中研究指出植物可溶性淀粉合成酶(soluble starch synthase, SS)在植物支链淀粉的合成中起着关键作用,其主要负责支链的延伸。前期我们从甘薯中克隆到IbSSI基因并对其进行了表达分析及功能验证,发现该基因在甘薯中的表达受到外源蔗糖的诱导以及昼夜节律的调控。本研究在此基础上利用染色体步移法克隆到IbSSI基因1 811 bp的启动子序列。PlantCARE在线分析表明IbSSI启动子序列富含TATA-box和CAAT-box两个基本元件,还含有与昼夜节律、光照、蔗糖、逆境响应及组织特异表达等相关的顺式作用元件。将IbSSI基因全长启动子及其6个启动子5'端缺失片段分别替换植物表达载体pBI121的CaMV 35S启动子并在本生烟草(Nicotiana benthamiana)叶片中进行瞬时表达。GUS染色结果表明不同长度片段的启动子驱动β-葡萄糖醛酸酶基因(GUS)表达的能力有所差异,其中-200 bp~-369 bp区段以及-1 015 bp~-1 304 bp区段可能存在着增强转录的重要顺式作用元件。本研究揭示了IbSSI基因受外源蔗糖诱导表达及昼夜节律调控的原因,并为进一步阐明IbSSI基因在甘薯淀粉生物合成中的作用提供了科学依据。(本文来源于《分子植物育种》期刊2019年20期)

李兴芬,苗雅慧,孙永江,张孟娟,张凌云[3](2019)在《青杄PwPEBP基因及其启动子序列的克隆与表达分析》一文中研究指出【目的】通过研究青杄中的PwPEBP基因及其启动子的表达特性及生物学功能,探究PEBP基因在植物生长发育过程中响应逆境胁迫的功能及作用机制。【方法】本研究从青杄转录组测序中获得PwPEBP的c DNA序列,利用TMHMM、GOR4等在线软件对PwPEBP蛋白进行生物信息学分析,以此为基础通过PCR技术克隆得到PwPEBP开放阅读框(ORF)序列;同时对其在不同组织与不同逆境及激素处理中的表达水平进行了RT-qPCR技术分析;采用染色体步移法克隆PwPEBP的启动子序列,并利用在线软件BDGP和PlantCARE对PwPEBP启动子序列进行基础启动子区域、转录起始位点和顺式作用元件的预测;最后通过农杆菌瞬时转化烟草法验证PwPEBP启动子的功能。【结果】PwPEBP cDNA长度为1 408 bp,开放阅读框共585 bp,编码194个氨基酸。PwPEBP蛋白分子式为C_(966)H_(1 484)N_(250)O_(299)S_6,无信号肽和跨膜结构域,为亲水蛋白,含有25个磷酸化位点;进化树分析显示,PwPEBP蛋白与北美云杉的PEBP单独聚成一簇,属于新的PEBP蛋白。组织特异性分析显示,PwPEBP在成熟叶中表达量最高,嫩叶中表达量最低;PwPEBP在各激素及逆境诱导下均有表达,但对盐处理无响应。克隆的PwPEBP启动子序列长度为903 bp,其具有响应GA、ABA、SA、MeJA的顺式作用元件。GUS染色及Luc定量实验显示,PwPEBP启动子均能响应GA、ABA、MeJA和SA外源激素及干旱、高温、低温等逆境胁迫。【结论】青杄中PwPEBP基因广泛响应干旱、低温、高温等非生物胁迫,其中对干旱胁迫最为敏感,同时还参与了ABA、GA、MeJA和SA激素的信号通路。(本文来源于《北京林业大学学报》期刊2019年04期)

梁珂豪,孙永江,袁义杭,张凌云[4](2019)在《青杄转录因子PwNAC30及其启动子序列的克隆与表达分析》一文中研究指出该研究以青杄(Picea wilsonii)为实验材料,通过PCR从青杄的cDNA文库中克隆得到一个NAC转录因子,命名为PwNAC30。生物信息学分析显示,PwNAC30开放阅读框1 179bp,共编码392个氨基酸,在其N端存在保守的NAM(no apical meristem)结构域,可分为A~E等5个亚结构域。多序列对比和系统进化树分析显示,PwNAC30蛋白与同为云杉属的北美云杉(Picea sitchensis)聚为一类。启动子克隆分析显示,PwNAC30基因启动子上存在脱落酸(ABA)、赤霉素(GA)、茉莉酸甲酯(MeJA)、TC-rich repeats等激素和逆境响应元件,在GA、ABA、MeJA、低温、干旱、盐的处理下,其启动子活性均明显增强。荧光定量PCR分析表明,PwNAC30在球果中的表达量最高,而在花粉和种子中的表达量最低。PwNAC30对于盐、干旱、低温、ABA、MeJA、GA处理均有响应,尤其对盐、干旱、MeJA的响应最为显着。亚细胞定位结果显示,PwNAC30蛋白定位于细胞核与细胞质,主要定位于细胞核中。酵母单杂及双杂结果表明,PwNAC30蛋白的全长和N端没有转录激活活性,而C端有转录激活活性,且PwNAC30自身能形成同源二聚体。研究表明,青杄PwNAC30基因可以作为一个转录因子发挥作用,其转录激活活性在C端,且自身能够形成同源二聚体结构;PwNAC30基因广泛参与了ABA、GA、MeJA等激素的信号通路,并对盐、干旱、低温处理有响应。(本文来源于《西北植物学报》期刊2019年01期)

薄素玲,李宏,张强,杨振华,包通嘎拉[5](2018)在《果蝇成熟mRNA序列与其相应内含子序列的匹配特征分析》一文中研究指出研究成熟mRNA序列与其相应内含子序列的相互作用规律对于揭示基因表达调控具有重要意义.本文以黑腹果蝇第一号染色体蛋白质编码基因序列为研究对象,采用SmithWaterman局域比对的方法,在mRNA序列和内含子序列之间进行匹配性比对分析.研究发现剪切后的内含子序列与基因的5′UTR序列和3′UTR序列的相对匹配频数高于编码(CDS)序列.最佳匹配片段集合的G+C含量分布范围很广,其分布中心与3′UTR序列最为接近,5′UTR序列次之,距离CDS序列最远,这是导致两端UTR序列与内含子序列有较高匹配强度的原因.最佳匹配片段的配对率主要分布在68%~75%之间,最可几长度为20bp左右,最佳匹配片段的序列特征与miRNA相似.结果显示内含子与mRNA之间的这种匹配模式是参与基因调控的一种可能方式.(本文来源于《内蒙古大学学报(自然科学版)》期刊2018年06期)

吴东根,周小安[6](2018)在《基于最长公共子序列的DNA序列相似性分析》一文中研究指出近半个世纪以来,大量有关DNA序列相似性分析的方法被不同领域的专家、学者挖掘出来,在生物信息学领域取得了不错的进展。针对DNA序列的相似性分析,本文提出了一种新方法,即最长公共子序列方法,以7种病毒DNA序列和10种伊球蛋白(globin)基因的第一个外显子DNA序列作为分析对象,来验证最长公共子序列方法对DNA相似性的分析是否有效,并分析其优缺点。实验结果表明,最长公共子序列方法对DNA序列的相似性分析是有效的。(本文来源于《智能计算机与应用》期刊2018年06期)

高立许[7](2018)在《光伏光折变晶体中孤子序列的研究》一文中研究指出光折变空间孤子是目前非性光学领域的热点课题之一。对于光折变晶体中周期波导结构内非线性光波的传播,当光束自身的非线性效应与离散衍射效应相互平衡时,光波以稳定的波形向前传播且传播常数落在间隙内,产生间隙孤子。间隙孤子具有低功率、快响应、强非线性的特点使得间隙孤子在全光通信、光开关、光路由和全光光子器件等方面具有潜在应用价值。本文应用平面波展开法、修正的平方算子迭代法、基于对称分步傅立叶算法的光束传播法等数值计算方法,对奇偶间隙孤子序列和奇偶阶扭曲孤子序列的特性进行了详细分析研究。首先,基于非线性薛定谔方程和横向线性折射率调制的光折变晶体,应用数值模拟算法详细研究了自聚焦光伏光折变晶体中制作的波导阵列内奇偶间隙孤子序列以及奇偶阶扭曲孤子序列的形成及其特性,分析得出这些孤子只存在于半无限间隙内,其能流值随传播常数的增大而增大。奇偶间隙孤子的存在区域随光格子深度的减小而减少,传播常数可以控制高阶间隙孤子边瓣和中间瓣的强度,当传播常数增大时,高阶间隙孤子中间瓣的强度变小。奇偶阶扭曲孤子的存在区域随饱和参数的增大而减少,当传播常数增大时,高阶扭曲孤子最外侧边瓣的强度变小。研究发现这些奇偶间隙孤子和扭曲孤子都是稳定的。然后,研究了自散焦光伏光折变晶体中制作的波导阵列内奇偶间隙孤子序列以及奇偶阶扭曲孤子序列的形成及其特性,分析得出这些孤子的只存在于第一有限间隙内,其能流值随传播常数的增大而减小。奇偶间隙孤子的存在区域也随光格子深度的减小而减少,当传播常数增大时,高阶间隙孤子两侧边瓣的强度变大。奇偶阶扭曲孤子的存在区域随饱和参数的增大而减少,当传播常数增大时,高阶扭曲孤子中间瓣的强度变大。研究发现奇偶间隙孤子是稳定的,奇偶阶扭曲孤子是不稳定的。(本文来源于《天津工业大学》期刊2018-06-30)

张鹤华,刘嘉欣,罗朝兵,张凌云[8](2018)在《青杄转录因子PwERF8及其启动子序列的克隆与分析》一文中研究指出【目的】AP2/ERF是植物的转录因子家族之一,广泛参与生物胁迫和非生物胁迫过程。从青杄中克隆ERF类转录因子PwERF8及其启动子序列,研究PwERF8基因的表达特性、启动子序列功能,并进一步分析其对非生物胁迫的响应模式,为深入了解青杄的耐逆调控机制提供理论基础。【方法】通过RACE-PCR技术获得青杄PwERF8编码区全长序列。通过染色体步移技术克隆PwERF8启动子序列。通过PlantCARE在线软件和BDGP在线软件预测启动子序列上的顺式作用元件、基础启动子和转录起始位点,构建pBI121-PwERF8 promoter∷GUS启动子表达载体,采用农杆菌注射法瞬时转化烟草叶片来验证启动子的功能。构建PGBKT7-PwERF8载体,转化AH109酵母菌株验证其转录激活活性。构建35S∷PwERF8-GFP融合表达载体,通过PEG介导瞬时转化拟南芥原生质体进行基因表达的亚细胞定位分析,应用RT-qPCR技术分析该基因的组织特异性和在非生物胁迫下的时空表达特征。【结果】PwERF8基因的编码区全长序列共1 191 bp,开放阅读框共765 bp,开放阅读框翻译成255个氨基酸。在肽链的N端具有1个保守的由58个氨基酸组成的AP2结构域,在C端含有1个EAR转录抑制基序(DLNLPP)。组织特异性表达分析表明,PwERF8在茎、根、针叶、花粉、种子中均有表达,但在花粉中,PwERF8的表达量最高,其次为种子,在茎中的表达量最少。酵母单杂交试验表明,PwERF8蛋白不具有转录激活活性。亚细胞定位分析发现PwERF8蛋白主要定位于细胞核。将启动子序列进行在线分析显示PwERF8含有GA、ABA、JA和SA等激素的顺式作用元件。进一步在烟草中瞬时过表达PwERF8启动子并用GUS染色显示,PwERF8启动子能响应GA、ABA、MeJA和SA等外源激素的处理。GA、ABA、MeJA和SA分别处理青杄幼苗3、6、12 h后,PwERF8的表达量均显着高于对照,干旱、4℃和42℃处理均能诱导PwERF8表达,但盐胁迫不能诱导其表达。【结论】青杄转录因子PwERF8参与了GA、ABA、JA和SA激素的信号通路,广泛响应干旱、温度逆境等非生物胁迫,且可能作为一个转录抑制子在细胞核中发挥功能。(本文来源于《林业科学》期刊2018年03期)

王旭,欧阳继红,陈桂芬[9](2018)在《基于多重序列所有公共子序列的启发式算法度量多图的相似度》一文中研究指出提出了启发式A*算法度量任意多个图的相似度方法,该算法将多图表示多重序列,在多重序列的匹配点上计算多重序列的所有公共子序列数,得到的所有公共子序列数用来度量多图的相似度。该算法避免了在非匹配点上的冗余计算,最大化后缀序列的所有公共子序列数的启发函数值,将访问的节点限制在两个序列匹配的子集,减少了计算节点的个数。与现有度量图的相似度方法相比,该算法不仅可以度量任意多个图的相似度,而且计算过程简单,通过启发信息的引导能够快速地度量多图的相似度。(本文来源于《吉林大学学报(工学版)》期刊2018年02期)

李城,沙俊淞,武文[10](2018)在《基于最长公共子序列的微博谣言溯源研究》一文中研究指出手机等移动设备的普及,使得微博等社交网络成为信息发布和共享的重要渠道。但同时,大量的反动、虚假、色情信息充斥着整个网络,谣言的恶劣影响日益突出,一些谣言的出现已经严重影响了人们对网络信息的获取和正常使用。如何对网络中的各类谣言进行检测,挖掘出谣言的源头及传播方式成为当前公安网信部门亟需解决的问题。本文以微博谣言为例,根据现有的LCS最长公共子序列算法在构造序列表格时做了相应的改进,并根据改进的LCS算法比对分析微博谣言。初步实验表明,改进后的算法可以更高效地对微博谣言进行比对溯源,从而帮助公安机关发现微博谣言源头。(本文来源于《计算机与现代化》期刊2018年01期)

零序列的子序列论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

植物可溶性淀粉合成酶(soluble starch synthase, SS)在植物支链淀粉的合成中起着关键作用,其主要负责支链的延伸。前期我们从甘薯中克隆到IbSSI基因并对其进行了表达分析及功能验证,发现该基因在甘薯中的表达受到外源蔗糖的诱导以及昼夜节律的调控。本研究在此基础上利用染色体步移法克隆到IbSSI基因1 811 bp的启动子序列。PlantCARE在线分析表明IbSSI启动子序列富含TATA-box和CAAT-box两个基本元件,还含有与昼夜节律、光照、蔗糖、逆境响应及组织特异表达等相关的顺式作用元件。将IbSSI基因全长启动子及其6个启动子5'端缺失片段分别替换植物表达载体pBI121的CaMV 35S启动子并在本生烟草(Nicotiana benthamiana)叶片中进行瞬时表达。GUS染色结果表明不同长度片段的启动子驱动β-葡萄糖醛酸酶基因(GUS)表达的能力有所差异,其中-200 bp~-369 bp区段以及-1 015 bp~-1 304 bp区段可能存在着增强转录的重要顺式作用元件。本研究揭示了IbSSI基因受外源蔗糖诱导表达及昼夜节律调控的原因,并为进一步阐明IbSSI基因在甘薯淀粉生物合成中的作用提供了科学依据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

零序列的子序列论文参考文献

[1].朱志静.基于趋势和特征子序列的时间序列数据挖掘研究[D].江南大学.2019

[2].王雁楠,杨育峰,杨国红,张莉,陈献功.甘薯IbSSI基因启动子序列的克隆及瞬时表达分析[J].分子植物育种.2019

[3].李兴芬,苗雅慧,孙永江,张孟娟,张凌云.青杄PwPEBP基因及其启动子序列的克隆与表达分析[J].北京林业大学学报.2019

[4].梁珂豪,孙永江,袁义杭,张凌云.青杄转录因子PwNAC30及其启动子序列的克隆与表达分析[J].西北植物学报.2019

[5].薄素玲,李宏,张强,杨振华,包通嘎拉.果蝇成熟mRNA序列与其相应内含子序列的匹配特征分析[J].内蒙古大学学报(自然科学版).2018

[6].吴东根,周小安.基于最长公共子序列的DNA序列相似性分析[J].智能计算机与应用.2018

[7].高立许.光伏光折变晶体中孤子序列的研究[D].天津工业大学.2018

[8].张鹤华,刘嘉欣,罗朝兵,张凌云.青杄转录因子PwERF8及其启动子序列的克隆与分析[J].林业科学.2018

[9].王旭,欧阳继红,陈桂芬.基于多重序列所有公共子序列的启发式算法度量多图的相似度[J].吉林大学学报(工学版).2018

[10].李城,沙俊淞,武文.基于最长公共子序列的微博谣言溯源研究[J].计算机与现代化.2018

标签:;  ;  ;  ;  

零序列的子序列论文-朱志静
下载Doc文档

猜你喜欢