张雨:基于多个k值的DNA序列不对齐比对方法的研究论文

张雨:基于多个k值的DNA序列不对齐比对方法的研究论文

本文主要研究内容

作者张雨(2019)在《基于多个k值的DNA序列不对齐比对方法的研究》一文中研究指出:随着下一代基因测序技术的发展,生物学领域产生了大量的数据,对这些生物数据的处理是一个急需解决的问题,同时也是计算机,数学等其他多个领域面临的一个重大挑战,生物信息学在这个背景下产生了。DNA序列之间的比对是生物信息学研究问题之一,并在很多方面有着重要的应用。序列比对旨在发现两条DNA序列之间的相似程度,进而揭示对应物种之间的联系。过去50年里,大量的序列比对方法被提出,目前主要的序列比对方法包括两大类:对齐的方法和不对齐的方法。对齐的方法,往往需要庞大的时间开销,对于两条序列的长度也有一定的要求,无法处理大规模的数据,在当前数据爆炸的环境下已经不适用。不对齐的方法通常是通过从序列中提取长度为k的短序列片段,并统计序列片段的一些统计特征来定义序列相似度。不对齐方法虽然能够快速的得到序列比对结果,但是也面临着两个急需解决的问题:因为这一类方法依赖参数k来提取序列特征,不同的k对于算法的性能影响很大,确定最优的k值往往需要进行大量的实验进行尝试,这给实际应用带来了困难;此外,这一类方法在解决相关问题的准确度上仍然需要进一步提高。本文为解决不对齐比对方法的两个问题,提出综合多个k值的思想。本文使用了两种加权方法用于区分不同k值提取特征的重要性,提高不对齐方法的精度;另外,本文也引入机器学习方法到序列比对领域,处理序列比对相关问题。基于综合多个k值的思想,本文首先对传统的不对齐的D2类型方法上进行了改进,应用了两种不同的加权方案:最大离差法和遗传算法,对序列特征进行加权处理,提出了两种增强的不对齐比对方法。本文设计并实现了两个序列比对任务,实验结果表明,我们提出的方法在没有额外增加时间复杂度的情况下能高效准确地处理大规模的生物DNA序列,并且相较于以前的不对齐方法,我们的方法所获得实验准确率更高。此外,本文也提出一种用于序列比对的机器学习模型,仍然使用多个k值提取序列特征,对特征进行编码后,采用卷积神经网络对序列比对任务进行处理,相关实验结果表明,相较于以前的不对齐方法,使用卷积神经网络的比对模型准确率更高。

Abstract

sui zhao xia yi dai ji yin ce xu ji shu de fa zhan ,sheng wu xue ling yu chan sheng le da liang de shu ju ,dui zhe xie sheng wu shu ju de chu li shi yi ge ji xu jie jue de wen ti ,tong shi ye shi ji suan ji ,shu xue deng ji ta duo ge ling yu mian lin de yi ge chong da tiao zhan ,sheng wu xin xi xue zai zhe ge bei jing xia chan sheng le 。DNAxu lie zhi jian de bi dui shi sheng wu xin xi xue yan jiu wen ti zhi yi ,bing zai hen duo fang mian you zhao chong yao de ying yong 。xu lie bi dui zhi zai fa xian liang tiao DNAxu lie zhi jian de xiang shi cheng du ,jin er jie shi dui ying wu chong zhi jian de lian ji 。guo qu 50nian li ,da liang de xu lie bi dui fang fa bei di chu ,mu qian zhu yao de xu lie bi dui fang fa bao gua liang da lei :dui ji de fang fa he bu dui ji de fang fa 。dui ji de fang fa ,wang wang xu yao pang da de shi jian kai xiao ,dui yu liang tiao xu lie de chang du ye you yi ding de yao qiu ,mo fa chu li da gui mo de shu ju ,zai dang qian shu ju bao zha de huan jing xia yi jing bu kuo yong 。bu dui ji de fang fa tong chang shi tong guo cong xu lie zhong di qu chang du wei kde duan xu lie pian duan ,bing tong ji xu lie pian duan de yi xie tong ji te zheng lai ding yi xu lie xiang shi du 。bu dui ji fang fa sui ran neng gou kuai su de de dao xu lie bi dui jie guo ,dan shi ye mian lin zhao liang ge ji xu jie jue de wen ti :yin wei zhe yi lei fang fa yi lai can shu klai di qu xu lie te zheng ,bu tong de kdui yu suan fa de xing neng ying xiang hen da ,que ding zui you de kzhi wang wang xu yao jin hang da liang de shi yan jin hang chang shi ,zhe gei shi ji ying yong dai lai le kun nan ;ci wai ,zhe yi lei fang fa zai jie jue xiang guan wen ti de zhun que du shang reng ran xu yao jin yi bu di gao 。ben wen wei jie jue bu dui ji bi dui fang fa de liang ge wen ti ,di chu zeng ge duo ge kzhi de sai xiang 。ben wen shi yong le liang chong jia quan fang fa yong yu ou fen bu tong kzhi di qu te zheng de chong yao xing ,di gao bu dui ji fang fa de jing du ;ling wai ,ben wen ye yin ru ji qi xue xi fang fa dao xu lie bi dui ling yu ,chu li xu lie bi dui xiang guan wen ti 。ji yu zeng ge duo ge kzhi de sai xiang ,ben wen shou xian dui chuan tong de bu dui ji de D2lei xing fang fa shang jin hang le gai jin ,ying yong le liang chong bu tong de jia quan fang an :zui da li cha fa he wei chuan suan fa ,dui xu lie te zheng jin hang jia quan chu li ,di chu le liang chong zeng jiang de bu dui ji bi dui fang fa 。ben wen she ji bing shi xian le liang ge xu lie bi dui ren wu ,shi yan jie guo biao ming ,wo men di chu de fang fa zai mei you e wai zeng jia shi jian fu za du de qing kuang xia neng gao xiao zhun que de chu li da gui mo de sheng wu DNAxu lie ,bing ju xiang jiao yu yi qian de bu dui ji fang fa ,wo men de fang fa suo huo de shi yan zhun que lv geng gao 。ci wai ,ben wen ye di chu yi chong yong yu xu lie bi dui de ji qi xue xi mo xing ,reng ran shi yong duo ge kzhi di qu xu lie te zheng ,dui te zheng jin hang bian ma hou ,cai yong juan ji shen jing wang lao dui xu lie bi dui ren wu jin hang chu li ,xiang guan shi yan jie guo biao ming ,xiang jiao yu yi qian de bu dui ji fang fa ,shi yong juan ji shen jing wang lao de bi dui mo xing zhun que lv geng gao 。

论文参考文献

  • [1].基于多尺度熵的DNA序列相似性分析[D]. 赵宇.深圳大学2018
  • [2].同源DNA序列中间隔位点的缺失数据处理研究[D]. 秦雪瑞.福建农林大学2018
  • [3].基于词化向量的DNA序列特异性预测[D]. 黄立群.苏州大学2018
  • [4].生物序列进化树的构建[D]. 柳菁筠.海南师范大学2008
  • [5].基于小波变换的基因预测算法研究[D]. 杜竹青.江苏科技大学2013
  • [6].DNA序列比对中基于AVX指令集的BWT算法研究[D]. 杜博雅.东北农业大学2017
  • [7].图形表示在生物信息学中的研究及应用[D]. 肖文莉.燕山大学2016
  • [8].数学模型在生物序列结构比较中的研究及其应用[D]. 刘倩.燕山大学2013
  • [9].基于GMM的基因外显子预测算法研究[D]. 张雪莹.天津大学2012
  • [10].基于马尔科夫模型的蛋白质亚细胞位点预测方法[D]. 赵娟.上海师范大学2011
  • 读者推荐
  • [1].多参考基因短序列比对工具MUGI的优化与移植[D]. 郭超.深圳大学2018
  • [2].面向DNA/RNA大数据的序列比对算法[D]. 高津蕾.天津工业大学2019
  • [3].基于Hadoop平台的下一代测序数据处理算法研究[D]. 方银瑞.西北农林科技大学2019
  • [4].里德堡原子电磁诱导光栅的反常特性研究[D]. 马丹丹.华东师范大学2019
  • [5].基于冷原子系综单光子时间模式调控与研究[D]. 陈朋.华东师范大学2019
  • [6].WSe2单分子薄膜表面形貌及其光致发光性质的研究[D]. 李碧琳.华东师范大学2019
  • [7].化学镀制备双磁性层复合结构丝及其磁性研究[D]. 向松.华东师范大学2019
  • [8].基于M-Z干涉仪实现任意相位锁定的研究[D]. 吴书贺.华东师范大学2019
  • [9].基于机器视觉的PC轨道梁在役锚固螺杆自动定位与检测系统研究[D]. 蒋昀赟.重庆大学2008
  • [10].基于PC的乒乓球机器人的机器视觉的程序设计[D]. 杜森森.浙江大学2006
  • 论文详细介绍

    论文作者分别是来自华东师范大学的张雨,发表于刊物华东师范大学2019-07-02论文,是一篇关于序列比对论文,最大离差论文,遗传算法论文,卷积神经网络论文,华东师范大学2019-07-02论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自华东师范大学2019-07-02论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  

    张雨:基于多个k值的DNA序列不对齐比对方法的研究论文
    下载Doc文档

    猜你喜欢