蛋白质超家族论文-马淑杰,李前忠,杨乌日吐,左永春

蛋白质超家族论文-马淑杰,李前忠,杨乌日吐,左永春

导读:本文包含了蛋白质超家族论文开题报告文献综述及选题提纲参考文献,主要关键词:模体功能,亲疏水特征,物理化学特征,模体结构特征

蛋白质超家族论文文献综述

马淑杰,李前忠,杨乌日吐,左永春[1](2009)在《蛋白质超家族模体保守性及物理化学性质的分析》一文中研究指出分析了全β类4个典型的蛋白质超家族中模体的功能,发现免疫球蛋白超家族和纤维结合蛋白类型Ⅲ超家族中的模体有相似的结构,但是它们行使不同的功能.血小板-白细胞C激酶底物的同源物结构域超家族和核酸结合超家族中的模体类型较多,虽然这些模体只是部分结构相似,然而它们却在各自的超家族中分别执行着相同的功能.文章进一步运用统计学方法研究了蛋白质超家族中保守模体的亲疏水特征、物理化学特征和结构特征.结果表明,模体差异有显着意义的残基存在于序列模体的保守位点上,相同的序列模体具有相似的二级结构.这些特征将对进一步识别超家族提供帮助.(本文来源于《内蒙古大学学报(自然科学版)》期刊2009年06期)

马淑杰[2](2009)在《蛋白质超家族模体特征的分析与超家族的识别》一文中研究指出模体是蛋白质进化过程中的保守区域,并且能够反映蛋白质超家族之间亲缘关系,它们通常对蛋白质的功能起重要作用。因此,蛋白质超家族的模体特征分析及蛋白质超家族的识别对研究蛋白质结构和功能具有重要意义。本文以蛋白质超家族中的模体和序列为研究对象,用生物统计学和生物数学中的方法,从蛋白质超家族中的模体功能特征分析及相对位置分布统计、信息特征提取和蛋白质超家族识别这叁个方面进行了研究。主要研究工作概括如下:首先,从蛋白质结构分类数据库(SCOP)中选出16个具有代表性的蛋白质超家族,构建了序列一致性小于等于25%和40%的蛋白质超家族数据库。利用ScanProsite和MEME模体搜索工具,提取了所构建的数据库的序列模体及模体的位置信息和功能信息,并对其进行整合;进一步分析了超家族中模体的结构和功能特征,统计分析了模体相对于序列N端和C端的位置分布及模体出现的频次,结果发现:在含有一种或是多种类型模体的蛋白质超家族中,模体在序列中的位置分布均呈现一定的规律性。本文统计和分析的模体特征以及模体的位置保守性规律能为蛋白质超家族的识别和蛋白质相互作用网络的建立提供有力帮助。其次,用生物统计学中的单因素方差分析方法,对16个具有代表性的蛋白质超家族的氨基酸组分、物理化学性质分类特征及其组合特征等进行均值检验,提取出具有差异显着性的特征。此方法不仅有效地降低了特征向量的维数,而且为蛋白质超家族识别提供了新的参数。另外,还统计了已知功能的模体和基于统计意义发现的模体在各个超家族中出现的频数。本文定义的模体频数首次作为一种新的特征被用于蛋白质超家族的识别。最后,以下叁种方法所选取的参数用于蛋白质超家族的识别:1.将数据库中超家族的20个氨基酸组分、400个二肽组分、亲疏水特征、物理化学特征以及这些特征的组合输入到最小离散增量算法中,对蛋白质超家族进行预测;2.以具有统计显着性的特征及其组合特征作为新参数模式进行了预测;3.将模体频数和具有差异显着性的特征参数模式结合,形成新的参数模式输入算法完成预测。对比以上叁种方法,发观使用多参数组合信息较单参数信息所得预测精度最高。相对第一种参数选取方法,具有统计显着性特征的参数预测结果较好,并能有效降低特征向量的维数。第叁种方法在选取了显着特征的前提下结合模体频数进行预测,其中以400+M为参数模式进行预测时结果最好,全α、全β、α/β和α+β蛋白质结构类中超家族Jackknife检验的总体预测精度依次是83.5%、87.1%、84.3%和83.1%。与前两种方法选取的参数进行预测的结果相比,总体预测精度提高了约10%。(本文来源于《内蒙古大学》期刊2009-03-30)

马淑杰,李前忠,左永春[3](2009)在《全α类蛋白质超家族保守模体特征的分析》一文中研究指出选取了全α类中序列一致性小于等于40%和25%的四个有代表性的超家族,并从中提取序列模体和结构模体,分析了其结构和功能特征的差异.结果表明,细胞色素C超家族和EF手超家族中已知功能的模体类型相对单一,而类同源域超家族和翼螺旋DNA结合域超家族中序列模体类型较多,但是主要以HTH和wHTH两种结构模体为主.进一步对模体的相对位置进行统计分析和比较,发现无论是已知功能的模体还是基于统计学方法识别的模体,它们相对于序列N端和C端的分布均呈现一定的规律性.这些特征和规律将对蛋白质超家族的识别以及结构域的研究提供有力的帮助.(本文来源于《内蒙古大学学报(自然科学版)》期刊2009年02期)

刘芬,李前忠[4](2006)在《基于氨基酸亲疏水分布的最小离散增量方法识别蛋白质超家族》一文中研究指出摆脱目前常用的基于特征模体来识别超家族的方法,引入单个氨基酸的物理化学性质(亲疏水性质)及其在氨基酸序列中的分布特征参数(分段的方法),利用最小离散增量算法对属于同一结构类的不同超家族进行了识别,总预测成功率令人满意.选取了全α类、全β类、α+β类、α/β类中的各4个超家族分别进行了识别.对全α类的4个超家族,se lf-cons istency检验和jack-kn ife检验可达83.0%,81.2%;对全β类的4个超家族,两种检验均为80.9%;对α+β类的4个超家族,两种检验总成功率最高分别为88.6%,88.0%;识别α/β类的4个超家族时两种检验的结果分别为69.3%和67.6%.(本文来源于《内蒙古大学学报(自然科学版)》期刊2006年04期)

刘芬[5](2006)在《基于不同氨基酸分布的蛋白质超家族的识别》一文中研究指出蛋白质超家族是由一个或多个不同的蛋白质家族组成的,这些家族成员序列间的一致性(identity)较低,但从它们的结构和功能特征上看却有来自共同起源的可能性,因此通过序列比对寻找它们共同的序列模体成为常用的识别蛋白质超家族和家族的方法。除了序列比较的方法外,氨基酸的物理化学性质也是决定蛋白质折迭的重要因素,其中氨基酸的亲水模式和疏水模式被认为是最保守的。 本文首先选取了单个氨基酸的物理化学性质及其关联分布作为参数(定义为“3p参数”),使用最小离散增量方法对同一结构类中的不同超家族进行了识别。对全α类的4个超家族self-consistency检验为83.1%,jack-knife检验为80.7%;对全β类的4个超家族self-consistency检验和jack-knife检验均为80.9%;对α+β类的4个超家族两种检验的结果分别为88.6%,88.0%;识别α/β类的4个超家族时,两种检验的结果分别为69.3%,67.6%。 脯氨酸、甘氨酸、半胱氨酸对结构的形成有巨大的影响,鉴于这叁种氨基酸的特殊性,在选取单个氨基酸的物理化学性质及其关联分布作为参数的同时,把它们在各个分段中出现的个数作为另外一部分参数,称之为“6p参数”。以6p参数作为最小离散增量方法中的离散源,对同一组超家族进行识别的结果较选取3p参数有了较大的提高,对全α类的4个超家族进行识别,self-consistency检验和jack-knife检验分别为93.1%,92.9%;对全β类的4个超家族,两种检验的结果分别为91.5%和90.5%;对α+β类的4个超家族,两种检验的结果分别为92.0%,91.8%;对α/β类的4个超家族,两种检验的结果分别为78.3%,(本文来源于《内蒙古大学》期刊2006-05-20)

季星来,孙之荣[6](2002)在《基于结构的蛋白质超家族进化研究》一文中研究指出蛋白质超家族是在序列、结构和功能上具有一定的相似性和同源性而被认为具有相应的进化关系的若干类蛋白质家族的合称。蛋白质超家族的进化研究一直是分子进化研究领域的一个重要研究课题,对于在大的范围和大的进化尺度上进行蛋白质的序列、(本文来源于《第九次全国生物物理大会学术会议论文摘要集》期刊2002-05-01)

黄京飞,刘次全[7](2002)在《从基于结构定义的序列模体识别蛋白质的超家族》一文中研究指出以进化上相距较远的蛋白质酪氨酸磷酸酶Ⅰ和Ⅱ为例,通过结构比较和基于结构的序列比对及共同保守区域残基替换模式的分析,定义了基于结构的序列模体.利用这种新的模体对SWISS-PROT和TrEMBL蛋白质序列库进行搜索,可特异性地同时识别磷酸酶Ⅰ和Ⅱ,其识别正确率可达98.4%.而在此之前,尚未见可同时识别磷酸酶Ⅰ和Ⅱ序列模体的报道.(本文来源于《科学通报》期刊2002年08期)

王克夷[8](2001)在《小分子蛋白质超家族和配体工程》一文中研究指出蛋白质分子量一般较大,对它们的改造和设计经常遇到困难.由于蛋白质不是单独行使其功能的,几乎都通过和其它分子的相互作用完成它们的功能.这些和蛋白质相互作用的分子经常是蛋白质分子的底物,也可称为配体.一般说来,配体的分子往往比蛋白质分子小.因此,设计一些配体分子影响蛋白质的功能,进而也可(本文来源于《中国毒理学会生物毒素毒理专业委员会第4次、中国生物化学与分子生物学会毒素专业组第5次学术研讨会论文摘要》期刊2001-09-01)

胡胜民,王钰,贺福初,孙之荣[9](2000)在《蛋白质超家族分子进化研究的一种新方法》一文中研究指出选取丝氨酸蛋白酶超家族作为研究对象, 采用SSAP算法从结构比较的层次上进行蛋白质超家族分子进化的研究. 分析了相同或相似物种中酶结构和功能的演化、鼠类胰蛋白酶突变体结构的聚类关系以及不同抑制剂对牛?-胰蛋白酶天然结构的影响, 探索了结构比较对于蛋白质工程中定点突变改造蛋白质结构与功能以及蛋白质抑制剂设计等方面的指导作用. 基于结构比较的方法是蛋白质分子进化研究的一种新方法.(本文来源于《科学通报》期刊2000年21期)

黄京飞[10](2000)在《蛋白质超家族的序列识别》一文中研究指出人类基因组测序计划的完成,将使大量的新基因及其相应蛋白质的氨基酸序列被确定.目前在各类蛋白质数据库中,已经积累了大量的蛋白质序列信息,然而已知的结构信息却非常有限.那么,对于一个新获得的氨基酸序列,人们能否给出其相应蛋白质的结构及功能信息呢?这正是结构生物信息学和结构基因组学所要回答的主要问题.大量研究表明,同一家族中的蛋白质具有相似的序列、结构,通(本文来源于《西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集》期刊2000-06-30)

蛋白质超家族论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

模体是蛋白质进化过程中的保守区域,并且能够反映蛋白质超家族之间亲缘关系,它们通常对蛋白质的功能起重要作用。因此,蛋白质超家族的模体特征分析及蛋白质超家族的识别对研究蛋白质结构和功能具有重要意义。本文以蛋白质超家族中的模体和序列为研究对象,用生物统计学和生物数学中的方法,从蛋白质超家族中的模体功能特征分析及相对位置分布统计、信息特征提取和蛋白质超家族识别这叁个方面进行了研究。主要研究工作概括如下:首先,从蛋白质结构分类数据库(SCOP)中选出16个具有代表性的蛋白质超家族,构建了序列一致性小于等于25%和40%的蛋白质超家族数据库。利用ScanProsite和MEME模体搜索工具,提取了所构建的数据库的序列模体及模体的位置信息和功能信息,并对其进行整合;进一步分析了超家族中模体的结构和功能特征,统计分析了模体相对于序列N端和C端的位置分布及模体出现的频次,结果发现:在含有一种或是多种类型模体的蛋白质超家族中,模体在序列中的位置分布均呈现一定的规律性。本文统计和分析的模体特征以及模体的位置保守性规律能为蛋白质超家族的识别和蛋白质相互作用网络的建立提供有力帮助。其次,用生物统计学中的单因素方差分析方法,对16个具有代表性的蛋白质超家族的氨基酸组分、物理化学性质分类特征及其组合特征等进行均值检验,提取出具有差异显着性的特征。此方法不仅有效地降低了特征向量的维数,而且为蛋白质超家族识别提供了新的参数。另外,还统计了已知功能的模体和基于统计意义发现的模体在各个超家族中出现的频数。本文定义的模体频数首次作为一种新的特征被用于蛋白质超家族的识别。最后,以下叁种方法所选取的参数用于蛋白质超家族的识别:1.将数据库中超家族的20个氨基酸组分、400个二肽组分、亲疏水特征、物理化学特征以及这些特征的组合输入到最小离散增量算法中,对蛋白质超家族进行预测;2.以具有统计显着性的特征及其组合特征作为新参数模式进行了预测;3.将模体频数和具有差异显着性的特征参数模式结合,形成新的参数模式输入算法完成预测。对比以上叁种方法,发观使用多参数组合信息较单参数信息所得预测精度最高。相对第一种参数选取方法,具有统计显着性特征的参数预测结果较好,并能有效降低特征向量的维数。第叁种方法在选取了显着特征的前提下结合模体频数进行预测,其中以400+M为参数模式进行预测时结果最好,全α、全β、α/β和α+β蛋白质结构类中超家族Jackknife检验的总体预测精度依次是83.5%、87.1%、84.3%和83.1%。与前两种方法选取的参数进行预测的结果相比,总体预测精度提高了约10%。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

蛋白质超家族论文参考文献

[1].马淑杰,李前忠,杨乌日吐,左永春.蛋白质超家族模体保守性及物理化学性质的分析[J].内蒙古大学学报(自然科学版).2009

[2].马淑杰.蛋白质超家族模体特征的分析与超家族的识别[D].内蒙古大学.2009

[3].马淑杰,李前忠,左永春.全α类蛋白质超家族保守模体特征的分析[J].内蒙古大学学报(自然科学版).2009

[4].刘芬,李前忠.基于氨基酸亲疏水分布的最小离散增量方法识别蛋白质超家族[J].内蒙古大学学报(自然科学版).2006

[5].刘芬.基于不同氨基酸分布的蛋白质超家族的识别[D].内蒙古大学.2006

[6].季星来,孙之荣.基于结构的蛋白质超家族进化研究[C].第九次全国生物物理大会学术会议论文摘要集.2002

[7].黄京飞,刘次全.从基于结构定义的序列模体识别蛋白质的超家族[J].科学通报.2002

[8].王克夷.小分子蛋白质超家族和配体工程[C].中国毒理学会生物毒素毒理专业委员会第4次、中国生物化学与分子生物学会毒素专业组第5次学术研讨会论文摘要.2001

[9].胡胜民,王钰,贺福初,孙之荣.蛋白质超家族分子进化研究的一种新方法[J].科学通报.2000

[10].黄京飞.蛋白质超家族的序列识别[C].西部大开发科教先行与可持续发展——中国科协2000年学术年会文集.2000

标签:;  ;  ;  ;  

蛋白质超家族论文-马淑杰,李前忠,杨乌日吐,左永春
下载Doc文档

猜你喜欢