肿瘤基因表达数据论文-宋慧慧,李原,葛峥,黄培林

肿瘤基因表达数据论文-宋慧慧,李原,葛峥,黄培林

导读:本文包含了肿瘤基因表达数据论文开题报告文献综述及选题提纲参考文献,主要关键词:FOXO1,数据挖掘,成熟B细胞肿瘤,数据库

肿瘤基因表达数据论文文献综述

宋慧慧,李原,葛峥,黄培林[1](2018)在《基于数据挖掘分析FOXO1在成熟B细胞肿瘤中的表达及靶基因预测》一文中研究指出目的:利用数据挖掘分析FOXO1在B细胞肿瘤中的表达情况,并进一步探讨FOXO1对B细胞肿瘤的影响。方法:利用Oncomine数据库分析FOXO1基因在B细胞肿瘤中mRNA水平的变化。通过BIOGPS分析人体正常组织和其相应的肿瘤组织中FOXO1基因的表达差异。利用GEPIA做FOXO1基因的表达水平与B细胞肿瘤患者生存期的相关性分析。在String-DB数据库中探索FOXO1基因在细胞信号转导通路中的位置以及与其关系密切的上下游基因。结果:与正常组织相比,B细胞肿瘤组织中FOXO1基因在mRNA水平呈低表达,FOXO1基因的表达水平与B细胞肿瘤患者的总体生存时间无明显相关性(Log-rank P=0.39)。EP300、JUN、MYC、STAT1、FOS、SPI1、E2F1等基因与FOXO1有明显或潜在的相互作用。结论:大样本数据挖掘能迅速获取B细胞肿瘤组织中FOXO1表达的相关信息,为探索FOXO1在B细胞肿瘤发生发展中的作用提供科学的理论基础。(本文来源于《南京医科大学学报(自然科学版)》期刊2018年12期)

刘健[2](2018)在《基于机器学习的肿瘤基因表达谱数据分析方法研究》一文中研究指出近年来,国内外研究人员将机器学习理论和方法引入到生物信息学领域,通过对基因表达谱数据的综合分析来发现蕴含在生物学中的重要信息。本文针对肿瘤基因表达谱数据,以机器学习为理论基础,通过对特征基因选择、肿瘤分类和肿瘤聚类等问题展开研究与探索,提出了一系列基于机器学习的肿瘤基因表达谱数据分析方法。主要研究内容如下:1.基于深度学习及矩阵分解的肿瘤特征基因选择。首先,针对深度学习模型无法很好地进行肿瘤特征基因选择的问题,提出一种基于样本学习及深度稀疏滤波的肿瘤特征基因选择方法;其次,基于最优均值算法和分块优化理论,提出一种基于最优均值的分块鲁棒特征基因选择方法,并对TCGA中的融合数据进行分析;最后,利用散度矩阵将基因表达谱数据中已知类别标签引入无监督算法中,提出一种监督型惩罚矩阵分解算法,从而对特征基因进行选择。2.基于样本扩充及深度学习的肿瘤样本分类。针对深度学习模型在进行肿瘤基因表达谱数据分类时训练样本严重不足的问题,提出一种基于降噪自动编码器的样本扩充方法,以获得大量的辅助样本。进一步,针对肿瘤样本分类问题,将所提样本扩充方法分别与两种深度学习模型相结合,设计了基于样本扩充的栈式自动编码器和基于样本扩充的1维卷积神经网络。3.基于低秩子空间分割的肿瘤样本聚类。传统子空间分割方法依赖谱聚类进行肿瘤基因表达数据聚类,针对此问题,利用离散约束来直接学习子空间的样本标签,提出了两种基于离散约束的低秩子空间肿瘤样本聚类方法。首先,考虑肿瘤基因表达谱数据内部的流形结构,提出一种基于离散约束及超图正则化的低秩子空间聚类算法;其次,为了消除肿瘤数据中极端离群值对聚类结果的影响,使用封顶范数来提高算法的鲁棒性,提出基于离散约束及封顶范数的鲁棒低秩子空间聚类算法。4.基于双超图正则化主成分分析的肿瘤双聚类。同时考虑肿瘤数据中的样本流形结构和基因流形结构,分别构建样本超图和基因超图来获取数据的局部几何信息,并将双超图作为主成分分析的正则项进行样本聚类和基因聚类,提出基于双超图正则化主成分分析的双聚类算法。(本文来源于《中国矿业大学》期刊2018-10-19)

赵全钢,陈国华,赵丽敏[3](2018)在《基于PSO-SVM的肿瘤特征基因表达数据分析》一文中研究指出在肿瘤细胞的优化识别研究中,基因芯片技术受到了广泛的关注.但目前采集到的基因表达数据存在着维度高、样本小的特点.为了处理肿瘤基因数据,建立肿瘤的分类预测模型,本文提出一种基于粒子群优化参数的支持向量机的预测方法,将其命名为BBPSO-SVM.该算法利用测试集数据评估建立分类模型,进而测算出最佳的惩罚参数和核函数参数,然后,对模型进行优化,从而使模型具有最优的分类性能.我们设计的实验通过5倍交叉验证的方式进行检测,并与CR-SVM算法,RFE-SVM算法,ACA-SVM算法,RS-SVM算法等主流的特征选择算法进行比较.结果证明,和相对于参比的算法,该方法有效的提升了识别精度,并且,识别的效率较好.(本文来源于《德州学院学报》期刊2018年04期)

谢光磊[4](2018)在《肿瘤亚型分析中针对基因表达数据差分进化特征选择算法的研究》一文中研究指出生命的遗传物质DNA,我们可以将其蕴含的若干基因同时监测,利用芯片杂交技术和测序技术在单次试验中测度这些基因的表达水平,然后基于大数据进行科学分析研究,以帮助我们了解生命的奥秘。特别是二代测序技术的逐渐发展产生了大量的基因组数据,替代了 Sanger测序技术的地位。另外叁代、四代测序技术的崭露头角体现了其大片段、单分子等测序特点所带来的优势。这些高通量测量技术在打破传统实验手段局限性的同时,其快速发展伴随着各种生物基因组数据的累积。另外大型、跨学科、跨国的研究项目相继启动及展开,其相应综合型生物数据库互联网平台为科学研究和精准医疗做出了巨大的贡献。因此,挖掘和解释数据的模式与规律成为当今的热点主题,特别是生物信息学中各种方法的应用,成功解决了分类、聚类、关联分析等相应研究的问题。另外机器学习算法对基因表达数据模式识别能较智能化的识别具有生物学意义的基因,并使其在实际生活应用中帮助生物医学临床的诊断和治疗。其中各种特征选择方法的相继发展成为高通量基因表达数据集模式识别和基因筛选的常规手段。虽然监督学习的特征选择方法在对大数据集的学习中十分高效、快捷,但对于像基因表达数据这样高维的数据来说,随着维数的增加其计算效率迅速降低甚至成为一个NP问题。优化搜索算法的发展成功解决了该问题,其中应用最多的启发式优化搜索算法如各种进化算法发展迅速。在进化算法家族中遗传算法、差分进化算法在其优化搜索上展现了其独特的竞争力,其中差分进化算法以其鲁棒性、快速收敛等特点迅速成为研究人员关注的焦点。因此我们在基因表达数据集上使用Ahmed Al-Ani等人提出的一种随机种群进化优化算法---差分进化特征选择算法,解决特征基因选择问题。然而发现该算法的缺点,由此我们改进该算法适用于基因表达数据集,其中将控制进化速率的尺度因子视为一种偏态分布,然后基于染色体空间结构变动的事实改进基因排列的固定方式以及使种群波动性进化。另外考虑到机器学习中基因表达数据集普遍的类不平衡特性,将训练数据集和测试数据集保持其类别构成比几乎相同,同时利用权重精度评估分类器模型的性能,由此缓解牺牲少数类的训练影响。算法优化的适应度函数我们考虑了不同特征基因子集大小的影响,根据Dashtban M.等人提出的罚分策略,将适应度函数由权重精度和罚分项组成。另外,我们从Laura Cantini等人发现microRNA-mRNA互作网络中潜藏着分子亚型而获得灵感,在对于肿瘤亚型的研究中,将算法优化的特征基因子集与肿瘤多类亚型探索联系起来,然后特征基因构建样本关系网络,利用极大平面过滤图算法PMFG过滤该网络,并使用拓扑图形划分算法初步探索肿瘤亚型划分的可行性。在本研究工作中改进的差分进化特征选择算法即模拟了宏观的物种进化方式,又模拟了微观分子间位置关系的演变,以实现算法更近似模拟研究对象的活动规律。在真实的数据应用上,表现出该算法高效的计算能力和良好的结果。而且在肿瘤亚型拓扑探索研究中,我们将特征基因作为媒介构建样本关系网络,其中每个基因都能高效判别。然后以对照组作为一个独立社团为基准即参照物,利用PMFG算法过滤网络,拓扑划分方法实现肿瘤亚型的划分,而相应的特征基因集值得进一步研究分析。虽然没有验证拓扑划分的生物学意义,但我们的研究工作在大数据肿瘤背景下提供了借鉴之处。(本文来源于《南方医科大学》期刊2018-05-01)

李晨阳[5](2018)在《肿瘤基因表达数据的特征选择方法研究》一文中研究指出随着DNA测序技术的迅速发展,研究人员可以获取各种组织样本中的海量基因表达数据,这为从分子水平研究肿瘤发病机制提供了技术支持。医疗数据挖掘作为数据挖掘技术的主要研究方向之一,同时也是生物信息学的研究热点,基于基因表达数据的挖掘技术对发现致病基因、预测蛋白质功能以及疾病诊断与治疗等意义重大。由于基因固有的特点和DNA测序技术的局限性,所获取的数据往往表现出高维、小样本和高噪声等特点,因此传统的统计方法和模式识别方法难以直接应用于基因表达数据挖掘任务中。本文针对基因表达数据的特点,以特征基因的选择方法为主要研究方向,开展了以下几个方面的工作:(1)为了解决蚁群优化算法在搜索过程中收敛速度慢,易于陷入局部最优的问题,分别提出了改进的信息素更新策略和状态转移规则。在信息素更新策略中加入正反馈系数和蒸发因子,若蚂蚁在若干代内所得到的特征子集质量没有提高,则信息素蒸发因子将被自适应调节,从而加速信息素的蒸发;另一方面,信息素的蒸发反馈系数也自适应调整,减少蚁群的正反馈效应,从而提高蚁群算法的全局搜索能力。将随机策略和贪心策略相结合作为蚂蚁的状态转移规则,提高了蚁群的搜索性能,避免陷入局部最优的情况。(2)对不同算法在数据挖掘中的结合,提升分类算法的准确度进行研究,提出了一种基于随机森林与蚁群算法的特征选择方法,用于在较高维度的数据集中选取分辨能力强的特征子集。算法通过代价较小的特征评估方式计算启发式信息,采用自适应的信息素更新策略加速候选特征子集的搜索,并使用前向顺序选择策略从候选子集中构造出全局最优。实验结果表明,所提出的算法可以有效剔除冗余和无关特征,提升分类器的效率。(3)针对基因表达数据中存在大量无关基因,冗余基因和噪声基因的问题,提出了一种结合过滤式方法和蚁群算法的特征选择方法。算法首先通过ReliefF算法过滤掉含有较少分类信息的基因,然后把候选基因子集输入蚁群算法,在迭代改进的过程中选择最优基因子集。在肿瘤基因表达数据上的分类预测实验表明,本文提出的算法可以在基因较少的情况下得到较好的分类效果。(本文来源于《兰州交通大学》期刊2018-04-12)

高凌云[6](2018)在《基于机器学习和智能优化的肿瘤基因表达数据挖掘研究》一文中研究指出目的:DNA微阵列技术通过同步追踪大量基因的表达水平而得到基因表达谱数据,广泛应用于生物医学各个领域。基因表达数据的一个重要研究方向就是肿瘤等重大遗传性疾病的病理诊断与分类研究。肿瘤作为一种由特定基因序列和表达变异引起的疾病,其表达谱的出现为肿瘤学提供了一种全新的临床研究手段。因此,本文对肿瘤基因表达数据进行挖掘研究,可以为肿瘤的早期诊断和临床治疗提供重要依据。方法:肿瘤基因表达谱具有样本小、维度高、噪声大、冗余多和非线性等特点,给现有的分析处理工作带来了一定的挑战。机器学习算法中支持向量机(support vector machine,SVM)处理高维非线性数据有独特的优势。智能优化算法一般不要求目标函数和约束的连续性与凸性,能很好的适应数据中的不确定性。因此,本文采用机器学习和智能优化相关算法分析挖掘肿瘤基因表达数据。主要内容包括:(1)基于基因表达数据中存在的大量无关基因和冗余基因,提出信息增益(information gain,IG)结合SVM的两阶段混合方法选择信息基因。该方法采用IG去除肿瘤样本中的大量无关基因,再利用SVM进一步约减数据中的冗余基因;(2)研究了粒子群优化算法(particle swarm optimization,PSO)、人工蜂群算法(artificial bee colony,ABC)等智能优化方法,详细分析了它们在处理高维非线性问题时的优势;(3)提出PSO结合ABC算法优化SVM的分类方法。该方法将PSO算法的寻优结果作为ABC算法的初始值,可以更有效的搜索到SVM相关参数最优值。结果:将改进的算法应用到多组肿瘤样本数据中,结果表明信息增益IG结合SVM筛选信息基因的方法能够获得数目较少且质量较高的基因子集,并对获得的基因进行分析,发现这些基因对相应肿瘤的研究有重要临床意义,其中包括已经证实的以及尚未被发现的基因。另外,对于结合PSO和ABC智能优化方法优化SVM的分类模型,在多组肿瘤数据上的结果显示,和其他优化方法相比,该混合方法的鲁棒性较好且分类精度更高。结论:论文提出的方法能够获得高质量的信息基因子集,并且采用构建的分类模型对肿瘤样本进行分类可以获得更优的分类结果,验证了机器学习和智能优化算法处理肿瘤样本数据时的有效性,对肿瘤的早期诊断和临床治疗方案制定具有一定的潜在价值。(本文来源于《皖南医学院》期刊2018-03-01)

陈丹[7](2017)在《肿瘤基因表达谱数据的半监督分类方法研究》一文中研究指出随着微阵列技术的创新,基因表达谱数据在肿瘤亚型预测中显示出巨大前景。准确地预测基于基因表达数据的肿瘤类别,有助于为患者选择适当的治疗计划。然而,小样本量仍然是设计合理分类器的瓶颈。传统的监督分类器只能利用有标签的数据,大量没有充分后续信息的基因表达谱数据被忽略。半监督分类器通过引入无标签的基因表达谱数据的分布信息已经被证明可以显着提高分类模型的分类性能和泛化能力。本文主要针对基于基因表达谱数据的半监督分类方法进行深入分析,并提出了改进的半监督分类算法,以提高分类性能和数据泛化能力。主要的工作概况如下:针对直推式支持向量机(TSVM)需要通过样本空间中有标签样本分布评估无标签样本分布,在有标签样本数较少和无标签样本与有标签样本分布不同的情况下,很容易导致估计误差较大的问题。本文提出了一种基于渐进过滤的直推式向量机(PL-TSVM),通过对无标签样本的渐进过滤式标注,不仅可以避免因错误评估样本空间中数据分布而引发的学习器性能下降,而且可以在一定程度上过滤标注不一定准确的半标签样本,从而在一定程度上保证新加入工作集中有标签样本的标签正确性,进而降低错误累加,提高学习器性能。有效地解决了半监督学习中无标签样本与有标签样本分布不平衡的问题。在四个公共可用的基因表达谱数据集上进行了仿真实验,当无标签样本与有标签样本分布不平衡时,PL-TSVM算法性能显着优于其对比算法TS VM和S4 VM。考虑到不同样本错分具有不同的错分代价,将代价敏感策略引入PL-TSVM算法,通过评估样本数据与类中心的核距离,赋予样本数据不同的错分代价,得到一种基于代价敏感和渐进过滤的直推式向量机(CS-PL-TSVM)。在基因表达数据集上的仿真实验验证了该方法的优越性。(本文来源于《湖南大学》期刊2017-05-22)

冯森[8](2017)在《肿瘤基因表达谱数据特征选择方法研究》一文中研究指出随着计算机技术与信息技术的快速发展,在生物医学方面,越来越多的专家学者开始通过计算机技术来研究基因数据,从而完成对肿瘤的亚型分类与诊断。由于肿瘤基因表达谱数据的高维、小样本等特点,导致在获取数据的过程中掺杂了较多的无关基因以及冗余基因,而且这些信息很容易造成实验结果不理想,影响诊断结果。为了解决此类问题,针对肿瘤基因表达谱数据的特点,如何筛选出低冗余的特征信息,以及如何构造鲁棒性好、泛化能力较强的特征提取算法是本文要研究的重点。主要工作如下:(1)基于信噪比与随机森林的肿瘤特征基因选择方法。针对肿瘤基因表达谱数据的高维度、小样本等特点,传统分类方法会选出大量冗余基因信息,提出了一种基于信噪比与随机森林的肿瘤特征基因选择方法。首先使用信噪比过滤法去除冗余基因,从而获取分类属性较强的初选特征子集;然后采用随机森林算法对初选特征基因子集进行分类得出特征基因子集。实验结果表明,该算法能够快速高效地选择特征基因子集,与其他算法相比,该方法降低了时间复杂度,提高了分类的准确率。(2)为了设计出具有较强鲁棒性的改进的自组织映射(SOM)算法,针对传统的自组织映射算法采用欧式距离难以行之有效地描述基因之间的数值正、负等功能相似性,又考虑到粒子群优化算法的快速收敛性,本文提出了一种基于邻域互信息进行关联度量的SOM分类算法,并与粒子群优化算法相结合来实现最优特征子集的筛选。首先,采用改进的SOM算法对原始基因表达谱数据进行预处理,采用邻域互信息,对基因之间的相关性进行评估,赋予其相应的相似度,得到获胜神经元的权重;然后通过粒子群优化方法对相关特征子集进行评估,以确定最优特征子集。仿真实验表明,相比其他相关方法,该方法提取的特征基因数据较少,分类准确率较高,对于多分类的问题依然取得好的分类效果。(本文来源于《河南师范大学》期刊2017-05-01)

田丽[9](2017)在《基于反投影表示的肿瘤基因表达谱数据分类研究》一文中研究指出随着基因芯片技术的快速发展,我们可以快速准确地获得肿瘤基因表达谱数据.特征选择和样本分类是基于基因表达谱数据的肿瘤分类的两个基本问题.通过分析这些数据可以为肿瘤早期诊断和从分子层面上研究提供强有力的工具.近几年来基于稀疏表示的肿瘤分类技术受到越来越多的关注.然而基于稀疏表示的分类器存在以下问题:(1)高度依赖充足的训练样本;(2)忽略蕴含在测试样本中的信息;(3)重建误差的分类不稳定性.而且,设计高效且具有生物意义的基因选择方法是目前发展的趋势.针对以上问题,本文主要做了如下研究工作:一方面,提出了一种基于反投影表示和类别贡献率的肿瘤分类方法,并从理论上证明了该方法的可行性和稳定性.首先,通过挖掘嵌入在测试样本中的信息,构造了一种新的反投影表示模型以减小训练样本数目的影响;然后,为了匹配反投影表示模型完成分类,提出了一种新的分类准则——类别贡献率;最后定义了一种新的统计指标——分类稳定性指标,用于量化不同分类准则的稳定性.另一方面,在前一工作的基础之上,进一步提出了一种结合两阶段混合基因选择和反投影表示模型的肿瘤分类方法.两阶段混合基因选择方法的第一阶段是综合BW、SNR和F检验叁种过滤法的基因初选,第二阶段是基于统计Lasso方法对初选出的信息基因进行再次选择,得到可能的致病基因.进而,结合反投影表示模型完成分类.实验部分针对第一个工作,首先验证了反投影表示对小样本问题的有效性,然后利用分类稳定性指标验证了本文基于类别贡献率的分类准则的稳定性,最后进行了分类方法的鲁棒性测试;对于第二个工作,首先给出了基因选择的必要性和Lasso的可行性验证,然后借助不同阶段基于主成分分析的可视化投影分布图和分类性能验证两阶段混合基因选择方法的高效性.值得一提的是,进一步地借助该方法选出了候选致病基因并对这些基因进行了生物学分析.(本文来源于《河南大学》期刊2017-05-01)

余东海[10](2016)在《基于基因表达谱数据的肿瘤分类算法研究》一文中研究指出随着基因芯片技术的快速发展,越来越多的肿瘤基因得以测定,基因表达谱数据的获取也越来越简单,这使得肿瘤基因表达谱数据的分析已经逐渐成为肿瘤诊断和分类的常规步骤。因为原始基因表达谱数据具有高维、样本数量少以及类别分布不平衡等特点,使得基因表达数据难以被有效地使用。基因表达谱数据的高维特点可以通过采用一些比较合适的降维算法来剔除大量基因数据中的冗余基因,从而利用挖掘出的低维数据来表示原始的基因表达数据。基因表达数据的类别不平衡问题是指样本的类别数据分布不平衡问题,这种不平衡将使得分类器很难有效地对少类样本进行分类,而这将限制整体分类器的性能。针对肿瘤基因表达谱数据的类别不平衡问题,本文在极限学习机的基础上,提出了改进的加权极限学习机(Weight Extreme Learning Machine)构建分类模型,对肿瘤基因表达数据进行类别预测,从而达到诊断肿瘤的目的。并在此基础上加入改进PSO算法来提高WELM分类器的类别权值确定速度,使得分类器的分类效果和速度得到有效提升。本文主要研究内容和成果有:1、改进加权极限学习机算法研究。针对数据的了类别不平衡问题,将改进的加权极限血学习机(WELM)应用于肿瘤基因表达谱数据的分类。区别于极限学习机,改进WELM针对不同类别加入一个可调整类别权值,并通过将训练集数据的学习来确定该类别权值,对存在类别不平衡的数据分类时,提高其分类精度,而且由于类别权值的可调性,使其对于平衡数据集也具有较好的分类效果。实验证明,该方法能够明显提高不平衡数据少类的分类精度的同时,对于平衡数据也能保持很好的性能。2、针对改进加权极限学习机由于权值调整所带来的低效率性,在该算法基础上引入粒子群算法(PSO)更加高效的确定加权极限学习机的权值,从而提高算法的效率。实验表明,该算法能够快速有效地对基因表达谱数据进行分类,在保留改进加权极限学习机较高分类精度的基础上,有效提高算法的效率。(本文来源于《东北大学》期刊2016-11-01)

肿瘤基因表达数据论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

近年来,国内外研究人员将机器学习理论和方法引入到生物信息学领域,通过对基因表达谱数据的综合分析来发现蕴含在生物学中的重要信息。本文针对肿瘤基因表达谱数据,以机器学习为理论基础,通过对特征基因选择、肿瘤分类和肿瘤聚类等问题展开研究与探索,提出了一系列基于机器学习的肿瘤基因表达谱数据分析方法。主要研究内容如下:1.基于深度学习及矩阵分解的肿瘤特征基因选择。首先,针对深度学习模型无法很好地进行肿瘤特征基因选择的问题,提出一种基于样本学习及深度稀疏滤波的肿瘤特征基因选择方法;其次,基于最优均值算法和分块优化理论,提出一种基于最优均值的分块鲁棒特征基因选择方法,并对TCGA中的融合数据进行分析;最后,利用散度矩阵将基因表达谱数据中已知类别标签引入无监督算法中,提出一种监督型惩罚矩阵分解算法,从而对特征基因进行选择。2.基于样本扩充及深度学习的肿瘤样本分类。针对深度学习模型在进行肿瘤基因表达谱数据分类时训练样本严重不足的问题,提出一种基于降噪自动编码器的样本扩充方法,以获得大量的辅助样本。进一步,针对肿瘤样本分类问题,将所提样本扩充方法分别与两种深度学习模型相结合,设计了基于样本扩充的栈式自动编码器和基于样本扩充的1维卷积神经网络。3.基于低秩子空间分割的肿瘤样本聚类。传统子空间分割方法依赖谱聚类进行肿瘤基因表达数据聚类,针对此问题,利用离散约束来直接学习子空间的样本标签,提出了两种基于离散约束的低秩子空间肿瘤样本聚类方法。首先,考虑肿瘤基因表达谱数据内部的流形结构,提出一种基于离散约束及超图正则化的低秩子空间聚类算法;其次,为了消除肿瘤数据中极端离群值对聚类结果的影响,使用封顶范数来提高算法的鲁棒性,提出基于离散约束及封顶范数的鲁棒低秩子空间聚类算法。4.基于双超图正则化主成分分析的肿瘤双聚类。同时考虑肿瘤数据中的样本流形结构和基因流形结构,分别构建样本超图和基因超图来获取数据的局部几何信息,并将双超图作为主成分分析的正则项进行样本聚类和基因聚类,提出基于双超图正则化主成分分析的双聚类算法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

肿瘤基因表达数据论文参考文献

[1].宋慧慧,李原,葛峥,黄培林.基于数据挖掘分析FOXO1在成熟B细胞肿瘤中的表达及靶基因预测[J].南京医科大学学报(自然科学版).2018

[2].刘健.基于机器学习的肿瘤基因表达谱数据分析方法研究[D].中国矿业大学.2018

[3].赵全钢,陈国华,赵丽敏.基于PSO-SVM的肿瘤特征基因表达数据分析[J].德州学院学报.2018

[4].谢光磊.肿瘤亚型分析中针对基因表达数据差分进化特征选择算法的研究[D].南方医科大学.2018

[5].李晨阳.肿瘤基因表达数据的特征选择方法研究[D].兰州交通大学.2018

[6].高凌云.基于机器学习和智能优化的肿瘤基因表达数据挖掘研究[D].皖南医学院.2018

[7].陈丹.肿瘤基因表达谱数据的半监督分类方法研究[D].湖南大学.2017

[8].冯森.肿瘤基因表达谱数据特征选择方法研究[D].河南师范大学.2017

[9].田丽.基于反投影表示的肿瘤基因表达谱数据分类研究[D].河南大学.2017

[10].余东海.基于基因表达谱数据的肿瘤分类算法研究[D].东北大学.2016

标签:;  ;  ;  ;  

肿瘤基因表达数据论文-宋慧慧,李原,葛峥,黄培林
下载Doc文档

猜你喜欢