不均衡样本集论文-吴春志,冯辅周,吴守军,陈汤,江鹏程

不均衡样本集论文-吴春志,冯辅周,吴守军,陈汤,江鹏程

导读:本文包含了不均衡样本集论文开题报告文献综述及选题提纲参考文献,主要关键词:行星变速箱,样本不均衡,Wasserstein生成式对抗网络,卷积神经网络

不均衡样本集论文文献综述

吴春志,冯辅周,吴守军,陈汤,江鹏程[1](2019)在《一种有效的不均衡样本生成方法及其在行星变速箱故障诊断中的应用》一文中研究指出针对实际运行中行星变速箱故障数据较少、各个状态样本不均衡的问题,提出了由Wasserstein生成式对抗网络(WGAN)样本生成模型和卷积神经网络(CNN)分类模型组合的WGAN-CNN故障诊断分类模型。该模型对故障数据的频谱信号进行过采样,以扩展故障样本数量,从而更好地对故障状态进行分类。采用加州大学欧文分校人工数据集对WGAN生成模型以及经典过采样方法进行对比,并在行星变速箱故障试验台上进行验证。结果表明,样本不均衡会严重影响分类结果,而WGAN-CNN模型可以很好地扩充故障样本集,提高在故障样本稀少情况下的诊断准确率。(本文来源于《兵工学报》期刊2019年07期)

钟诗胜,李旭,张永健[2](2019)在《基于DBN的不均衡样本驱动民航发动机故障诊断》一文中研究指出在结合深度置信网络(DBN)、采样与集成技术的基础上,提出了基于不均衡样本驱动的民航发动机故障诊断模型。该模型通过分析民航发动机历史飞行数据,利用DBN提取性能参数中的内部特征,利用采样技术将不均衡样本均衡化,采用集成技术进行故障分类。将该模型应用到CFM56-7B系列发动机历史飞行数据,实验结果表明:与常用故障诊断方法相比,该模型的准确率高达0.996,AUC值高达0.948,可以有效处理民航发动机样本高维、不均衡问题。(本文来源于《航空动力学报》期刊2019年03期)

王江月[3](2018)在《基于不均衡样本的脉象信号分类方法研究》一文中研究指出脉诊是中医四诊之一,是中医诊断疾病常用的方式。脉诊包含丰富的病理信息,且是一种无痛无创的诊断方式。“脉为医之关键,医不察脉,则无以别证,证不别,则无以措治”(徐春甫《古今医统》),由此可以看出脉诊在中医中的地位。随着近几年人工智能的兴起,机器学习与医学诊断逐渐的结合,在中医方面也促进了脉象诊断的发展。在实际场景中,脉象数据存在着严重的数据不均衡问题。直接基于不均衡的脉象数据训练分类器,容易导致分类器对少数类脉象信号样本分类效果不佳。然而,在现实社会中,人们倾向于关注少数类脉象信号样本所对应的疾病,例如健康和癌症两类样本,癌症更加受人们重视。如果分类器不能很好地识别少数类疾病样本,将其误分为多数类样本将导致很大的损失。基于以上问题,本文通过分析脉象信号的特点,从特征选择、脉象信号不均衡处理、特征融合、脉象信号多分类等方面进行研究。在脉象信号特征选择方面,利用PCA算法对脉象信号进行降维,然后利用类别可分性准则对脉象信号进行特征选择,以此得出最优的特征集。在不均衡脉象信号的处理方面,主要从数据层面和算法层面两个角度解决。在数据层面,本文对基于遗传算法的下采样方法进行了改进,将遗传算法中衡量染色体适应度值的弱分类器改进为适合脉象信号的强分类器。为了选择信息丰富的多数类脉象信号样本,改进后的算法试图最大化原分类器的性能,最小化原始多数类脉象信号样本与下采样后多数类脉象信号样本间的损失。在算法层面,本文对固定近邻引力算法进行了改进,改进后的算法的主要思想是将训练集中的脉象信号样本看成有质量的实体,实体之间具有引力作用。通过利用脉象信号测试样本的K近邻点对其的引力总和来判定测试样本的标签。通过本文实验验证,这两种改进后的算法能够在一定程度上提升不均衡脉象样本的分类性能。利用多重集典型相关性分析方法将脉象信号的Gabor特征、STFT特征、脉象二维矩阵特征和wavelet特征进行融合,并通过一对一多分类法、基于无向图的多分类法和基于纠错编码的多分类法完成了脉象信号样本的多分类实验。(本文来源于《哈尔滨工业大学》期刊2018-12-01)

游子莹[4](2018)在《不均衡样本的分类优化方法》一文中研究指出随着机器学习、数据挖掘、深度学习等领域的快速发展,人们致力于不断优化各种模型。分类问题作为数据挖掘的主要任务,备受学者关注,传统分类策略大都基于代价不敏感的均衡数据,它们往往注重一个模型的整体精度,而这样的分类器对于非均衡的样本数据并不适用。因此,如何改进分类策略以优化不均衡样本的分类器性能,是一个值得讨论的议题。本文以此为目标展开研究,致力于在保持整体性能的前提下,提升分类器对少数类别的学习能力。当前主要的研究方向主要有两个,其一从样本出发,研究如何在尽量不损失原样本所含信息的前提下平衡类样本数量,同时还应尽量避免噪声的产生;其二从算法出发,通过训练单类样本分类器、引入代价敏感因子、采用集合策略等方式提升学习器分类性能。本文在提出优化策略之前,首先提出一种新型复合评价准则IIBAα,通过理论和实验证明了其不仅能度量模型整体性能,还能够侧重评估少数类别的分类,同时具有更高的稳健性和抗噪声性等优点,可以将其运用于优化效果的比较中。之后本文分为样本和算法策略两方面介绍非均衡样本分类的优化方式,其中样本优化是核心所在。本文提出了一种基于聚类思想的组合样本优化方法框架,这种样本优化方法可与各种现有的样本平衡技术兼容,同时引入了聚类性能评估,支持根据聚类效果设置采样数量差别策略,可以有所侧重地关注聚类输出的某一簇样本,满足在平衡样本数量的同时,提高分类边界样本的权重,最后本文还提出了一种基于簇中心的采样策略。通过理想数据集及实际数据集上的实验,以IIBAα为评价准则,同时结合一些现有的算法策略,证明了本文所提出的基于聚类的组合优化方法对于平衡样本数量上所带来的提升,并以此优化了分类器的分类性能。(本文来源于《华中科技大学》期刊2018-05-01)

谢天保,赵萌,雷西玲[5](2018)在《基于非均衡样本集的煤矿突水预测模型》一文中研究指出针对煤矿突水样本集呈非均衡分布的特点,提出基于集成学习分类的煤矿突水预测模型,重点研究基分类器的构建方法、性能衡量指标和权重分析,以及基于改进型Boosting的集成学习算法.实验结果表明,该算法以牺牲不突水样本的最小误判率为代价,实现突水样本100%的判别准确率,且计算量小,易于实现.(本文来源于《计算机系统应用》期刊2018年04期)

靳燕,彭新光[6](2016)在《多子域隔离学习组合决策用于不均衡样本》一文中研究指出为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型。子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区。借鉴不同类存在相似样本的类重迭概念,对边界样本进行搜索,组合构成重迭域。子域清理阶段,基于邻近算法(KNN)的邻近性假设,结合不同域的密疏程度,设置样本有效性参数,对域内样本逐个检测以清理噪声。各子域隔离参与分类建模,按序组合产生出用于不均衡数据集的复合分类器CCRD。在相似算法对比以及代价敏感Meta Cost对比中,CCRD对正类的正确分类改善明显,且未加重负类误判;在SMOTE抽样比较中,CCRD改善了负类的误判情形,且未影响正类的正确分类;在五类数据集的逐个比较中,CCRD分类性能均有提升,在Haberman_sur的正类分类性能提升上尤为明显。结果表明,基于子域学习的复合分类模型的分类性能较好,是一种研究不均衡数据集的较有效的方法。(本文来源于《计算机应用》期刊2016年09期)

王金婉,毛文涛,何玲,王礼云[7](2015)在《基于不均衡样本重构的加权在线贯序极限学习机》一文中研究指出针对现有学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出一种基于不均衡样本重构的加权在线贯序极限学习机。该算法从提取在线贯序数据的分布特性入手,主要包括离线和在线两个阶段:离线阶段主要采用主曲线构建少类样本的可信区域,并通过对该区域内样本进行过采样,来构建符合样本分布趋势的均衡样本集,进而建立初始模型;而在线阶段则对贯序到达的数据根据训练误差赋予各样本相应权重,同时动态更新网络权值。采用UCI标准数据集和澳门实测气象数据进行实验对比,结果表明,与现有在线贯序极限学习机(OS-ELM)、极限学习机(ELM)和元认知在线贯序极限学习机(MCOS-ELM)相比,所提算法对少类样本的识别能力更高,且所提算法的模型训练时间与其他叁种算法相差不大。结果表明在不影响算法复杂度的情况下,所提算法能有效提高少类样本的分类精度。(本文来源于《计算机应用》期刊2015年06期)

祝晓燕,常宏飞,张金会[8](2012)在《基于遗传算法的不均衡样本在支持向量机中的研究》一文中研究指出不均衡样本在实际应用中广泛存在,已对学习领域造成挑战,如何处理不均衡样本情况也已经成为目前的热点。针对不均衡样本的问题提出将遗传算法应用于支持向量机中。利用遗传算法中的交叉、变异来进行样本的遗传,从而产生新的群体,即样本。(本文来源于《机械工程师》期刊2012年05期)

何渊淘,邓伟[9](2010)在《改进的不均衡样本集支持向量机预处理方法》一文中研究指出将一种改进的邻域算法应用于不均衡样本集中,由于改进的邻域算法未考虑不均衡样本集的问题从而导致后续的支持向量机训练耗费和泛化性能受影响,把后验概率的思想加入改进的邻域算法中,并由实验数据说明了该方法对不均衡样本集的有效性。(本文来源于《计算机工程与应用》期刊2010年10期)

不均衡样本集论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在结合深度置信网络(DBN)、采样与集成技术的基础上,提出了基于不均衡样本驱动的民航发动机故障诊断模型。该模型通过分析民航发动机历史飞行数据,利用DBN提取性能参数中的内部特征,利用采样技术将不均衡样本均衡化,采用集成技术进行故障分类。将该模型应用到CFM56-7B系列发动机历史飞行数据,实验结果表明:与常用故障诊断方法相比,该模型的准确率高达0.996,AUC值高达0.948,可以有效处理民航发动机样本高维、不均衡问题。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

不均衡样本集论文参考文献

[1].吴春志,冯辅周,吴守军,陈汤,江鹏程.一种有效的不均衡样本生成方法及其在行星变速箱故障诊断中的应用[J].兵工学报.2019

[2].钟诗胜,李旭,张永健.基于DBN的不均衡样本驱动民航发动机故障诊断[J].航空动力学报.2019

[3].王江月.基于不均衡样本的脉象信号分类方法研究[D].哈尔滨工业大学.2018

[4].游子莹.不均衡样本的分类优化方法[D].华中科技大学.2018

[5].谢天保,赵萌,雷西玲.基于非均衡样本集的煤矿突水预测模型[J].计算机系统应用.2018

[6].靳燕,彭新光.多子域隔离学习组合决策用于不均衡样本[J].计算机应用.2016

[7].王金婉,毛文涛,何玲,王礼云.基于不均衡样本重构的加权在线贯序极限学习机[J].计算机应用.2015

[8].祝晓燕,常宏飞,张金会.基于遗传算法的不均衡样本在支持向量机中的研究[J].机械工程师.2012

[9].何渊淘,邓伟.改进的不均衡样本集支持向量机预处理方法[J].计算机工程与应用.2010

标签:;  ;  ;  ;  

不均衡样本集论文-吴春志,冯辅周,吴守军,陈汤,江鹏程
下载Doc文档

猜你喜欢