单分类论文-段立,徐鸿宇,王懿,赵莉,刘冲

单分类论文-段立,徐鸿宇,王懿,赵莉,刘冲

导读:本文包含了单分类论文开题报告文献综述及选题提纲参考文献,主要关键词:投诉工单,词向量,极端梯度提升,工单分类

单分类论文文献综述

段立,徐鸿宇,王懿,赵莉,刘冲[1](2019)在《基于word2vec和XGBoost相结合的国网95598客服投诉工单分类》一文中研究指出为了解决95598客服投诉工单的整理、归档等问题,其中包括:在人工进行归档的过程中出现的疏忽造成的归档随意问题,即归档准确性问题;人工对投诉工单进行差错点归纳的耗时问题,即效率问题;人工对客服投诉分析深度不足,无法精准快速定位用户诉求热点的问题,即深度问题。本文针对以上叁个问题给出解决方案,采用word2vec和XGBoost相结合的方式达到对95598客服投诉工单精准归纳。在文本词向量化的过程中采用word2vec方法,得到单词的文本词向量;利用XGBoost算法对95598客服投诉工单进行分类归档,并且对历史投诉工单的责任部门、专业分类、诉求事件、差错点四个方面进行标注。该模型的分类准确率在83%-91%左右,有较好的的效果。基于工单分类的结果,并设计了相关的投诉类看板,更直观的对数据进行展示。(本文来源于《电力大数据》期刊2019年12期)

陈小峰,齐晓明,赵雅迪,张利鹏[2](2019)在《电网生产业务工单分类的文本挖掘方法应用》一文中研究指出文本挖掘技术作为描述性数据分析的重要手段,在电网业务中发挥着愈加重要的作用。创建了电网生产工单文本分析系统,利用结巴分词技术处理工单中文本内容,基于TF-IDF算法计算关键词重要性权重值,构建电力关键词库。通过构建贝叶斯文本分类模型,对工单内容完成缺陷部位、类别、原因的自动分类,提升数据质量和系统自动化水平,助力业务部门提高工作效率,为电网业务分析及未来发展方向提供依据。(本文来源于《生态互联 数字电力——2019电力行业信息化年会论文集》期刊2019-09-07)

杨鹏,刘扬,杨青[3](2019)在《基于层次语义理解的电力系统客服工单分类》一文中研究指出随着信息技术的发展,电力系统中积累了大量的电力数据,其中客服工单数据占据着非常重要的地位。根据客服工单的描述内容进行分类有利于准确地定位客户需求,对于提升电力系统运行的质量和效率具有重要的意义。对此提出基于层次语义理解的电力系统客服工单分类模型。利用深度学习方法对工单描述文本中的词和字符同时建模,从而得到层次化的工单描述语义表示,进而基于此表示对工单类别进行划分。通过在真实数据上的对比实验可以证明该方法能够准确地学习到工单的隐藏语义表示,具有优于对比方法的分类准确度。(本文来源于《计算机应用与软件》期刊2019年07期)

牛红峰,朱蓉蓉,李永明,丁洁,蔡忠闽[4](2019)在《单分类人机检测方法》一文中研究指出针对人机检测领域中脚本机器人种类多样的问题,提出了一种利用单分类方法基于鼠标行为的人机检测技术,实现对带有行为模拟功能的高级脚本机器人的检测。利用JavaScript获取网页页面正常用户的鼠标行为数据,经过数据预处理、特征提取过程获得描述用户行为的特征向量并送入单分类器中,建立人机检测模型。为验证单分类方法的有效性,通过统计分析网页页面正常用户的鼠标行为数据,设计3种具有模拟人类功能的脚本机器人,模拟正常用户完成网页页面登录场景任务。使用直线类型的脚本机器人样本参与特征选择,之后提取特征子集,完成单分类器在人机检测领域的性能评价。实验结果表明:单分类器对直线、规则曲线、不规则曲线3种脚本机器人检测效果最好的等错误率分别为7.25%、9.45%和12.7%;较二分类方法对未知类型脚本机器人检测效果最好的等错误率为20.56%;单分类方法具有良好的泛化性。(本文来源于《西安交通大学学报》期刊2019年11期)

杨勇,严道波,徐敏,万磊,李强[5](2019)在《基于改进TFIDF特征加权算法的95598投诉工单分类实现》一文中研究指出分析了传统朴素贝叶斯算法、TFIDF特征加权算法在文本分类建模应用上的缺陷,在此基础上提出了TFIDF的优化算法,并分别采用传统朴素贝叶斯算法、基于TFIDF的朴素贝叶斯算法、基于改进TFIDF的朴素贝叶斯算法分别对某供电公司投诉工单进行了分类建模。研究结果表明,改进TFIDF算法能在TFIDF算法的基础上进一步提升分类器的性能,投诉工单分类准确率达到93.03%,较传统朴素贝叶斯算法提升了4个百分点。(本文来源于《电力与能源》期刊2019年02期)

刘波,燕琴,刘恒飞,马磊[6](2019)在《一种正样本单分类框架下的高分辨率遥感影像建筑物变化检测算法》一文中研究指出高分辨率遥感影像建筑物变化检测对于城市规划、城市执法等方面具有非常重要的意义。文中提出一种基于正样本单分类器学习框架下的建筑物变化检测算法。首先提取影像形态学建筑物指数特征(MBI),通过卡方变换将其与光谱特征进行融合;然后利用一种单分类器完成建筑物变化初始判定;最后利用改进的长宽比形状特征完成最终建筑物变化判定。通过与现有建筑物变化检测算法、传统的多分类器算法对比,本文算法精度有一定提升并具有更强的鲁棒性。(本文来源于《测绘工程》期刊2019年02期)

刘献强[7](2019)在《基于单分类的工控系统异常检测关键问题研究》一文中研究指出随着工业控制系统信息技术的发展与功能需求的变化,工控系统逐渐与企业网或是互联网相连接,形成开放式网络环境。传统工业控制系统的信息安全主要基于物理隔离,没有专门的安全防御措施,故在工控系统网络开放化的当下,其信息安全隐患也愈发凸显。论文主要研究工业控制系统的异常检测,从Modbus数据包预处理、时序特征提取和增量分类模型叁个关键问题着手改进,提出基于单分类支持向量机的工业控制系统异常检测优化方案。方案不仅能够降低复杂系统中数据包混杂造成的影响,识别多种时序上的异常情况,同时还细化改良了异常检测模型的分类结果。具体研究成果如下:1)首先分析复杂系统环境下多子系统数据包混杂导致现有时序特征提取算法受到的影响,设计实现基于工控系统特点的预分组算法。算法通过将不同归属的数据包进行预分组,避免了对数据包时序特征的干扰。实验证明相比未分组情况,预分组算法有效地提升了异常检测的准确率。2)针对现有时序提取算法遗漏有效特征信息的局限性,优化的时序特征提取算法引入了流量与时间间隔方差两个新特征并修改了单个数据包的指代特征。该算法经实验证明确实能够识别更多种类的异常情况,实验同时比较了特征提取算法中不同指代特征级别对特征维度的影响,证实了指代特征分级的必要性。3)最后设计了一种结合误报标记的增量检测分级模型。结合误报标记的增量检测算法降低重复误报的发生,同时双轮廓分级模型细化了异常检测模型的分类结果,将不同危险度的检测结果细化区分。实验证明结合误报标记的增量检测算法确实降低了误报重复出现的次数,提升了异常检测的准确率。(本文来源于《北京邮电大学》期刊2019-02-28)

张兴[8](2018)在《基于转移学习的单分类的研究与应用》一文中研究指出在人工智能极速展开的大数据时代,对于数据的需求越来越高,如独立同分布和数据量充足等,但是并不是在所有情况下都能获得想要的数据,就好像我们并不是总具备自己需要的知识,因此,像知识迁移一样的转移学习逐渐进入到人们的视野,并广泛应用至支持向量机等传统分类器中。而传统的监督学习模型中如支持向量机(SVM)等需要多类样本作为训练集,但在实际应用中,则很难实现或者为此需付出的很高的代价,如敌我辨识,设施缺陷等,往往只能获得一个标签的样本。并且在我们的生活中有这样的一种问题,我们需要的类只有一个,其余的都是离群类,我们也并不在乎离群类的标签是什么,这就是单分类问题。本文研究的内容就是如何将转移学习算法应用到单分类问题中去,并进行实验判断二者融合后性质是否良好。本文采用以核均值匹配算法为基础的基于样本的直推式转移学习算法进行转移学习,并应用支持向量数据描述算法进行单分类数值实验。在实验中,我们由FDA与Tcm~(SP)获取的药典数据并以Dragon软件对药物分子向量化后,通过经过转移学习的单分类问题用成型的西药分析中药药性,并通过已有的数据通过分析ROC曲线及对应的AUC值判断迁移效果,最终实验表明二者融合性能更好。(本文来源于《大连理工大学》期刊2018-06-05)

徐东[9](2018)在《融合人格特质和物品标签的单分类协同过滤方法研究》一文中研究指出个性化推荐系统,现如今已经成为了各类电子商务公司为了满足客户需求的重要工具。但是,在线用户的不断扩充以及产生大量的信息,如何利用这些信息并准确地提供了个性化的内容和服务变得越来越具有挑战性。传统的推荐模型过于依赖用户的偏好评分,而且还常常受到数据稀疏性问题的影响。单分类协同过滤模型更适用于电子商务真实的情况但由于其数据缺失值较多且类别极度不平衡,因此在物品推荐上还有明显的不足之处,如数据稀疏性问题和冷启动问题。为了应对上述的挑战,当前很多研究致力于识别数据中的正例和负例,本文使用用户的人格特质信息和物品标签信息作为补充信息在加权正则矩阵分解模型的基础上提出了两种负例权重策略:一种是利用人格特质信息计算用户对产品的偏好程度,另一种是联合人格特质和物品标签信息计算用户对产品的偏好程度。其负例权重策略基于的基本思想是:用户对产品的偏好程度越大,该缺失项是负例的可能性就越小。在公开数据集Last FM上的实验结果表明本文提出的模型能够提高传统单分类协同过滤模型的性能并有效缓解了数据稀疏性问题和新用户冷启动问题。(本文来源于《合肥工业大学》期刊2018-03-01)

李昊奇,应娜,郭春生,王金华[10](2018)在《基于深度信念网络和线性单分类SVM的高维异常检测》一文中研究指出针对目前高维数据异常检测存在的困难,提出一种基于深度信念网络和线性单分类支持向量机的高维异常检测算法。该算法首先利用深度信念网络具有良好的特征提取功能,实现高维数据的降维,然后基于线性核函数的单分类支持向量机实现异常检测。选取UCI机器学习库中的高维数据集进行实验,结果表明,该算法在检测正确率和计算复杂度上均有明显优势。与PCA-SVDD算法相比,检测正确率有4.65%的提升。与自动编码器算法相比,其训练和测试时间均有显着下降。(本文来源于《电信科学》期刊2018年01期)

单分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

文本挖掘技术作为描述性数据分析的重要手段,在电网业务中发挥着愈加重要的作用。创建了电网生产工单文本分析系统,利用结巴分词技术处理工单中文本内容,基于TF-IDF算法计算关键词重要性权重值,构建电力关键词库。通过构建贝叶斯文本分类模型,对工单内容完成缺陷部位、类别、原因的自动分类,提升数据质量和系统自动化水平,助力业务部门提高工作效率,为电网业务分析及未来发展方向提供依据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

单分类论文参考文献

[1].段立,徐鸿宇,王懿,赵莉,刘冲.基于word2vec和XGBoost相结合的国网95598客服投诉工单分类[J].电力大数据.2019

[2].陈小峰,齐晓明,赵雅迪,张利鹏.电网生产业务工单分类的文本挖掘方法应用[C].生态互联数字电力——2019电力行业信息化年会论文集.2019

[3].杨鹏,刘扬,杨青.基于层次语义理解的电力系统客服工单分类[J].计算机应用与软件.2019

[4].牛红峰,朱蓉蓉,李永明,丁洁,蔡忠闽.单分类人机检测方法[J].西安交通大学学报.2019

[5].杨勇,严道波,徐敏,万磊,李强.基于改进TFIDF特征加权算法的95598投诉工单分类实现[J].电力与能源.2019

[6].刘波,燕琴,刘恒飞,马磊.一种正样本单分类框架下的高分辨率遥感影像建筑物变化检测算法[J].测绘工程.2019

[7].刘献强.基于单分类的工控系统异常检测关键问题研究[D].北京邮电大学.2019

[8].张兴.基于转移学习的单分类的研究与应用[D].大连理工大学.2018

[9].徐东.融合人格特质和物品标签的单分类协同过滤方法研究[D].合肥工业大学.2018

[10].李昊奇,应娜,郭春生,王金华.基于深度信念网络和线性单分类SVM的高维异常检测[J].电信科学.2018

标签:;  ;  ;  ;  

单分类论文-段立,徐鸿宇,王懿,赵莉,刘冲
下载Doc文档

猜你喜欢