频繁模式发现论文-李海林,邬先利

频繁模式发现论文-李海林,邬先利

导读:本文包含了频繁模式发现论文开题报告文献综述及选题提纲参考文献,主要关键词:时间序列,符号集合近似,频繁模式,异常检测

频繁模式发现论文文献综述

李海林,邬先利[1](2018)在《基于频繁模式发现的时间序列异常检测方法》一文中研究指出针对传统异常片段检测方法在处理增量式时间序列时效率低的问题,提出一种基于频繁模式发现的时间序列异常检测(TSAD)方法。首先,将历史输入的时间序列数据进行符号转化;其次,利用符号化特征找出历史序列数据集中的频繁模式;最后,结合最长公共子序列匹配方法度量频繁模式与当前新增加时间序列数据之间的相似度,从而发现新增加数据中的异常模式。与基于滑动窗口预测的水文时间序列异常检测方法(TSOD)和基于扩展符号聚集近似的水文时间序列异常挖掘方法(ESAA)相比,对于实验选择的叁种类型的时间序列数据,TSAD的检测率都超过90%;TSOD对规则性较强的序列检测率较高,能达到99%,但对噪声干扰较大的序列检测率较低,对数据偏向性较强;ESAA对叁种类型的数据检测率均不超过70%。实验结果表明,TSAD在时间序列异常检测中能够较好地发现异常片段。(本文来源于《计算机应用》期刊2018年11期)

吕德涛[2](2018)在《增量式异常就医聚集行为的频繁模式发现及Spark上的实现》一文中研究指出随着经济社会的不断发展,人们的生活质量不断提高,我国的社会保障制度不断完善,在人们遇到医疗困难时,医疗保险基金发挥的作用越来越大,为我国的社会稳定,人民的健康生活提供有力的保障。然而许多不法份子开始关注人民这部分救命钱,利用医疗保险制度中的漏洞或缺陷,套取医保基金,损害国家资源,造成极大的医疗不公平,不利于社会的稳定。骗保人员骗取医疗保险基金的形式多样,例如分解住院、重复医疗、私留医保卡等,目前常见的反欺诈手段主要依靠监察人员的经验以及人工蹲点守候等方式进行判别,这些手段在面对大数据量的情况时,显然并不合适,因此利用技术手段进行骗保行为的甄别势在必行。本文将骗取医保基金行为中的病人异常就医聚集行为作为研究重点,利用数据数挖掘算法对病人的聚集行为进行挖掘,并对挖掘结果进行病人和医院维度的深层次分析,在此基础上构建欺诈行为的监测系统,主要内容如下:1.医保数据处理。梳理目前病人的就诊数据中存在的问题,进行数据处理工作,主要包括缺失值处理、重复值处理等。对病人和医院进行画像,为后续深层次分析提供数据准备,同时为系统及模型的构建奠定基础。2.提出基于支持数的增量式频繁模式挖掘算法EFUFP。针对数据批量更新以及病人聚集就医行为的欺诈场景,提出EFUFP算法,并引入Spark编程模型,在Spark平台实现EFUFP算法,实现大规模数据下频繁模式的快速高效挖掘。在结果相同,空间复杂度近似的情况下,时间效率EFUFP本地测试较FUFP提高10.7%以上,在Spark平台较FP-GROWTH算法提高26.8%以上。3.构建异常聚集就医行为监测系统及提出基于时间序列相似性分析的在院人次异常检测方法。利用监测系统实现对就医聚集人群的发现、分析及效果展示,主要包括对聚集就医人员及其医院的分析。对患者主要是利用规则对患者的患病、花费等进行异常甄别。对医院提出基于时间序列相似性分析的在院人次异常检测方法,动态检测在院人数异常。(本文来源于《电子科技大学》期刊2018-03-23)

刘洋[3](2017)在《结合本体与规则的并行频繁模式发现的研究》一文中研究指出频繁模式发现是运用数据挖掘技术在海量数据中快速地挖掘出隐含信息中的使用模式的过程,是知识发现领域的研究热点。当前频繁模式发现主要是基于文本挖掘技术的,其数据集缺乏语义,因此挖掘结果往往不尽如人意。本体作为一种有效的知识描述手段,能有效地提升数据表达的语义,但其本身推理能力较弱。因此利用具有强大推理能力的规则逻辑,结合本体构成混合逻辑知识库,这种方法可以有效地提升频繁模式发现的质量。在混合逻辑知识库上挖掘频繁模式的时间开销非常大,尤其是对观察集进行覆盖测试的时候需要进行大量的推理计算。因此,本文在结合本体和规则构成混合逻辑知识库的基础之上,研究频繁模式发现的并行的处理架构,通过约简选言规则库中双向逻辑推理模式,给出模式的形式化定义,在此基础上提出一种基于ILP的频繁模式发现并行计算框架,并设计实现了该原型系统。本文主要研究成果如下:1)针对并行计算框架给出了模式的形式化定义传统的选言规则模式基于双向信息流,不适用于并行计算框架。本文在分析频繁模式发现过程中发现,大量的信息从知识库中通过规则体的描述逻辑原子作用于异构规则,因此本文通过简化规则头的描述,给出了一种单向信息推理的模式的形式化定义,这种定义虽然在一定程度上弱化了模式的描述能力和推理能力,但能利用并行计算框架极大地提高频繁模式发现的效率。2)提出了一种本体与规则相结合的并行频繁模式发现方法基于MapReduce框架,在本体与规则相结合的混合知识库上,提出一种并行ILP频繁模式发现的方法。从核心概念出发,通过节点扩展算法生成Trie树,在完成安全性检查、等价性验证和冗余性验证的基础上,将需要大量计算的模式检测过程分发到并行计算节点上,从而降低观察覆盖测试时间,提高模式发现效率。3)结合本体与规则的并行频繁模式发现原型系统的设计与实现本文设计并实现了一个并行频繁模式发现系统,首先定义了数据结构,然后将该原型系统的核心模块例如用户接口、任务管理、验证模块和计算模块分别部署到相应的并行计算节点上协同合作得到频繁模式集,最后通过实验分析了参数对并行算法的影响。(本文来源于《电子科技大学》期刊2017-03-01)

陈潋,乐嘉锦,陈德华,冯洁莹[4](2016)在《糖尿病临床诊断事件序列中频繁模式的发现算法》一文中研究指出随着各大医院信息化建设进程的不断推进,医院中的各生产系统如HIS(医院信息化系统)、EMR(电子病历系统)等已经积累了规模庞大的临床数据,这种临床大数据对于提升临床医疗质量有着深远的意义。糖尿病作为一种慢性病,容易引发多种并发症如肾病、眼病等。为了找出糖尿病并发症出现的规律,本文首先对糖尿病历史临床诊断数据进行事件序列化,然后对传统的SPADE算法进行改进,提出一种糖尿病临床诊断事件序列频繁模式发现算法NFPS,该算法考虑糖尿病治疗时间间隔,通过时间窗口的设定,支持对该时间窗口内糖尿病并发症频繁出现模式的发现。实验结果表明其在临床糖尿病并发症频繁模式发现上的有效性。(本文来源于《计算机与现代化》期刊2016年04期)

汪兰淳[5](2016)在《同构语义日志知识库上频繁Web访问模式发现的研究》一文中研究指出频繁Web访问模式发现是Web使用挖掘的关键内容,能够从海量Web数据中发现有用的用户访问信息,从而帮助企业改善站点和服务器设计,提升用户服务质量。语义Web为当前Web上的内容赋予了计算机可以理解并解释的语义,能够有效提升Web使用挖掘的效率。语义Web中,本体和规则的结合能够扬长避短,相互弥补不足。对于进一步改善频繁模式发现的效果具有重要意义。本文从语义Web本体和规则出发,着重研究日志本体之上本体和规则的结合以及同构语义日志知识库上的频繁Web访问模式发现。主要工作如下:1.提出了一种日志本体形式化描述的改进。将日志本体七元组的形式改为六元组,采用应用规则表示日志本体中的领域关系,并完善了日志本体的分层形式化描述。这种改进不仅可以避免在日志本体中出现较为复杂的领域关系,也更加符合Web使用挖掘领域的要求。2.改进了本体翻译算法并应用于日志本体,引入DL-safe规则将日志本体知识库和Datalog规则库取并构建同构日志知识库。在现有研究的基础上结合日志本体的特征改进了本体翻译算法,将日志本体知识库转换为选言Datalog规则库。这种方法转换的日志本体可以和在DL-safe规则限制下的网站应用规则同构形成语义日志知识库。在一定程度上实现了日志本体和规则的统一。3.基于FARMER算法提出一种频繁Web访问模式发现的方法。在FARMER算法的基础上,给出了一种同构日志知识库之上的频繁模式发现算法。可以从日志本体基准事件出发构建可接受谓词集,在扩展trie树节点的同时通过模式有效性验证和支持度计算发现频繁访问模式频繁访问模式发现。4.设计和实现了一个同构日志知识库频繁Web访问模式发现系统。综合前面的研究成果,开发和实现了一个用于频繁Web访问模式发现的系统实现了日志本体和应用规则导入,在满足DL-safe安全约束的条件下,翻译日志本体为选言规则生成同构日志知识库,并在基础上实现本文提出的深度优先频繁访问模式发现算法。对该系统进行实验测试验证了理论研究的可行性。(本文来源于《电子科技大学》期刊2016-03-28)

康文杰[6](2016)在《异构语义日志知识库上频繁访问模式发现的研究》一文中研究指出语义网为Web上的内容赋予了计算机可以理解并解释的语义,能够有效提高Web使用挖掘的效率,目前成为人工智能领域的一个重要研究方向。而频繁访问模式发现作为Web上用户使用挖掘的重要内容,能够从海量的Web使用数据中挖掘出用户在不同情况下的频繁访问行为,挖掘结果对于发展电子商务、改善网站管理以及提升个性化服务等,具有重要意义。本文从语义Web的本体与规则出发,着重研究两者的有机结合和在此异构语义日志知识库上的频繁Web访问模式发现,主要工作包括:一、改进日志本体的形式化描述以事件为核心,完善日志本体的分层形式化描述,将本体定义为六元组,并将其领域关系采用应用规则表示。因为目前日志本体中的领域关系主要由领域专家定义,既不能保证内容的全面性,又不能很好的满足应用场景的动态性,这种改进不仅精简了日志本体的内容,也更加符合现实需求。二、基于异构法结合日志本体与规则构建语义日志知识库采用Datalog异构规则表示领域关系及用户访问行为,在Datalog安全性的约束下,结合日志本体构建异构语义日志知识库。这种方法克服了本体推理能力和动态语义表达能力较弱的缺点,实现两者的优势互补,有效提高了知识库的表达能力和推理能力。叁、提出Datalog异构语义日志知识库上频繁Web访问模式挖掘的方法在异构语义日志知识库上,基于ILP理论提出一种频繁Web访问模式挖掘方法,通过输入核心事件refE,扩展Web访问的模式空间,构建候选访问模式集并验证模式有效性及计算支持度,发现Web上的频繁用户访问模式。四、基于异构语义日志知识库的Web频繁访问模式挖掘的系统设计与实现设计和实现一个以Java为编程语言的频繁Web访问模式发现系统,系统包括异构语义日志知识库构建和频繁访问模式挖掘两个部分。通过本体解析器生成日志本体,规则解析器和异构规则安全性检查产生应用规则,结合两者构建异构语义日志知识库。使用频繁Web访问模式挖掘的方法从知识库上发现用户的频繁访问模式。通过实验验证了理论研究的可行性。(本文来源于《电子科技大学》期刊2016-03-28)

彭敦陆,谢蕾,段凯,江平[7](2014)在《MDOM:一种支持Mashup编排优化的频繁模式发现模型》一文中研究指出通过访问Open API,用户可以轻松地获取站点的数据或服务,实现多个站点的数据和应用集成,构建个性化的Mashup应用.然而,随着可供选用的Open API数目和种类的增多,为快速构建高效的Mashup应用提出了挑战.本文在分析已有Mashup应用中可能存在的Open API编排模式基础上,根据Open API编排模式的有向性,提出了描述Mashup应用的有向编排图模型--MDOM.根据MDOM特征,利用有向图理论及频繁模式发现相关算法,提出了适合于MDOM特征的频繁子图挖掘算法FSOMM,并用实验验证了该算法的性能.通过将该算法运用于真实数据集,实现了真实频繁Mashup编排模式的挖掘.该模型的提出以及频繁编排模式的发现,为用户在构建Mashup应用时选择合适的Open API编排模式提供依据,从而为创建高效的Mashup应用提供保障.(本文来源于《小型微型计算机系统》期刊2014年09期)

许寿全,皮德常[8](2014)在《移动对象频繁周期模式发现》一文中研究指出随着信息技术的快速发展,挖掘移动对象背后隐藏的模式越来越重要.为了解决现有方法无法区分移动对象数据中的频繁项和稀有项以及不能满足向下闭包、挖掘效率低等问题,提出一种具有向下闭包特性的闭包多限制条件树算法(MultiConstraint Closure Conditional Tree,MCCCT).算法为不同模式设置不同限制条件,解决了组合爆炸和稀有项问题,提高了挖掘效率.针对模式支持度和周期距离难于获取的问题,根据每个模式出现频数动态获取属性值,增强了挖掘算法的灵活性.为防止噪音等不确定因素的影响,引入基于相似度的模式匹配算法,使模式挖掘更加具有健壮性.采用公开移动对象数据进行实验,结果表明算法能高效挖掘出的频繁周期模式.(本文来源于《小型微型计算机系统》期刊2014年08期)

刘素杰[9](2014)在《时间标识的移动对象频繁模式发现》一文中研究指出随着移动设备、无线传感网络技术、RFID设备以及GPS卫星定位技术的快速发展以及大规模应用,很方便收集到海量移动对象轨迹数据。这些轨迹数据包含很多潜在的有意义的知识,如何从这些轨迹数据中提取有用的知识是轨迹数据知识发现中亟待解决的难题。移动对象频繁模式发现作为轨迹数据知识发现的一个重要研究课题,在基于位置的服务、隐私保护、位置预测等诸多领域都有重要应用。本文围绕时间标识的移动对象频繁模式发现进行了研究,主要工作如下:(1)研究相对时间约束的兴趣区域发现针对传统的聚类方法发现兴趣区域时结果不确定且挖掘效率不高的问题,本文引入相对时间约束,提出相对时间约束的兴趣区域发现方法。该方法首先对移动对象的运动平面均匀划分网格,接着基于均匀网格计算网格密度,并利用相对时间约束对满足网格密度要求的轨迹分段,然后对密度网格扩展得到候选兴趣区域,如果轨迹划分的轨迹段和候选兴趣区域有交集,那么该轨迹即为候选兴趣区域的支持轨迹,若支持轨迹数不小于给定的最小支持度阈值限制,则候选兴趣区域即为兴趣区域。实验表明,本文方法能够得到良好的兴趣区域效果,且有很高的挖掘效率。(2)研究时间约束的移动对象频繁模式挖掘传统的移动对象频繁模式挖掘结果大都不包含时间信息,因此本文在相对时间兴趣区域发现的基础上,提出一种时间约束的移动对象频繁模式挖掘方法。该方法首先对提取的相对时间约束的兴趣区域进行转换,得到转换后的序列,接着对这些序列投影,计算投影后的序列,并提取候选频繁模式,然后添加时间约束,若候选频繁模式的支持度不小于给定的最小支持度阈值,且满足时间约束的限制,则候选频繁模式即为频繁模式。实验表明,与传统的频繁模式挖掘算法相比,本文算法的挖掘效率在时间和空间上都有明显提高。(3)设计并实现时间标识的移动对象频繁模式发现原型系统在理论研究的基础上,本文设计并实现了时间标识的移动对象频繁模式发现原型系统,并利用真实数据集验证了本文算法的准确性和高效性,该系统具有良好的可视化效果,能够很好地展示本文算法的挖掘结果。(本文来源于《中国矿业大学》期刊2014-06-01)

刘丽娜,沈继红,朱强华,丁兆云[10](2013)在《基于频繁传播模式的影响群落发现方法》一文中研究指出针对传统研究大多基于影响个体挖掘而忽略了影响群落的发现,本文考虑用户之间的频繁传播模式,提出了一种基于频繁传播模式的影响群落挖掘方法。针对群落内部传播模式的多样化,给出了一种信息传播树扩展方法,通过松弛信息传播树有向特性与图扩展方法,将信息传播树转换为连通无向无环图。结合支持度与影响强度,提出了一种新的频繁子图挖掘算法Tribe-FGM,减小模式增长的规模,提高频繁子图挖掘效率。实验采用新浪微博真实数据,在约90万条博文以及对应约64万左右用户的"地震"话题与约31万条博文以及对应约21万左右用户的"两会"话题的数据集上验证了算法的性能和有效性。(本文来源于《吉林大学学报(工学版)》期刊2013年02期)

频繁模式发现论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着经济社会的不断发展,人们的生活质量不断提高,我国的社会保障制度不断完善,在人们遇到医疗困难时,医疗保险基金发挥的作用越来越大,为我国的社会稳定,人民的健康生活提供有力的保障。然而许多不法份子开始关注人民这部分救命钱,利用医疗保险制度中的漏洞或缺陷,套取医保基金,损害国家资源,造成极大的医疗不公平,不利于社会的稳定。骗保人员骗取医疗保险基金的形式多样,例如分解住院、重复医疗、私留医保卡等,目前常见的反欺诈手段主要依靠监察人员的经验以及人工蹲点守候等方式进行判别,这些手段在面对大数据量的情况时,显然并不合适,因此利用技术手段进行骗保行为的甄别势在必行。本文将骗取医保基金行为中的病人异常就医聚集行为作为研究重点,利用数据数挖掘算法对病人的聚集行为进行挖掘,并对挖掘结果进行病人和医院维度的深层次分析,在此基础上构建欺诈行为的监测系统,主要内容如下:1.医保数据处理。梳理目前病人的就诊数据中存在的问题,进行数据处理工作,主要包括缺失值处理、重复值处理等。对病人和医院进行画像,为后续深层次分析提供数据准备,同时为系统及模型的构建奠定基础。2.提出基于支持数的增量式频繁模式挖掘算法EFUFP。针对数据批量更新以及病人聚集就医行为的欺诈场景,提出EFUFP算法,并引入Spark编程模型,在Spark平台实现EFUFP算法,实现大规模数据下频繁模式的快速高效挖掘。在结果相同,空间复杂度近似的情况下,时间效率EFUFP本地测试较FUFP提高10.7%以上,在Spark平台较FP-GROWTH算法提高26.8%以上。3.构建异常聚集就医行为监测系统及提出基于时间序列相似性分析的在院人次异常检测方法。利用监测系统实现对就医聚集人群的发现、分析及效果展示,主要包括对聚集就医人员及其医院的分析。对患者主要是利用规则对患者的患病、花费等进行异常甄别。对医院提出基于时间序列相似性分析的在院人次异常检测方法,动态检测在院人数异常。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

频繁模式发现论文参考文献

[1].李海林,邬先利.基于频繁模式发现的时间序列异常检测方法[J].计算机应用.2018

[2].吕德涛.增量式异常就医聚集行为的频繁模式发现及Spark上的实现[D].电子科技大学.2018

[3].刘洋.结合本体与规则的并行频繁模式发现的研究[D].电子科技大学.2017

[4].陈潋,乐嘉锦,陈德华,冯洁莹.糖尿病临床诊断事件序列中频繁模式的发现算法[J].计算机与现代化.2016

[5].汪兰淳.同构语义日志知识库上频繁Web访问模式发现的研究[D].电子科技大学.2016

[6].康文杰.异构语义日志知识库上频繁访问模式发现的研究[D].电子科技大学.2016

[7].彭敦陆,谢蕾,段凯,江平.MDOM:一种支持Mashup编排优化的频繁模式发现模型[J].小型微型计算机系统.2014

[8].许寿全,皮德常.移动对象频繁周期模式发现[J].小型微型计算机系统.2014

[9].刘素杰.时间标识的移动对象频繁模式发现[D].中国矿业大学.2014

[10].刘丽娜,沈继红,朱强华,丁兆云.基于频繁传播模式的影响群落发现方法[J].吉林大学学报(工学版).2013

标签:;  ;  ;  ;  

频繁模式发现论文-李海林,邬先利
下载Doc文档

猜你喜欢