数据质量问题论文-王凌云

数据质量问题论文-王凌云

导读:本文包含了数据质量问题论文开题报告文献综述及选题提纲参考文献,主要关键词:CSSCI,被引频次,数据质量,实证研究

数据质量问题论文文献综述

王凌云[1](2019)在《CSSCI被引文献数据质量问题的实证研究——以2007—2016年《图书情报工作》的被引数据为例》一文中研究指出CSSCI作为我国人文社会科学领域最主要的文献信息查询工具,获得了广泛的应用,当前有大量的研究都是基于CSSCI数据的,而针对CSSCI数据本身的研究却较少。以《图书情报工作》作为被引期刊,对CSSCI中2007—2016年的被引文献数据质量问题进行了研究,对引文数据出现问题的原因进行了定量统计分析,并在此基础上提出了改进建议,以期为CSSCI的进一步完善提供参考。(本文来源于《图书情报导刊》期刊2019年08期)

吕文斌,秦笠伟,洪敏慎[2](2019)在《浅析海洋数据成果质量问题与清洗方法》一文中研究指出随着上海市水务海洋数据中心的建设运行,每天都要汇聚全市多个涉海部门的大量海洋类监测数据。针对这些不同源端数据存在的一些结构问题、格式问题、缺失问题、噪点问题等,进行了技术清洗和规范整合。(本文来源于《数字技术与应用》期刊2019年08期)

黄佳慧[3](2019)在《大数据引领大庆高质量发展问题探析》一文中研究指出以大庆市情和阶段性特征为出发点,以"作用——挑战——路径"为逻辑框架,深入探析大数据引领大庆高质量发展相关问题。(本文来源于《大庆社会科学》期刊2019年04期)

赵静[4](2019)在《大数据背景下会计师事务所审计质量的提升问题分析》一文中研究指出在大数据背景下,原先的审计方式和手段已经无法满足社会经济活动的需求,这就要求会计师事务所的审计工作转变原有审计思维模式以适应大数据技术的发展趋势。本文首先分析了大数据技术的发展背景,其次分析了基于大数据技术和方法支持下审计方法、审计模式的转变以及审计制度的优化问题,基于此,本文分析了在大数据背景下会计师事务所审计质量的具体提升方式。(本文来源于《现代商业》期刊2019年21期)

陈朝兵[5](2019)在《超越数据质量:政府数据开放质量的几个理论问题研究》一文中研究指出[目的/意义]解析政府数据开放质量的基本理论问题,旨在回应当前我国政府数据开放实践发展需要,以及为该议题后续相关研究奠定基础。[方法/过程]采用文献分析法和规范分析法,首先界定了政府数据开放质量的概念,进而解析了政府数据开放质量的基本维度,最后分析了政府数据开放质量的影响因素。[结果/结论]政府数据开放质量指政府数据开放实施过程及结果中的固有特性满足相关规定要求和社会公众要求的程度。政府数据开放质量的基本维度包括公共性、安全性、保证性、保障性、系统性、参与性、回应性、共享性和利用性。政府数据开放质量的影响因素分为政府数据开放"质"的影响因素,包括价值取向、目标原则、公共政策、政府数据、开放平台、体制机制、公众能力等,政府数据开放"量"的影响因素,包括制度环境、过去经历、政府承诺、公众间沟通与交流、公众自身特征、政府后续行为等。(本文来源于《情报杂志》期刊2019年09期)

刘金娥,杜海翡[6](2019)在《经济普查数据统计及质量控制的相关问题研究》一文中研究指出经济普查是调查国情国力的重要途径,在"十九大"后,我国开展了第四次经济普查,主要目的是了解我国第二产业和第叁产业的发展规模及经济效益,反映供给侧结构改革和经济结构优化的进展情况,为制定中长远发展规划提供真实的数据支持和理论指导。因此,开展经济普查数据统计及质量控制相关问题的研究就显得尤为重要。(本文来源于《纳税》期刊2019年19期)

邵李文,杜建伟[7](2019)在《第二次全国污染源普查入户调查阶段数据填报质量问题的思考》一文中研究指出本文对第二次全国污染源普查入户调查阶段数据填报方面出现的多类问题进行了归纳,结合笔者亲身参与普查工作的经历,对上述问题产生的原因进行了分析,并就如何提升普查数据质量进行了探讨。(本文来源于《广州环境科学》期刊2019年01期)

刘寒[8](2019)在《大数据环境下数据质量管理、评估与检测关键问题研究》一文中研究指出随着信息社会的不断发展,信息系统中充斥着海量的、多结构的、多维度的数据资源,大数据价值已被社会全面认可,如何挖掘数据价值已成为各研究领域和各行业应用领域最为关心的问题。数据究竟是垃圾还是宝藏,最重要的问题是所要分析挖掘的数据是否是高质量的,一个低质量的数据来源会使得不仅无法体现数据价值,而且可能会与实际情况背道而驰,反而起到了副作用。目前,国内外研究机构和学者针对数据质量管理与检测问题提出了多种方法论和框架,但在实际应用当中缺乏具体执行手段,使得数据质量管理实行起来困难重重。针对数据质量管理、评估和检测的关键问题,本文做了以下工作:(1)针对数据质量管理问题,本文通过对目前国内外主流数据管理方法和框架进行了深入对比和分析,梳理出数据质量管理的通用方法流程和指标体系。提出了六项重要数据质量指标的度量方法,并提出了计算公式,为数据质量管理和评估提供了有效指导。同时,针对数据质量管理的执行情况提出了数据质量成熟度模型,为数据质量的整体评价提供了参考依据。(2)针对数据预处理问题,本文提出了一种数据离散化预处理算法。在大数据环境中,数据产生和更新频率不断加快,更多的数据是以连续方式进入信息系统,需要进行离散化处理才能够被信息系统所处理,离散化处理效率和效果对于后续数据质量检测和评估工作起到至关重要的作用。因此,本文提出了一种高效、准确的数据离散化处理算法(ICACC,Improved class-attribute contingency coefficient Method),能够有效提升大数据应用当中连续数据转换成离散数据进行处理时的效率和准确性,算法经过实验验证相比于传统处理算法准确率提升10%。(3)针对数据质量检测问题,差异性检测和完整性检测是两个最主要的方面,本文提出了两种检测方法。针对数据差异性检测问题,离群值检测是一个重要研究内容,无论在离群值的识别、过滤还是对于离群值本身的应用上都具有重要的意义。传统的离群值检测需要数据分析师和工程师基于经验或者原有的业务规则来识别数据中的离群值,这不仅是一个非常耗时的过程,而且精度很低,并且大大限制了信息系统。因此,本文提出了一种将深度学习方式和统计过程控制相结合的数据质量差异性检测方法(M-SPC,Machine—Statistics procedure control),可以利用神经网络算法和过程控制来进行离群值数据检测,经过试验数据验证效果明显。针对数据完整性检测,本文通过对数据的重要性、网络繁忙程度以及传输过程历时、故障情况等因素的综合检测,设计了一种基于随机算法和MD5加密算法的自适应数据完整性检测方法。经过实验验证,该方法能够有效检测数据传输过程中的完整性程度,提高数据价值的应用体现。(4)针对数据质量评估问题,数据有效性评估是目前最为关注的方面。如何从纷繁复杂的海量数据中找到可用数据,对于处理系统本身的效率和数据应用价值至关重要,机器学习算法的特性和数据处理方式非常适用于处理此类问题。针对此问题,本文针提出了一种数据有效性评估算法(MKS,MST K-means Slope one),并通过加入时间权重,提升原始数据在实际应用中的有效性,最后通过了实验验证。特别说明,数据质量管理与检测不同于QOS(服务质量)检测,RFC3644中对于QOS有明确规定,特指网络利用各类基础技术,为网络通信及应用提供更好服务能力,也是一种网络安全机制,目的是解决网络的延迟、阻塞等问题。而本文的数据质量管理与检测,专指针对数据质量整体框架、流程和评价维度的方法论及实现方式进行研究。(本文来源于《吉林大学》期刊2019-06-01)

涂菲菲,周明辉[9](2019)在《软件开发活动数据的数据质量问题》一文中研究指出问题追踪系统和版本控制系统等软件开发支持工具已被广泛应用于开源和商业软件的开发中,产生了大量的数据,即软件开发活动数据.软件开发活动数据被广泛应用于科学研究和开发实践,为智能化开发提供支持.然而数据质量对相关的研究和实践有重大影响,却还没有得到足够的重视.为了能够更好地警示数据使用者潜在的数据质量问题,通过文献调研和访谈,并基于自有经验对数据进行分析,总结出了9种数据质量问题,覆盖了数据产生、数据收集和数据使用这3个不同的阶段.进一步地,提出了相应的方法以帮助发现和解决数据问题.发现问题是指加强对数据上下文的理解和通过统计分析及数据可视化发现潜在的数据质量问题,解决问题是指利用冗余数据或者挖掘用户行为模式进行修正.(本文来源于《软件学报》期刊2019年05期)

刘黎志,何经纬[10](2019)在《空气质量监测大数据区间的统计问题》一文中研究指出为降低客户端和服务端之间的远程过程调用(RPC)通讯,提高对存储空气质量监测数据的HBase表的区间统计效率,提出了一种基于协处理器的大数据区间统计方法。使用终端协处理器可以将区间统计过程放在服务端运行,通过特定的协议将区间统计所需的参数从客户端传递到服务端,协处理器调用结束后,将结果返回到客户端,客户端对返回的消息进行处理汇总,最终得到区间统计结果。实验证明,使用终端协处理器进行空气质量监测数据区间统计较使用客户端扫描方式至少快一个数量级,极大地提高了统计效率。(本文来源于《武汉工程大学学报》期刊2019年02期)

数据质量问题论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着上海市水务海洋数据中心的建设运行,每天都要汇聚全市多个涉海部门的大量海洋类监测数据。针对这些不同源端数据存在的一些结构问题、格式问题、缺失问题、噪点问题等,进行了技术清洗和规范整合。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据质量问题论文参考文献

[1].王凌云.CSSCI被引文献数据质量问题的实证研究——以2007—2016年《图书情报工作》的被引数据为例[J].图书情报导刊.2019

[2].吕文斌,秦笠伟,洪敏慎.浅析海洋数据成果质量问题与清洗方法[J].数字技术与应用.2019

[3].黄佳慧.大数据引领大庆高质量发展问题探析[J].大庆社会科学.2019

[4].赵静.大数据背景下会计师事务所审计质量的提升问题分析[J].现代商业.2019

[5].陈朝兵.超越数据质量:政府数据开放质量的几个理论问题研究[J].情报杂志.2019

[6].刘金娥,杜海翡.经济普查数据统计及质量控制的相关问题研究[J].纳税.2019

[7].邵李文,杜建伟.第二次全国污染源普查入户调查阶段数据填报质量问题的思考[J].广州环境科学.2019

[8].刘寒.大数据环境下数据质量管理、评估与检测关键问题研究[D].吉林大学.2019

[9].涂菲菲,周明辉.软件开发活动数据的数据质量问题[J].软件学报.2019

[10].刘黎志,何经纬.空气质量监测大数据区间的统计问题[J].武汉工程大学学报.2019

标签:;  ;  ;  ;  

数据质量问题论文-王凌云
下载Doc文档

猜你喜欢