全文查询论文-魏俊博

全文查询论文-魏俊博

导读:本文包含了全文查询论文开题报告文献综述及选题提纲参考文献,主要关键词:全文搜索引擎,轨迹数据,分布式存储,聚合图层

全文查询论文文献综述

魏俊博[1](2019)在《基于全文搜索引擎的大规模轨迹数据高效查询统计研究》一文中研究指出轨迹数据是连续轨迹点的集合,轨迹点通常是具有时间和空间属性的空间点对象。在互联网、GPS定位等技术迅速发展的背景下,轨迹数据的种类、规模及其产生速度都在迅速增加。海量的轨迹数据必然蕴含了诸多有用的信息,通过不同的技术与方法对这些信息进行挖掘分析,对空间数据的研究与应用有着重要意义。数据的查询与统计是数据挖掘分析的必要条件,也是互联网产品日常使用过程中的基本需求;高效的数据查询与统计速度不仅能保障数据分析的时效性,而且有助于提升互联网产品的用户体验。本文基于Elasticsearch全文搜索引擎框架,以出租车轨迹数据为例,对空间轨迹数据的高效查询与统计分析做了深入研究。首先,剖析了传统关系型数据库与全文搜索引擎在大规模数据存储与检索上的优劣;其次,搭建了Elasticsearch集群服务并对其查询性能做了测试分析;再次,基于Geohash地理编码实现了WebGIS中大量点数据高效聚合展示的功能;最后,设计并开发了大规模轨迹数据高效查询统计系统,验证了将全文搜索引擎应用于轨迹数据高效检索的可行性。本研究主要取得如下成果:1)探索了出租车轨迹数据在Elasticsearch集群中的存储方案,搭建了用于存储出租车轨迹数据的Elasticsearch集群。经性能测试工具的模拟查询测试,该集群在高并发访问条件下具有高效的查询速度与可靠的稳定性。2)后台实现了起讫点数据高效动态聚合展示的相关算法,解决了传统前端WebGIS框架难以实现大规模点数据高效聚合的问题。该方法首先采用Geohash对二维空间进行网格划分,对出租车起讫点数据进行基于网格的聚类,然后将聚类结果再次进行基于密度的聚类得到最终聚合结果。经实例验证,该方法具有较好的动态聚合效率与效果。3)基于Elasticsearch集群服务与相关前端开发框架设计开发了用于大规模轨迹数据高效查询统计的可视化系统,系统支持空间查询、属性查询、聚合分析、热点区域分析等功能。从而实现了全文搜索引擎与WebGIS应用的结合。(本文来源于《长安大学》期刊2019-04-20)

殷德胜[2](2018)在《能源行业水电技术标准全文查询系统正式上线》一文中研究指出按照国家能源局的要求,水电技术标准中英文查询平台已由水电水利规划设计总院建设完成,现正式上线运行。截至2018年7月16日,水电技术标准全文公开系统已收录现行有效能源行业强制性水电技术标准7项、现行有效能源行业推荐性水电技术标准148项。同时,2018年国家能源局1号公告批准发布的NB/T 35005—2013《水电工程混凝土生产系统设计规范》、NB/T 35080—2016《水电站气垫式调压室设计规范》、NB/T 35004—2013《水力发电厂自动化设计技术规范》、NB/T(本文来源于《水力发电》期刊2018年09期)

杨文[3](2017)在《基于排序学习和查询重构的全文检索模型研究》一文中研究指出随着数字信息的爆炸式增长,我们迫切需要采用更为高效的方法来查找所需要的信息,这种情况不仅仅是体现在互联网领域中,由于台式计算机的数据存储量也随着硬盘存储能力的提高而激增,这种情况也出现在政府,学校,大型公司的文档管理事务中。现如今这些机构或公司一般是通过数据库中集成的like语句对文档进行搜索,或者是在全文检索工具库比如Lucene的基础上开发出一套知识库管理系统。然而这些方式所提供的搜索功能都是基于关键字的简单匹配,搜索效果并不理想。通过研究信息检索技术的发展进程,发现通过查询扩展或者深度挖掘文本语义的方法来提升检索效果较为有效,于是本文提出了一种将排序学习和查询重构相结合的全文信息检索模型ListGate。论文的主要研究工作如下:(1)论文引入word2vec和LDA这两种能够挖掘文本语义的方法,其中word2vec用于在词向量空间中对原始查询进行重构,将重构查询作为原始查询的扩展,而LDA产生的主题特征被融入到排序学习方法中提升评分函数的效果,同时为了解决查询重构中存在的主题偏移问题,原始查询和重构查询之间的主题偏移可以通过它们在word2vec和LDA生成的语义空间中的距离进行衡量。(2)通过对List Net排序学习算法的改进,提出了不能考虑主题偏移的ListSum模型,然后通过分析ListSum模型的不足进一步提出了能够考虑主题偏移ListGate模型,并给出ListGate模型中使用到的TFIDF,BM25,语言模型,LDA主题模型评分规则的定义,查询重构的算法以及原始查询和重构查询之间主题偏移特征的计算方法。(3)推导出ListGate中神经网络权值在随机梯度下降方法下的权值更新公式,并使用Java语言实现了List Gate模型的学习过程,然后在数据集上进行了实验。实验结果表明,加入了LDA特征的评分网络比没有加入LDA特征的评分网络最后产生的评分函数表现要好,同时引入了主题偏移特征后产生的评分函数效果比直接将原始查询和重构查询的得分线性相加的效果要好。(本文来源于《重庆大学》期刊2017-04-01)

[4](2015)在《沈阳体育学院学报网站提供论文查询和全文下载服务的通知》一文中研究指出《沈阳体育学院学报》网刊现已正式上线。为了满足广大读者的需要,本刊编辑部已实现期刊内容全部上网(自2015年第1期起),读者登陆沈阳体育学院的官方网站(http://www.syty.edu.cn),点击右上角"沈体学报",既可免费查询我刊论文目录、摘要、基金项目、作者和参考文献等信息,又可免费下载论文PDF文件,可简可繁,可阅读可存取,并实现当期杂志优先出版,实现全网首发。(本文来源于《沈阳体育学院学报》期刊2015年04期)

肖洋,朱青,吴粤皖[5](2015)在《基于压缩全文索引的演变图查询》一文中研究指出演变图中含有大量的时间和空间信息,其中某些空间信息随着时间的推移表现出相似的演变规律。给出了一种演变图查询模型,可以挖掘出在相同时间范围内具有相同变化规律的演变子图。但是演变图的规模往往是巨大的,当需要对其进行多次查询时,每次遍历整个演变图将带来非常高的查询代价,而现有的基于枚举的哈希索引算法又使得预处理过程拥有相当大的时间和空间开销,为了减少对大规模演变图的预处理代价,将压缩的全文索引技术应用于演变图,它基于涡轮转换和后缀数组。在构建后缀数组时,给出了两种不同的线性算法,确保了预处理过程的稳定性。通过在Facebook、Enron邮件系统以及模拟数据集上的实验,评估了该算法的可行性、效率以及可扩展性。(本文来源于《计算机工程与应用》期刊2015年02期)

苏奕豪,文佳蓉[6](2013)在《基于CATIA的标准件全文查询模块开发之数据库系统构建篇》一文中研究指出通过对标准件手册使用现状的分析,阐述开发基于CATIA的标准件全文查询模块的意义,提出以企业标准化职能部门将标准件贯彻新标准制作成pdf文件,采用Access构建数据库,以VB语言编写运行程序,运用宏(Macro)对CATIA进行二次开发,最后对模块整体封装,形成客户端快速安装包,建立起企业统一的完善的标准件查询浏览系统,并根据需要,进行数据库升迁,实现企业内网络共享的开发思路。结合开发实际,总结开发经验,对数据库系统的构建、模块的开发过程进行阐述。本篇内容是查询模块开发的基础部分,分步骤阐述了ACCESS数据库系统的构建方法。(本文来源于《全面建成小康社会与中国航空发展——2013首届中国航空科学技术大会论文集》期刊2013-09-25)

苏奕豪,文佳蓉[7](2013)在《基于CATIA的标准件全文查询模块开发之CATIA模块开发篇》一文中研究指出通过对标准件手册使用现状的分析,阐述开发基于CATIA的标准件全文查询模块的意义,提出以企业标准化职能部门将标准件贯彻新标准制作成pdf文件,采用Access构建数据库,以VB语言编写运行程序,运用宏(Macro)对CATIA进行二次开发,最后对模块整体封装,形成客户端快速安装包,建立起企业统一的完善的标准件查询浏览系统,并根据需要,进行数据库升迁,实现企业内网络共享的开发思路。结合开发实际,总结开发经验,对数据库系统的构建、模块的开发过程进行阐述。本文内容是查询模块开发的关键部分,分步骤阐述了将数据库系统嵌入CATIAV5的方法,并对开发的查询模块进行了应用演示。(本文来源于《全面建成小康社会与中国航空发展——2013首届中国航空科学技术大会论文集》期刊2013-09-25)

[8](2013)在《欢迎访问《暴雨灾害》编辑部网站 全文免费查询、阅览、下载》一文中研究指出《暴雨灾害》编辑部开通了网上阅览、投稿、审稿、稿件处理系统(见附图)。读者可以在网上浏览和下载本刊的标题、摘要及全文,也可了解订阅信息和下载期刊订单;作者可以网上投稿、查询稿件处理进度,下载审稿意见及稿件修改要求;专家可以在网上审稿。欢迎各位作者、专家、读者访问和使用。(本文来源于《暴雨灾害》期刊2013年03期)

谢柏楠[9](2012)在《基于全文检索的快速查询系统研究与实现》一文中研究指出信息化正在渗透着各行各业,越来越多的非结构化信息不断出现,而如今海量数据快速检索查询问题已经非常突出。从1990年由蒙特利尔大学学生AlanEmtage发明Arechie开始,搜索引擎的发展日新月异。当时World Wide Web还未出现,Arechie的搜索是通过遍历FTP网站文件程序,帮助使用者定位到该信息对应的FTP地址和可下载文件,当时的Arechie还不是真正意义的搜索引擎,后来随着互联网的快速发展,信息按几何式增长,搜索引擎开始快速发展起来。早期的搜索引擎分为目录式搜索和全文式搜索两类,搜索整理信息都是通过人工方式和半自动方式,以反馈结果的数量来衡量检索结果的好坏,并且检索结果相关性较差,资料更新缓慢。随着网络信息的日益增长,以人工分类整理的搜索引擎已经不能满足用户搜索信息的要求。第二代搜索引擎开始繁荣发展,搜索引擎依靠机器抓取,建立在超链分析基础之上,提高了查准率、查全率和检索速度。全文检索是计算机程序通过扫描文章中的每一个关键字,对每一个关键字建议一个索引,指明该字在文章中出现的次数和位置,当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程;普通的查询模式,根据Query语句,直接在数据库里执行检索,在数据量非常庞大的情况下,普通搜索的效率和准确性远远低于全文检索。本文首先对搜索引擎的技术进行研究,包括索引生成,检索服务,中文分词等。然后详细分析全文检索算法的原理和过程。针对搜索引擎和查询系统的特点,采取ORM映射方式,模拟搜索引擎数据抓录和索引生成。通过自定义数据连接管道,把全文检索移植在普通查询系统。最后设计并建立系统,实现分词的算法。通过实验,展示改进前后的查询结果和效率。(本文来源于《华南理工大学》期刊2012-05-01)

王保敏[10](2011)在《探索“标准全文查询系统”与企业标准体系表的系统集成》一文中研究指出由机械科学研究总院中机生产力促进中心标准信息研究所开发的"标准全文查询系统"应用程序已经在全国许多大中型企业运行10年,取(本文来源于《机械工业标准化与质量》期刊2011年05期)

全文查询论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

按照国家能源局的要求,水电技术标准中英文查询平台已由水电水利规划设计总院建设完成,现正式上线运行。截至2018年7月16日,水电技术标准全文公开系统已收录现行有效能源行业强制性水电技术标准7项、现行有效能源行业推荐性水电技术标准148项。同时,2018年国家能源局1号公告批准发布的NB/T 35005—2013《水电工程混凝土生产系统设计规范》、NB/T 35080—2016《水电站气垫式调压室设计规范》、NB/T 35004—2013《水力发电厂自动化设计技术规范》、NB/T

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

全文查询论文参考文献

[1].魏俊博.基于全文搜索引擎的大规模轨迹数据高效查询统计研究[D].长安大学.2019

[2].殷德胜.能源行业水电技术标准全文查询系统正式上线[J].水力发电.2018

[3].杨文.基于排序学习和查询重构的全文检索模型研究[D].重庆大学.2017

[4]..沈阳体育学院学报网站提供论文查询和全文下载服务的通知[J].沈阳体育学院学报.2015

[5].肖洋,朱青,吴粤皖.基于压缩全文索引的演变图查询[J].计算机工程与应用.2015

[6].苏奕豪,文佳蓉.基于CATIA的标准件全文查询模块开发之数据库系统构建篇[C].全面建成小康社会与中国航空发展——2013首届中国航空科学技术大会论文集.2013

[7].苏奕豪,文佳蓉.基于CATIA的标准件全文查询模块开发之CATIA模块开发篇[C].全面建成小康社会与中国航空发展——2013首届中国航空科学技术大会论文集.2013

[8]..欢迎访问《暴雨灾害》编辑部网站全文免费查询、阅览、下载[J].暴雨灾害.2013

[9].谢柏楠.基于全文检索的快速查询系统研究与实现[D].华南理工大学.2012

[10].王保敏.探索“标准全文查询系统”与企业标准体系表的系统集成[J].机械工业标准化与质量.2011

标签:;  ;  ;  ;  

全文查询论文-魏俊博
下载Doc文档

猜你喜欢