垂直信息检索论文-李飞龙

垂直信息检索论文-李飞龙

导读:本文包含了垂直信息检索论文开题报告文献综述及选题提纲参考文献,主要关键词:垂直信息检索,中文分词,爬虫,Lucene

垂直信息检索论文文献综述

李飞龙[1](2017)在《Web垂直信息检索技术及算法的研究与实现》一文中研究指出伴随着计算机硬件的不断发展,互联网也随着硬件方面的提升而得到了空前的发展,特别是在这个数据爆发的时代,大量信息覆盖着整个社会,随之就出现了大数据以及相关计算机的新技术。在大数据时代里,信息检索系统能够准确无误地找到人们自身所需的数据,其中信息检索系统的定义是用户根据一定的检索关键字或者策略,借助相关的爬虫技术,将互联网上的相关的数据爬取下来,并通过中文分词、网页去重、排序优化等相关技术对爬取下来的数据信息进行处理,最后呈现给用户所需求的信息。其中,中国的百度、360以及国外的Google、Yahoo等最具有代表意义,尽管它们专注于检索领域,但都各有各的特点,成为人们生活中必不可少的工具。由于Google、Yahoo、百度、360等检索的范围大,涉及到信息量广,针对特定的领域检索可能还存在一定的困难。为了克服针对特定的领域的专业检索,人们便引入了垂直信息检索系统的概念。垂直信息检索系统的定义是基于某一专业领域所开发的信息检索系统,如文档垂直信息检索系统、旅游垂直信息检索系统以及购物垂直信息检索系统等等。本项目,主要研究新闻垂直信息检索系统,并在原有技术的基础上进行了相关的优化操作:首先,在Heritrix的原型上进行二次开发,使得优化后的Heritrix爬虫技术爬取网页资源效率更高;然后在获得网页资源的基础上,通过HTMLParser技术将网页格式转化成TXT文本格式,并以IK Analyzer分词技术为基础进行了优化,对TXT文本内容进行分词以及过滤TXT文本内容中的脏数据;接着改进TF-IDF加权算法,有效去除网页中重复的部分;最后,以Struts+Spring+Hibernate为架构,以MySQL为存储数据库,借助PageRank算法改进Lucene的排序算法,创建以及查询索引,实现新闻垂直信息检索系统。(本文来源于《广东技术师范学院》期刊2017-06-20)

张洋[2](2013)在《垂直搜索引擎的研究及在机场信息检索中的应用》一文中研究指出随着国内各大航空公司业务的飞速发展和提高服务质量的迫切需求,国内各大机场纷纷建立了官方网站,为乘客提供诸如航班信息查询、进出港引导、重要信息提示、相关规定查询、在线咨询等信息服务,在一定程度上方便了旅客,同时也提高了机场的服务质量。但是这些与机场相关的信息往往多是分散在各机场的网站里,当乘客需要查询特定机场信息时,一般需要通过通用搜索引擎检索相关机场的主页,然后进入网站内逐层打开网页,查找和筛选所需信息,步骤繁琐且不方便。本课题对垂直搜索引擎进行了研究,基于Nutch构建了机场垂直搜索引擎系统。论文分析了民航垂直搜索引擎的构成,介绍了系统的总体设计原则、体系结构、系统流程、模块划分等,对各流程进行了优化设计。实验和实用表明,设计的垂直搜索引擎系统能满足用户需求,可为机场相关信息检索提供“一站式”的便捷服务,达到了预期设计要求。(本文来源于《河北科技大学》期刊2013-12-01)

垂直信息检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着国内各大航空公司业务的飞速发展和提高服务质量的迫切需求,国内各大机场纷纷建立了官方网站,为乘客提供诸如航班信息查询、进出港引导、重要信息提示、相关规定查询、在线咨询等信息服务,在一定程度上方便了旅客,同时也提高了机场的服务质量。但是这些与机场相关的信息往往多是分散在各机场的网站里,当乘客需要查询特定机场信息时,一般需要通过通用搜索引擎检索相关机场的主页,然后进入网站内逐层打开网页,查找和筛选所需信息,步骤繁琐且不方便。本课题对垂直搜索引擎进行了研究,基于Nutch构建了机场垂直搜索引擎系统。论文分析了民航垂直搜索引擎的构成,介绍了系统的总体设计原则、体系结构、系统流程、模块划分等,对各流程进行了优化设计。实验和实用表明,设计的垂直搜索引擎系统能满足用户需求,可为机场相关信息检索提供“一站式”的便捷服务,达到了预期设计要求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

垂直信息检索论文参考文献

[1].李飞龙.Web垂直信息检索技术及算法的研究与实现[D].广东技术师范学院.2017

[2].张洋.垂直搜索引擎的研究及在机场信息检索中的应用[D].河北科技大学.2013

标签:;  ;  ;  ;  

垂直信息检索论文-李飞龙
下载Doc文档

猜你喜欢