垂直检索论文-安倩楠,高东怀,刘健

垂直检索论文-安倩楠,高东怀,刘健

导读:本文包含了垂直检索论文开题报告文献综述及选题提纲参考文献,主要关键词:教学资源,垂直检索,Lucene,XML

垂直检索论文文献综述

安倩楠,高东怀,刘健[1](2018)在《基于Lucene的教学资源垂直检索的研究与实现》一文中研究指出随着网络教学资源的与日俱增,如何在海量的教学资源中找到用户所需要的信息成为当下关注的热点。本文基于全文检索工具包Lucene,结合XML文档在教学资源中的广泛使用,设计并实现了一个面向教学资源的垂直检索系统。首先,设计系统总体架构和业务流程;然后,分析研究全文检索工具包Lucene和XML检索技术;最后,完成系统中索引模块和检索模块的实现。(本文来源于《智能计算机与应用》期刊2018年04期)

安倩楠[2](2018)在《基于Lucene的教学资源垂直检索系统的研究与实现》一文中研究指出随着信息技术的进步与网络的普及,网络上的教学资源数量逐年呈指数级增加,越来越多的用户通过互联网接受在线教育。面对数目巨大、形式各异的信息,用户需要快速准确地找到自己需要的教学资源。尽管传统的检索系统信息数量庞大、覆盖面广,但其检索结果的准确性较差,用户仍然需要从浩瀚的检索结果中找出自己所需要的资源,而垂直检索系统可以提供针对某一行业或特定领域的更高质量的检索服务。研究并开发针对教育领域的垂直检索系统可以提高用户的学习效率,是十分有必要的。本文以用户对教学资源的检索需求为研究背景,通过分析现有检索系统现状及其工作原理,基于全文检索工具包Lucene,设计并且实现面向教育领域的垂直检索系统。首先,分析研究全文检索工具包Lucene相关技术,并在原有的排序算法中加入浏览次数和权威来源两个参数,对算法进行了改进。其次,针对XML文档结构较复杂、查询较困难的情况,提出利用开源软件包Dom4j来解析和读取XML文档。再次,由于传统检索系统是基于关键字的检索,但每个用户的生活背景和知识水平不尽相同,对同一概念的表述可能会使用语义相近的查询词,导致查询结果不全面,针对此不足,设计并实现同义词扩展机制。从而使得结果更加全面,降低漏检的可能性,提高检索的召回率。最后,基于以上叁个研究重点,本文对面向教学资源的垂直检索系统进行了设计,利用现有成熟的开发技术完成系统的实现,对提供教学资源检索服务的各类平台具有较强的借鉴意义。(本文来源于《西北大学》期刊2018-06-01)

方延风[3](2018)在《基于Elastic Stack构建科技项目垂直检索系统》一文中研究指出[目的/意义]探讨建立基于Elastic Stack构建科技项目垂直检索系统的可行性。[方法/过程]以开源框架Elastic Stack为核心,搭建连接科技项目的信息采集、存储、预处理、搜索和用户交互等功能模块,解决其中的关键技术问题,并构建科技项目垂直检索系统。[结果/结论]Elastic Stack的功能可以满足科技项目垂直检索的应用场景需求,在科技项目研究工作中的应用前景可期。(本文来源于《情报探索》期刊2018年01期)

徐娟[4](2015)在《基于用户行为分析的核能领域垂直检索系统研究》一文中研究指出中国核网具有资讯及时、信息全面的特点。如何从杂乱无章的庞大数据和强干扰的信息中搜索出有价值的核能信息,这对人类的智能信息处理能力提出了挑战。由于网络资源的复杂性,通用搜索引擎已经不能满足用户信息检索的准确性需要。为了更及时、更精准地获取核能信息与核能数据,为中国核网高效及时提供精准的数据素材,保证这一核能领域门户网站的数据及时性、精确性、全面性。本文针对核能领域海量数据的高效获取、深度分类和信息检索开展研究。本文首先研究了针对核能领域专用数据的主题爬虫,实现了对核能主流数据的抓取、去噪。其次,基于支持向量机(Support Vector Machine)技术和IKAnalyzer分词技术对已爬取的海量数据按照中国核网的频道进行分类。最后,针对中国核网用户来源、搜索行为具有较为明显的聚类特性,对Lucene框架的检索排序算法进行改进,提出一种基于用户行为分析的检索排序算法,该算法很大程度上提高了搜索引擎的查询效率,为中国核网提供更有效、更精确的核能信息。相似度评分算法是全文信息检索的核心步骤,能够高效的对返回结果进行展示。本文对Lucene内部相似度评分算法进行研究之后,针对Lucene内部相似度排序算法仅考虑查询词出现频率而未考虑潜在用户心理这一问题,本文实现了面向核能领域的垂直检索系统,该系统基于改进的相似度评分算法,并且能够通过对用户最近一段时间内的检索与点击行为进行分析,获取一组用户偏好关键词,对查询词与偏好关键词进行组合评分。论文实验表明,该系统能够高效获取核能领域信息,并在保证正确率的情况下对信息进行分类,有效节约人力资源。通过对爬取的数据索引并验证其检索性能,可知改进相似度评分算法对检索时间延长30-40ms,却在在大众用户接受时间内,但该算法对搜索结果质量有一定提高。(本文来源于《合肥工业大学》期刊2015-04-01)

许文轩[5](2014)在《专利垂直检索引擎的设计和实现》一文中研究指出知识产权包括着作权、专利权和商标权,而在当中,专利权对于企业的发展尤为重要。一家企业所掌握的专利的质量和数量,直接决定了企业影响力和发展前景。但是因为世界上专利数量十分庞大,而且专利具有优先权特性,申请专利前一定要确保专利独创性,所以专利检索就是十分必要的。本文主要介绍了一个使用JAVA语言编写的专利垂直检索引擎的开发过程。该系统以APACHE软件基金会的开源项目 LUCENE和SOLR为基础,结合庖丁解牛分词法,并通过分析原有功能和实际需求进行多项扩展,完善了原有检索功能的基础上也增加了专利相关的特性。系统包括数据检索、关键词高亮和数据统计叁大主要功能。测试农明,该检索引擎能够高速准确的完成TB级别的专利检索。论文介绍了课题的研发背景和研发目的,并给出论文的结构安排。解释了相关相关概念和技术,做出需求分析,对关键技术难点做出技术预研。然后从架构设计、流程设计和模块设计多方面依次进行了系统设计,并根据系统设计做出了代码实现和软件测试。最后,对整体工作进行了总结,归纳出系统的优点和不足,并进行了下一步工作展望。(本文来源于《东北大学》期刊2014-04-01)

仓定兰,徐焕良[6](2011)在《一种面向农业领域垂直检索的研究与设计》一文中研究指出为了改善农业领域海量信息的检索效率,采用垂直搜索技术利用混合学习方法的成员搜索引擎选择策略,构建一种元搜索引擎。利用正则表达式的方法,进行农业领域网页特征库的构建。基于农业领域网页特征库,对元搜索引擎初次检索结果集进行筛选排序处理,以此来达到去除非领域相关网页和按照规则重排序的目的,实现查准。利用此特征库对元搜索引擎检索结果进行结果处理操作,最终以统一格式将结果反馈给用户。(本文来源于《江苏农业学报》期刊2011年06期)

孙海东[7](2011)在《面向医学教育视频的垂直检索的研究》一文中研究指出随着医学信息化的发展,各种医学教育视频的数量与日俱增。如何合理有效的组织和检索医学教育视频成为人们关注的热点问题之一。医学教育视频又有着不同于一般视频的突出性特点,同时考虑到患者的隐私和军队医学院校的特殊性,因此有必要构建一个局域网范围内的医学教育视频垂直检索平台。本课题的研究思路是:首先,根据国内外的医学教育视频检索平台的对比和当前检索技术文献的研究,得出课题的研究目标。其次,本课题以建构主义学习理论、社会化媒体理论和协作式学习理论为理论基础,采用ASP.NET3.5 AJAX、Lucene.net等技术设计并实现一个体现医学教育视频特点、反映学习者交互反馈的医学教育视频垂直检索平台。最后,经过相关评估指标体系测试,得出本课题的结论。本课题的主要工作包括:根据医学教育视频的特点、视频的元数据描述等,将医学教育视频描述为叁元组结构(一般性描述、教育性描述和内容性描述)。根据视频的描述,实现基于WCF架构的视频上传功能。根据医学教育视频的特点、目前已有的检索排序算法等设计两层的排序算法,从而能够使得高质量的视频排在检索结果的前面。检索结果首先采用Lucene.net自带的排序方式(相似度匹配原则)进行过滤,然后按照综合指数进行排序。综合指数的构成包括学习者的评价打分、学习者的使用得分、学习者的推荐得分和时效性得分。根据社会化媒体理论、协作式学习理论等,实现网络环境下学习者对于视频描述内容的共建,从而提高学习者对于知识的理解和融合。学习者检索过程中采用了基于同义词的扩展,从而提高了检索的查全率。本课题最终将构建一个能够上传、检索、浏览、共建和下载的医学教育视频检索平台。在视频的上传方面,采用微软的WCF架构,实现基于服务架构的上传解决方案。通过检索性能评估、学习者的满意度和系统优缺点的调查,得出以下的结论:本课题相对于以前的Sql Server、Lucene.net的检索,在查全率和排序结果上有了一定的进步;对于医学教育视频的描述能够满足学习者获取信息的需求。本课题的创新之处在于:设计上:构建了一个体现学习者使用评价、推荐评价等反馈的医学教育视频排序,使高质量的视频排在检索结果的前面;同时能够向学习者多维度的推荐质量高的医学教育视频;构建了一个体现教育性、内容性和一般性描述的医学教育视频描述模式,有利于学习者对于医学视频的学习和共建。技术上:根据建构主义理论、社会化媒体理论和协作式学习理论,以Lucene.net为主要技术架构,实现了一个体现学习者交互反馈、学习者知识共建的医学教育垂直检索平台理论上:有利于学习者对于知识的构建和交流,促进了学习者对于医学教育视频的学习。(本文来源于《第二军医大学》期刊2011-05-01)

孙海东,张力[8](2011)在《基于Lucennee.t的医学教育视频垂直检索的设计与实现》一文中研究指出面对快速增长的医学教学视频资源,如何有效的管理和组织便成为当前关注的一个热点问题。本研究首先梳理了医学教育视频检索及相关技术的现状;然后,结合医学教育的特点、社会化媒体理论和协作学习理论,构建了医学教育视频垂直检索的逻辑框架结构,并重点论述了该系统主要模块的设计和实现方法;最后,实现了检索结果的排序、检索的同义词扩展,在功能和用户体验上对已有的检索方案进行了改进。(本文来源于《开放教育研究》期刊2011年02期)

王振华,宋明,许存禄[9](2010)在《基于Lucene的影像垂直检索系统设计》一文中研究指出为解决数据高效组织和系统管理以及跨域合作数据共享体系不完善的问题,本文设计一个基于Lucene搜索引擎的Web服务影像数据服务器。该服务器核心引入Lucene的全文检索技术进行二次开发,实现一个全文垂直检索引擎,并引入Xml作为数据描述,最后用Web技术作为与用户的交互手段。该平台有易使用,扩展性能强的优点,能够将数据的多条件查询与选择传输功能有机地结合起来,为用户提供一个具有良好体验的数据共享平台。(本文来源于《计算机与现代化》期刊2010年07期)

彭韬[10](2008)在《垂直检索中的关键问题研究》一文中研究指出本文针对垂直搜索引擎“专”的特点,主要研究了产品层次信息抽取和用户产品查询扩展两个问题,主要创新工作和成果如下:第一,提出了基于网页分析的产品层次抽取算法。该算法挖掘网页上已标注的产品链接附近区域的标签重复规律,根据DOM叶子结点的DOM Path进行编码,并找出编码序列的最优重复子串,统计重复子串连续覆盖的区域,将已知网页上的产品链接(product-urls)进行深层次聚类,并找到该类别的名字。该方法在安全类产品领域网站构成的测试集中,产品链接聚类正确率达到71.0%,(类别)命名正确率(在聚类正确的基础上)达到77.3%。第二,提出了基于概念格的产品优先的查询扩展算法。信息检索中的“文档—特征词”关系能够很自然的被看作形式概念分析中的形式背景。因此,在文本处理中,文本作为实例,描述文本的关键词作为属性,就构成了形式背景,从而建立概念格。考虑概念格中的不同“概念结点”的距离,获取查询扩展词汇,并结合产品层次,就给出了基于概念格的产品优先的查询扩展。该方法在测试中展现出了良好的查询扩展性能,辅助用户精确定位所需信息。第叁,本文给出一种小型检索系统的设计方案及实现。该系统适用于各种信息检索领域的相关研究,使得个人能够在有限的硬件资源下,最大限度地模拟信息检索平台。其中,第一部分属于预处理,第二部分是本文的核心,第叁部分从工程上实现系统。(本文来源于《北京邮电大学》期刊2008-02-25)

垂直检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着信息技术的进步与网络的普及,网络上的教学资源数量逐年呈指数级增加,越来越多的用户通过互联网接受在线教育。面对数目巨大、形式各异的信息,用户需要快速准确地找到自己需要的教学资源。尽管传统的检索系统信息数量庞大、覆盖面广,但其检索结果的准确性较差,用户仍然需要从浩瀚的检索结果中找出自己所需要的资源,而垂直检索系统可以提供针对某一行业或特定领域的更高质量的检索服务。研究并开发针对教育领域的垂直检索系统可以提高用户的学习效率,是十分有必要的。本文以用户对教学资源的检索需求为研究背景,通过分析现有检索系统现状及其工作原理,基于全文检索工具包Lucene,设计并且实现面向教育领域的垂直检索系统。首先,分析研究全文检索工具包Lucene相关技术,并在原有的排序算法中加入浏览次数和权威来源两个参数,对算法进行了改进。其次,针对XML文档结构较复杂、查询较困难的情况,提出利用开源软件包Dom4j来解析和读取XML文档。再次,由于传统检索系统是基于关键字的检索,但每个用户的生活背景和知识水平不尽相同,对同一概念的表述可能会使用语义相近的查询词,导致查询结果不全面,针对此不足,设计并实现同义词扩展机制。从而使得结果更加全面,降低漏检的可能性,提高检索的召回率。最后,基于以上叁个研究重点,本文对面向教学资源的垂直检索系统进行了设计,利用现有成熟的开发技术完成系统的实现,对提供教学资源检索服务的各类平台具有较强的借鉴意义。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

垂直检索论文参考文献

[1].安倩楠,高东怀,刘健.基于Lucene的教学资源垂直检索的研究与实现[J].智能计算机与应用.2018

[2].安倩楠.基于Lucene的教学资源垂直检索系统的研究与实现[D].西北大学.2018

[3].方延风.基于ElasticStack构建科技项目垂直检索系统[J].情报探索.2018

[4].徐娟.基于用户行为分析的核能领域垂直检索系统研究[D].合肥工业大学.2015

[5].许文轩.专利垂直检索引擎的设计和实现[D].东北大学.2014

[6].仓定兰,徐焕良.一种面向农业领域垂直检索的研究与设计[J].江苏农业学报.2011

[7].孙海东.面向医学教育视频的垂直检索的研究[D].第二军医大学.2011

[8].孙海东,张力.基于Lucennee.t的医学教育视频垂直检索的设计与实现[J].开放教育研究.2011

[9].王振华,宋明,许存禄.基于Lucene的影像垂直检索系统设计[J].计算机与现代化.2010

[10].彭韬.垂直检索中的关键问题研究[D].北京邮电大学.2008

标签:;  ;  ;  ;  

垂直检索论文-安倩楠,高东怀,刘健
下载Doc文档

猜你喜欢