相似度检索论文-白菊,何聚厚

相似度检索论文-白菊,何聚厚

导读:本文包含了相似度检索论文开题报告文献综述及选题提纲参考文献,主要关键词:Lucene,相似度,问答系统,语义

相似度检索论文文献综述

白菊,何聚厚[1](2017)在《应用于问答系统的Lucene相似度检索算法改进》一文中研究指出Lucene在文本检索和搜索领域有着广泛的应用,相似度评分算法是其搜索引擎的核心部分之一。而在问答系统中,也要用到检索功能,相似度评分算法也是其核心部分之一。那么能否对Lucene的相似度评分算法进行改进,使其在问答系统的领域也能得到很好的应用。针对上述提出的问题,结合问答系统中问句简短、包含信息量少的特点,引入外部词典对查找的关键词进行扩展,分析检索词项的语义相似度以及将词项位置关系的特征应用到Lucene中。在Lucene的基础上,对其语义相似度算法进行改进,提出了一种新的语义相似度评分算法。该算法考虑了词项位置关系和语义理解,能够更好地应用于问答系统。实验结果表面,提出的相似度算法能有效地提高自动问答系统的回答准确率。(本文来源于《计算机技术与发展》期刊2017年11期)

王帆[2](2016)在《一种基于DTW的图像时间序列相似度检索方法》一文中研究指出移动互联网时代的到来,加快了信息的分享和流动,过于泛滥的信息引爆了信息灾难,多媒体资源也深受其害,现如今多媒体资源已经成为互联网信息传播最主要媒介之一,图像是多媒体资源传播最为简单、直观的一个载体,图像检索成为当下的一个研究热点。然而基于传统的内容的图像检索技术,面临的首要问题是特征向量提取难度大,其次就是采用顺序检索方式,检索效率非常低;基于高维向量索引技术,暴露出的则是维度灾难问题,索引的建立工作量巨大,且索引的更新频率快。这些诸多问题已不能满足当下快速检索图像的一个需求,需要迫切提出一种新的检索方法来解决以上问题。本文针对以上问题结合图像在时间序列上的概念,进一步对图像检索领域深入研究,主要工作内容如下:1.针对高维向量维度信息丢失问题,本文提出了一种对高维向量文本化表示的改进,在全文检索技术应用到高维向量检索过程之前,首先需要将高维向量转变为文本信息,最简捷的方式是将高维向量中每一个数字拼接成一个字符串的形式,但是这种转变方式存在一定的缺陷,将会导致高维向量维度信息丢失。本文在高维向量转变过程中做了一个改进,在当前的维度信息转变为单个词之前加上一个维度标识信息,维度标识信息则表示高维向量的维度信息,就可避免上述问题。2.本文最主要的工作是提出一种DTW图像时间序列相似性匹配算法模型,把时间序列从声音识别领域引入到图像检索领域,它结合图像时间序列的相似性在时间空间上特性和动态时间规整算法的特点。首先遍历待检索的图像,利用时间序列特性,提取出每张图像像素序列,将得到一个长度为定值的数字序列,且在每个数字序列中加入了一组值为256的RGB颜色模型,最终得到本文需要的数字序列,最后通过DTW算法计算不同数字序列间的相似度距离。通过试验结果可以看出,基于DTW图像时间序列相似性检索方法可以快速检索相似性图像,相对基于内容的图像检索技术,不要提取图像特征向量,相对高位向量索引技术不需要对每一个目标建立一个索引,是一种需要对数据集进行训练,而能够快速检索出那些具有相似度图像的结果集的方法。(本文来源于《湖南大学》期刊2016-05-05)

井妍[3](2016)在《基于词相似度检索的环保执法数据系统研发》一文中研究指出现如今,互联网信息技术及相关技术发展日新月异,互联网越来越多的应用到人们的学习、生活及工作当中。政府等相关部门、系统也为提高工作效率,实施采用一系列电子政务系统。电子政务系统将越来越多的取代传统的办公方式与系统。对于环境保护方面,目前由于工农业、旅游业的发展,给环境带来的压力越来越大,生态等环境问题也比较突出。但是现有的环保执法法律法规的查询受制于时间、空间、设备等的限制,执法人员无法快速执法,从而影响执法效率,导致执法力量明显薄弱。如何使执法人员都能快速并有效地查询到执法所需法规,并且普通民众也可通过该系统查询环境保护法律法规,实现执法信息共享成为一个关键问题。为满足大理洱海环保局对环保法律法规管理系统建设的需求,做出需求分析,建立系统各功能模块,并对系统体系结构、平台、语言及所涉及到的知识和技术进行了研究。本文采用B/S结构,J2EE平台,使用JSP语言和MySQL数据库,设计开发了一个基于web的系统。在此基础上,本文重点研究了词语相似度的计算,结合法律法规用词具有专业性特殊性的特点和《知网》知识库,生成相似度不同的关键词集。基于关键词相似度的检索,可解决查询时所用词与具有特殊性的法律法规用词不匹配所造成的无法检索到结果的问题。最后进行系统测试,验证本文系统设计和算法的可行性。(本文来源于《昆明理工大学》期刊2016-03-01)

余兴华,仲梁维[4](2015)在《一种改进的流程图相似度检索算法及实现》一文中研究指出面对企业的大量业务流程管理问题,探究了基于Petri网对工作流模型的表达,对有向图邻接矩阵定义规则作了改进,成功地建立了描述流程模型间关系的邻接模型矩阵,对业务流程模型检索具有重要意义。在此基础上基于模糊理论的贴近度概念,计算邻接模型矩阵间的相似度。为了更方便地存储流程模型,提出了模型矩阵库概念。通过实例证明了该算法在流程模型相似度检索方面的合理性和有效性。(本文来源于《计算机应用研究》期刊2015年11期)

吴新强,周娅,王如意,张敬伟,林煜明[5](2015)在《基于Lucene的XML文件相似度检索系统》一文中研究指出经分析研究开源的Lucene系统架构以及特殊xml数据源,针对Lucene搜索得分公式的不足,提出了结合词项位置和二次检索的公式,设计一种文本搜索系统;并以提高检索性能、相似性搜索的准确率、索引的空间效率和支持查询的时间效率为目标进行实验,最后通过部署Tomcat服务器实现.经实验验证,改进的系统较之于原Lucene系统提高了建立索引效率、查询效率、准确率.(本文来源于《计算机系统应用》期刊2015年02期)

彭涛,孙连英,刘海波,周家驹[6](2012)在《基于分子指纹的化学结构相似度检索系统的研究(英文)》一文中研究指出化学结构相似性检索在现代化学研究中具有重要作用。而化学结构的相似性度量是进行相似度检索的基础和前提。目前在化学信息学的研究中,有数量众多的化学结构距离度量和相似度表示方法。本文采用了Daylight的分子指纹方法,并采用了Tanimoto系数定义的相似度度量方法。并根据这种度量方法使用CDK来进行计算化学结构的相似度指数。在上述研究工作的基础上,开发了基于浏览器/服务器模式的化学结构相似度检索系统,通过该系统可以在中药活性成分数据库中进行化学结构相似度检索。用户在进行化学结构相似度检索时,可以选择已存在的化学结构,也可以采用JME来绘制新的化学结构。下一步将在该数据库中进行聚类分析和分子多样性的研究。(本文来源于《计算机与应用化学》期刊2012年03期)

黄承慧,印鉴,陆寄远[7](2011)在《一种改进的Lucene语义相似度检索算法》一文中研究指出在Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。(本文来源于《中山大学学报(自然科学版)》期刊2011年02期)

相似度检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

移动互联网时代的到来,加快了信息的分享和流动,过于泛滥的信息引爆了信息灾难,多媒体资源也深受其害,现如今多媒体资源已经成为互联网信息传播最主要媒介之一,图像是多媒体资源传播最为简单、直观的一个载体,图像检索成为当下的一个研究热点。然而基于传统的内容的图像检索技术,面临的首要问题是特征向量提取难度大,其次就是采用顺序检索方式,检索效率非常低;基于高维向量索引技术,暴露出的则是维度灾难问题,索引的建立工作量巨大,且索引的更新频率快。这些诸多问题已不能满足当下快速检索图像的一个需求,需要迫切提出一种新的检索方法来解决以上问题。本文针对以上问题结合图像在时间序列上的概念,进一步对图像检索领域深入研究,主要工作内容如下:1.针对高维向量维度信息丢失问题,本文提出了一种对高维向量文本化表示的改进,在全文检索技术应用到高维向量检索过程之前,首先需要将高维向量转变为文本信息,最简捷的方式是将高维向量中每一个数字拼接成一个字符串的形式,但是这种转变方式存在一定的缺陷,将会导致高维向量维度信息丢失。本文在高维向量转变过程中做了一个改进,在当前的维度信息转变为单个词之前加上一个维度标识信息,维度标识信息则表示高维向量的维度信息,就可避免上述问题。2.本文最主要的工作是提出一种DTW图像时间序列相似性匹配算法模型,把时间序列从声音识别领域引入到图像检索领域,它结合图像时间序列的相似性在时间空间上特性和动态时间规整算法的特点。首先遍历待检索的图像,利用时间序列特性,提取出每张图像像素序列,将得到一个长度为定值的数字序列,且在每个数字序列中加入了一组值为256的RGB颜色模型,最终得到本文需要的数字序列,最后通过DTW算法计算不同数字序列间的相似度距离。通过试验结果可以看出,基于DTW图像时间序列相似性检索方法可以快速检索相似性图像,相对基于内容的图像检索技术,不要提取图像特征向量,相对高位向量索引技术不需要对每一个目标建立一个索引,是一种需要对数据集进行训练,而能够快速检索出那些具有相似度图像的结果集的方法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

相似度检索论文参考文献

[1].白菊,何聚厚.应用于问答系统的Lucene相似度检索算法改进[J].计算机技术与发展.2017

[2].王帆.一种基于DTW的图像时间序列相似度检索方法[D].湖南大学.2016

[3].井妍.基于词相似度检索的环保执法数据系统研发[D].昆明理工大学.2016

[4].余兴华,仲梁维.一种改进的流程图相似度检索算法及实现[J].计算机应用研究.2015

[5].吴新强,周娅,王如意,张敬伟,林煜明.基于Lucene的XML文件相似度检索系统[J].计算机系统应用.2015

[6].彭涛,孙连英,刘海波,周家驹.基于分子指纹的化学结构相似度检索系统的研究(英文)[J].计算机与应用化学.2012

[7].黄承慧,印鉴,陆寄远.一种改进的Lucene语义相似度检索算法[J].中山大学学报(自然科学版).2011

标签:;  ;  ;  ;  

相似度检索论文-白菊,何聚厚
下载Doc文档

猜你喜欢