查询性能预测论文-陈于思,孙林夫

查询性能预测论文-陈于思,孙林夫

导读:本文包含了查询性能预测论文开题报告文献综述及选题提纲参考文献,主要关键词:并发查询,性能预测,极限学习机,差分进化

查询性能预测论文文献综述

陈于思,孙林夫[1](2019)在《基于差分进化和极限学习机的并发查询性能预测》一文中研究指出为应对数据规模持续增长、查询负载多样化和复杂化的趋势为云服务提供商资源管理带来的挑战,提出一种基于差分进化(DE)和极限学习机(ELM)的方法 DE-ELM,对并发查询的性能进行预测。极限学习机用于预测并发查询性能,差分进化算法用于同步优化特征子集和极限学习机结构。该方法仅使用查询编译时信息、无需事先指定特征数目,也无需事先就查询交互的性质、数据库系统的内部运作机制做出先验假设。在合成数据集和真实数据集上进行了详细的实验研究,以评估极限学习机的训练效果、同步优化特征子集和极限学习机结构的效果。结果表明,DE-ELM的平均预测精度高于80%,在一定程度上证明了所提方法的可行性和有效性。(本文来源于《计算机集成制造系统》期刊2019年09期)

张忠敏,吴胜利[2](2019)在《信息检索中支持结果多样化的查询性能预测》一文中研究指出对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的叁种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的叁种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。(本文来源于《软件工程》期刊2019年02期)

陈佳伟[3](2017)在《支持检索结果多样化查询性能预测的研究》一文中研究指出对于给定的查询,搜索引擎首先对查询进行分析,之后在预先建好的索引上检索文档,并按一种排名算法产生排序的文档列表。为了评估返回文档列表的性能,通常需要人工判断,非常费时,开销很大。如能开发出自动的、无需人工判断的查询性能预测技术,有较大的实用意义。对于搜索引擎而言,提高一些难度较高查询的性能尤其必要。如能预测此类查询,采取必要的补救措施以提升查询结果的质量,肯定能够提高用户的满意度。因此,设计有效的查询相关性性能预测方法是一项有意义的工作,这也是目前信息检索领域的一个研究方向。一个查询常含有多个子意图,并且对于同一个查询,不同用户往往有不同的意图。为了让更多的用户获得较好的搜索体验,应使靠前的查询结果尽量覆盖更多的子意图。这一过程称为多样化处理,多样化后查询结果的性能称为多样化性能。在检索多样化的背景下,为了避免将多样化性能低的查询结果返回给用户,搜索引擎需要预测查询结果的多样化性能,因此本文对查询多样化性能预测进行了研究。据我们所知,目前文献中还没有涉及这方面的研究。本文主要在以下几个方面进行了研究工作:(1)对于查询相关性性能的预测,从预测查询困难度类别(困难、一般、或容易查询)的角度入手,提出了一个基于支持向量机对查询的困难度进行分类的方法。实验结果显示该方法的预测效果良好,特别在困难类别查询的预测上,有效性较高。(2)对于查询多样化性能的预测,提出了5个算法。并采用TREC Web Track2010-2011多样性任务中提交的结果检验了算法的性能,结果显示预测算法有一定的有效性。(3)分析子查询检索结果的不同获取方式对多样化预测算法的影响。因为提出的多样化预测算法,预测查询多样化性能时需分析子查询检索结果信息,而该结果除了如上一实验从外部资源获取,还可直接从检索结果多样化产生的中间结果获取。实验结果表明,提出的预测算法在性能上依然好于传统预测算法。(本文来源于《江苏大学》期刊2017-04-01)

薛源海,俞晓明,刘悦,关峰,程学旗[4](2016)在《基于查询性能预测的鲁棒检索排序研究》一文中研究指出信息检索技术致力于从海量的信息资源中为用户获取所需的信息。相较于传统的简单模型,近些年来的大量研究工作在提升了检索结果平均质量的同时,往往忽略了鲁棒性的问题,即造成了很多查询的性能下降,导致用户满意度的显着下降。本文提出了一种基于排序学习的查询性能预测方法,针对每一个查询,对多种模型得到的检索结果列表进行预测,将其中预测性能最优的检索结果列表展示给用户。在LETOR的叁个标准数据集OHSUMED、MQ2008和MSLR-WEB10K上的一系列对比实验表明,在以经典的BM25模型作为基准的情况下,与当前最好的检索模型之一LambdaMART相比,该方法在提升了检索结果平均质量的同时,显着地减少了性能下降的查询的数量,具备较好的鲁棒性。(本文来源于《中文信息学报》期刊2016年05期)

陶永全[5](2015)在《基于一种改进离散度的检索前查询性能预测》一文中研究指出在缺少相关性判断信息条件下,查询性能预测是为评估检索系统针对特定查询返回结果的有效性。针对检索前预测算法σ1、σ2和σ3只考虑查询词项在各文档间权重差异度不足的问题,提出综合考虑查询词项在各文档间权重大小和差异度大小的检索前预测算法κ1,κ2和κ3。实验结果表明,κ1,κ2和κ3预测算法性能优于σ1,σ2和σ3。(本文来源于《软件导刊》期刊2015年09期)

徐嬴,刘屹,阴红志,崔斌[6](2013)在《查询性能预测方法的性能评测研究(英文)》一文中研究指出目前的查询性能预测方法一般都是利用查询的特征、文档集合的特征以及结果列表的特征预测查询结果的平均精度(AP).一种性能预测方法与其他方法比较时,通常采用预测的AP和查询真实AP之间的皮尔森线性相关系数或是肯德尔等级相关系数来进行衡量.然而,这种简单比较方法往往不能准确评估预测方法的性能.深入探讨了查询性能预测方法性能评测中存在的问题,发现了影响比较公平性的4个因素:预测所基于的排序器、预测目标、评估指标以及实验的数据集合大小.并通过定量实验证明:1)排序器的检索性能越好,预测方法的预测性能也越好;2)不同的预测目标会影响预测性能,衡量搜索引擎质量指标(DCG)比AP更容易预测;3)相关性评估指标受数据分布影响严重,在相同的数据分布下,比较两种预测方法才公平;4)实验中查询集合过小会使得比较结果冲突,影响比较结果的可信度.本工作对查询性能预测方法的性能评测具有重要意义.(本文来源于《计算机研究与发展》期刊2013年S1期)

乔亚男,齐勇[7](2011)在《查询语义图辅助的信息检索性能预测模型》一文中研究指出查询性能预测技术试图在进行费时的实际信息检索之前对特定查询的性能进行预测,以便根据预测结果在不影响查询所代表的信息需求的基础上对查询进行调整,提高最终检索结果的精确度.针对传统查询性能预测模型没有考虑查询词间语义关系的问题,本文提出了一种查询语义图辅助的信息检索性能预测模型,该模型将表征查询词间语义关系的查询语义图引入性能预测的过程中,使查询性能预测模型避免了查询词独立性假设.实验结果表明,经过查询语义图加权的性能预测模型的预测精确度明显高于传统的性能预测模型,预测结果与实际检索结果的相关度最高提升了约46.32%.(本文来源于《电子学报》期刊2011年S1期)

李锴[8](2010)在《基于查询性能预测的案例库维护策略》一文中研究指出案例库维护是基于案例推理系统的重要组成部分。针对此将查询性能预测思想应用于基于案例推理系统的案例库维护中,设计了案例增加策略及案例删除策略,分析了基于异构案例的组织方式,重点论述了案例检索日志的构建方法。实验结果表明,该方法能够使案例库维护具有较好的自适应性。(本文来源于《山西电子技术》期刊2010年02期)

彭敦志[9](2009)在《基于聚集系数的文本检索查询性能预测》一文中研究指出随着信息技术的发展,信息资源呈爆炸性增长,人们迫切地需要从海量的文档集中搜索自己感兴趣的信息,信息检索技术应运而生并发挥着越来越重要的作用。然而,目前的信息检索系统都存在严重的鲁棒性问题,查询性能预测作为最可能解决该问题的技术,受到信息检索界的广泛关注。研究人员针对查询性能预测做了大量的工作,提出了包括Clarity Score、Robustness Score等经典的算法,然而,基于检索前的方法预测的准确性较差;基于检索后的方法,预测的准确性较高,但是都要分析所有相关文档的几何特性,计算复杂度高。本文中,我们分析了信息检索的影响因素,发现查询、文档集、检索模型及模型中的参数都对信息检索性能有重大影响,而检索系统没有识别所有查询词项更是导致检索失败的根源。基于“检索系统没有识别所有查询词项是导致检索失败的根源”和“聚团性假设”两大理论,借鉴向量空间模型中的思想,我们提出了基于聚集系数的文本检索查询性能预测模型,该模型利用聚集系数来衡量检索系统对所有查询词项的识别度和返回的相关文档间的相似度,实验证明,聚集系数与查询的难易度有着显着的一致性联系,与Clarity Score、Robustness Score模型相比,聚集系数模型能够较为准确地对查询性能进行预测。相对于以往的模型,聚集系数模型有许多创新:(1)同时利用检索系统对所有查询词项的识别度和返回文档的相似度,可以获得更好的预测性能;(2)取消了“文档中的频繁词项之间相互独立”的假设和“查询词项与文档中的频繁词项相互独立”的假设,更加符合实际应用情形;(3)只需要分析返回的前k个(k一般取10)相关文档,在取得不错的预测性能的同时,计算速度非常快。除了用于解决检索系统的鲁棒性问题,聚集系数模型还可以用于分布式信息检索的结果融合、元信息检索的结果融合、帮助用户构造更有效的查询、查询扩展等众多领域,具有重要作用。(本文来源于《中国科学技术大学》期刊2009-04-20)

郎皓,王斌,李锦涛,丁凡[10](2008)在《文本检索的查询性能预测》一文中研究指出目前,查询性能预测(predicting query performance,简称PQP)已经被认为是检索系统最重要的功能之一.近几年的研究和实验表明,PQP技术在文本检索领域有着广阔的发展前景和拓展空间.对文本检索中的PQP进行综述,重点论述其主要方法和关键技术.首先介绍了常用的实验语料和评价体系;然后介绍了影响查询性能的各方面因素;之后,按照基于检索前和检索后的分类体系概述了目前主要的PQP方法;简介了PQP在几个方面的应用;最后讨论了PQP所面临的一些挑战.(本文来源于《软件学报》期刊2008年02期)

查询性能预测论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的叁种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的叁种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

查询性能预测论文参考文献

[1].陈于思,孙林夫.基于差分进化和极限学习机的并发查询性能预测[J].计算机集成制造系统.2019

[2].张忠敏,吴胜利.信息检索中支持结果多样化的查询性能预测[J].软件工程.2019

[3].陈佳伟.支持检索结果多样化查询性能预测的研究[D].江苏大学.2017

[4].薛源海,俞晓明,刘悦,关峰,程学旗.基于查询性能预测的鲁棒检索排序研究[J].中文信息学报.2016

[5].陶永全.基于一种改进离散度的检索前查询性能预测[J].软件导刊.2015

[6].徐嬴,刘屹,阴红志,崔斌.查询性能预测方法的性能评测研究(英文)[J].计算机研究与发展.2013

[7].乔亚男,齐勇.查询语义图辅助的信息检索性能预测模型[J].电子学报.2011

[8].李锴.基于查询性能预测的案例库维护策略[J].山西电子技术.2010

[9].彭敦志.基于聚集系数的文本检索查询性能预测[D].中国科学技术大学.2009

[10].郎皓,王斌,李锦涛,丁凡.文本检索的查询性能预测[J].软件学报.2008

标签:;  ;  ;  ;  

查询性能预测论文-陈于思,孙林夫
下载Doc文档

猜你喜欢