查询词聚类论文-杨河彬,贺梁,杨静

查询词聚类论文-杨河彬,贺梁,杨静

导读:本文包含了查询词聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:查询词,聚类,Word2Vec,点击模型

查询词聚类论文文献综述

杨河彬,贺梁,杨静[1](2016)在《一种融入用户点击模型Word2Vec查询词聚类》一文中研究指出用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CT-Word2Vec神经网络语言模型.CT-Word2Vec模型不仅利用词汇的上下文信息将词转化成向量,而且还将用户的搜索点击行为融入词向量的学习过程当中.聚类实验结果表明,基于Word2Vec的词向量的查询词表示方法相对于传统的词袋法在熵、纯度衡量指标上有20%到30%的提高.基于CT-Word2Vec的词向量表示方法与Word2Vec相比有2%到4%的提升.(本文来源于《小型微型计算机系统》期刊2016年04期)

万涛[2](2009)在《基于查询词聚类的信息检索系统排序模型》一文中研究指出随着万维网信息的急速膨胀,人们需要在以几何速度增长的冗繁信息中寻找自己所需要的信息。搜索引擎逐渐成为人们日常生活中网络搜索的必备工具,而且用户越来越关注网络搜索引擎的搜索性能和反馈结果。为了提高信息检索系统的整体性能,研究者需要完善和研究信息检索系统的评价方法和排序模型,使得信息检索系统反馈给用户文档更为相关。排序学习理论(Learning to Rank,LETOR)是结合信息检索技术和机器学习理论的一种新领域。LETOR理论目的是利用机器学习理论通过对训练集的自我学习,建立一个文档集相关度的排序模型。目前存在的几种信息检索系统排序方法都采用单一训练模型,其排序结果在几种传统的评估准则下表现出的性能还有待提高。针对这个问题,本文提出一种基于伪相关反馈扩展的查询词聚类算法,和基于查询词关键字的聚类算法相比,能够更好地解决查询词的简短性和模糊性影响聚类效果的问题。该算法可以获得更加可靠的查询词之间的潜在联系,基于这种潜在联系,本文进而提出一种新颖的基于查询词聚类的信息检索系统排序模型,并对查询词采用分而治之的训练方法,其要点是将查询词分为多个训练模型分别进行排序学习。使用该排序模型在OHSUMED公开数据集上做了四种模型的实验,结果表明,这种分而治之的信息检索排序模型显着地提高了信息检索系统的反馈性能,较基本的排序算法在Precision@K和nDCG@K的评价指标上有了近5%-10%的提高。(本文来源于《天津大学》期刊2009-06-01)

查询词聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着万维网信息的急速膨胀,人们需要在以几何速度增长的冗繁信息中寻找自己所需要的信息。搜索引擎逐渐成为人们日常生活中网络搜索的必备工具,而且用户越来越关注网络搜索引擎的搜索性能和反馈结果。为了提高信息检索系统的整体性能,研究者需要完善和研究信息检索系统的评价方法和排序模型,使得信息检索系统反馈给用户文档更为相关。排序学习理论(Learning to Rank,LETOR)是结合信息检索技术和机器学习理论的一种新领域。LETOR理论目的是利用机器学习理论通过对训练集的自我学习,建立一个文档集相关度的排序模型。目前存在的几种信息检索系统排序方法都采用单一训练模型,其排序结果在几种传统的评估准则下表现出的性能还有待提高。针对这个问题,本文提出一种基于伪相关反馈扩展的查询词聚类算法,和基于查询词关键字的聚类算法相比,能够更好地解决查询词的简短性和模糊性影响聚类效果的问题。该算法可以获得更加可靠的查询词之间的潜在联系,基于这种潜在联系,本文进而提出一种新颖的基于查询词聚类的信息检索系统排序模型,并对查询词采用分而治之的训练方法,其要点是将查询词分为多个训练模型分别进行排序学习。使用该排序模型在OHSUMED公开数据集上做了四种模型的实验,结果表明,这种分而治之的信息检索排序模型显着地提高了信息检索系统的反馈性能,较基本的排序算法在Precision@K和nDCG@K的评价指标上有了近5%-10%的提高。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

查询词聚类论文参考文献

[1].杨河彬,贺梁,杨静.一种融入用户点击模型Word2Vec查询词聚类[J].小型微型计算机系统.2016

[2].万涛.基于查询词聚类的信息检索系统排序模型[D].天津大学.2009

标签:;  ;  ;  ;  

查询词聚类论文-杨河彬,贺梁,杨静
下载Doc文档

猜你喜欢