文档模型论文-徐建民,何丹丹,吴树芳

文档模型论文-徐建民,何丹丹,吴树芳

导读:本文包含了文档模型论文开题报告文献综述及选题提纲参考文献,主要关键词:信念网络,文档关系,检索模型,文档相似度

文档模型论文文献综述

徐建民,何丹丹,吴树芳[1](2019)在《基于文档关系的扩展信念网络检索模型》一文中研究指出合理利用文档关系可以提高模型的检索性能。针对基本信念网络检索模型未考虑文档关系的不足,通过在基本模型上增加一层文档节点,提出一种具有两层文档节点的扩展信念网络检索模型,给出了模型的拓扑结构和概率推导。在拓扑结构中,术语与查询的关系、术语与文档的关系和两层文档之间的关系都用弧来表示,其中文档关系依据文档相似度确定。在概率推导中,利用文档相似度及文档节点的父文档个数对原模型的概率推导做出修正,使得检索概率更为准确。实验采用折损累积增益值和查准率-查全率曲线来评价扩展模型的性能,结果表明,扩展模型使得相关文档排名更合理,并且在保证查全率的条件下提高了查准率。(本文来源于《情报学报》期刊2019年11期)

县小平,马国俊[2](2019)在《基于随机游走算法的中文文档信息处理模型》一文中研究指出由于中文信息处理的复杂性和特殊性,中文搜索引擎技术需要不断改进,中文搜索引擎不能直接照搬国外技术,研究和分析中文的专业知识,可以准确地发现在海量信息库中对中文信息的需求。本文在字符识别中引入了随机游走模型的字典学习和稀疏表示,解决了钢笔字符和传真字符的噪声问题,提出了一种新的分析框架用来帮助处理。该识别方法不需要预处理操作如字符二值化和细化,仅需要一个特征和一个分类器,与当前的多特征多级联分类器融合识别。提出的方法具有低复杂度的特点,实验结果也反映了该模型的鲁棒性。(本文来源于《青海科技》期刊2019年03期)

邓思颖[3](2019)在《基于卷积神经网络的文档库自动问答模型研究》一文中研究指出随着互联网的发展势头越来越强劲,人们在日常生活中也越来越依赖互联网技术,如何在庞大的数据量中精准而高效地获取到有用的信息也越来越重要,学术界和工业界也越多越多的聚焦在自然语言处理领域中的自动问答技术。然而,随着数据的爆发式增长,传统的自动问答技术已经无法满足人们希望智能的获取精准信息的要求,因此,越来越多的学者们利用词语的分布式表示技术和通过神经网络模型学习句子的抽象语义特征来解决这一问题。基于文档库的自动问答任务的核心目标是进行文本匹配和答案选择,其实质是通过计算问题与候选文档之间的相关度来选择与问题相匹配的答案,而如何将词汇和文本所蕴含的深层语义特征用向量更准确的表示出来是解决这一问题的关键,进而才能提高模型的准确率。本文为了提高文本匹配与答案选择模型的准确性,所做的主要工作如下:本文提出一种结合多元特征的自动问答模型,通过在词嵌入层添加问题答案对之间的重迭信息(Overlap),句子中的词语位置信息(Position),以及逆向文档频率(IDF)特征,使得词向量矩阵能够蕴含更多语义信息,对后续神经网络模型学习到更加丰富而精确的文本向量表示起到了提升作用。本文使用的是基于注意力机制的卷积神经网络模型,通过注意力机制对卷积层输出的问答对特征矩阵进行加权,可以在问答对之间建立联系,使得文本中的关键信息将会发挥更大的作用。另外使用不同大小的多种滤波器可以捕获到句子中不同长度的抽象语义特征并组合起来,可以使得卷积神经网络的答案选择准确率得到提高。本文在NLPCC 2016 DBQA的数据集上进行了实验验证,通过与传统方法和baseline进行对比,并且对本文所提的扩展特征进行了单一分析对比和组合分析验证,实验结果表明,本文所提模型的MAP、MRR等指标的结果都有一定程度的提高,进而可以证明上述方法的有效性。(本文来源于《华中师范大学》期刊2019-05-01)

王寅[4](2019)在《XML文档加权层次子树模型的建立》一文中研究指出随着互联网的快速发展,具有自描述、半结构化和可扩展特点的XML成为互联网上数据存储和数据交换的标准。本文在树型结构模型和频繁路径模型的基础上,提出针对XML文档结构聚类的模型——加权层次子树模型,能够表示出XML文档的层次关系和层次信息。通过消除重复元素和重复表达式,用更加简洁的表达式表示出XML文档的层次和元素信息,能够快速、准确分辨出具有相同结构的X ML文档。(本文来源于《数字技术与应用》期刊2019年04期)

喻志超,施运梅[5](2019)在《面向云平台环境下流式文档的访问控制模型》一文中研究指出随着Web2. 0技术与云技术的不断发展,WebOffice已经成为非常流行的新办公平台,但数据共享和权限滥用导致的数据安全问题成为了WebOffice发展的一大阻碍。为此,针对云平台中共享文档的访问控制安全问题,设计了基于属性与信任的访问控制模型A-TBAC,并对访问请求和策略判定进行了形式化定义。该模型应用到了支持流式文档存储和多人协作编辑的DAVOffice系统中,实验表明A-TBAC模型有效地集成了ABAC和RBAC模型的特点,既具有前者在细粒度控制方面的优势,又具有后者能够动态调整用户权限的优点。(本文来源于《北京信息科技大学学报(自然科学版)》期刊2019年02期)

陈巧红,董雯,孙麒,贾宇波[6](2019)在《基于混合神经网络的单文档自动文摘模型》一文中研究指出针对现有单文档自动文摘方法获取文摘的连贯性和准确度较差的问题,提出了一种基于混合神经网络的自动文摘模型。该模型将卷积神经网络和长短期记忆网络相结合,并在长短期记忆网络的输入端增加了一个记忆细胞状态。该模型首先利用卷积神经网络对句子进行向量表示;然后将每个句子中的词向量和文档中的句向量分别输入两个长短期记忆网络,得到句子和文档的匹配程度;最后将匹配程度高的句子进行组合,获得文摘。实验发现:基于混合神经网络的单文档自动文摘模型与LSI、LDA、TextRank、PCA以及长短期记忆网络模型相比,ROUGE-2和ROUGE-3值均有0.01左右的提升,这表明提出的模型获取文摘的可读性较好,上下文关系明确,有效提升了自动文摘的质量。(本文来源于《浙江理工大学学报(自然科学版)》期刊2019年04期)

孙护军[7](2019)在《基于大数据分析的增强型网络文档分类模型》一文中研究指出针对海量网络文档涵盖着广泛的主题和类别,需要使用大数据技术提取有用信息的问题,使用文本挖掘技术和进化模糊算法,基于模糊规则的分类器,提出一种增强型网络文档分类模型,将网络文档归到不同类别(领域)中,进化模糊算法可依据文档内容的变化实现文档分类的动态实时更新。通过和其它经典分类算法对比,验证了该分类算法能够取得较好的效果。(本文来源于《计算机工程与设计》期刊2019年03期)

马永军,李亚军,汪睿,陈海山[8](2019)在《基于Wasserstein GAN的文档表示模型》一文中研究指出文档表示模型可以将非结构化的文本数据转化为结构化数据,是多种自然语言处理任务的基础,而目前基于词的模型在文档表示任务中有着无法直接表示文档的缺陷。针对此问题,基于生成对抗网络GAN可以使用两个神经网络进行对抗学习,从而很好地学习到原始数据分布的特点,提出了文档表示模型WADM,使用去噪自编码器作为其判别网络,由其隐层直接得到文档的分布表示。实验表明,WADM能够准确抽取文档特征,相比基于词的模型具有更强的文档表示能力。(本文来源于《计算机工程与科学》期刊2019年01期)

杨志明,时迎成,王泳,潘昊杰,毛金涛[9](2018)在《基于BiDAF多文档重排序的阅读理解模型》一文中研究指出随着互联网的兴起和发展,数据规模急速增长,如何利用机器阅读理解技术对海量的非结构化数据进行解析,从而帮助用户快速、准确地查找到满意答案,是目前自然语言理解领域中的一个热门课题。该文通过对机器阅读理解中的深度神经网络模型进行研究,构建了RBiDAF模型。首先,通过对DuReader数据集进行数据探索,并对数据进行预处理,从中提取出有利于模型训练的特征。其次在BiDAF模型的基础上提出了基于多文档重排序的RBiDAF机器阅读理解模型,该模型在BiDAF模型四层网络框架的基础上添加了ParaRanking层。其中在ParaRanking层,该文提出了多特征融合的ParaRanking算法,此外在答案预测层,提出了基于先验知识的多答案交叉验证算法,进而对答案进行综合预测。在"2018机器阅读理解技术竞赛"的最终评测中,该模型表现出了不错的效果。(本文来源于《中文信息学报》期刊2018年11期)

刘剑,黄桂敏,潘婷婷[10](2018)在《基于文档分布式表示的英语作文跑题分析模型》一文中研究指出针对传统英语作文跑题检测方法需多篇参考范文进行对比的局限性,提出一种基于文档分布式表示的英语作文跑题分析模型。该模型将词的分布式表示方法与文档的分布式表示方法相结合,从而充分利用作文标题的语义信息对待测作文进行跑题分析,并在真实的数据集中进行实验。实验结果表明,该方法仅需作文标题就可以有效判断英语作文是否跑题,并且具有较高的准确率和较好的实用性。(本文来源于《桂林电子科技大学学报》期刊2018年05期)

文档模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

由于中文信息处理的复杂性和特殊性,中文搜索引擎技术需要不断改进,中文搜索引擎不能直接照搬国外技术,研究和分析中文的专业知识,可以准确地发现在海量信息库中对中文信息的需求。本文在字符识别中引入了随机游走模型的字典学习和稀疏表示,解决了钢笔字符和传真字符的噪声问题,提出了一种新的分析框架用来帮助处理。该识别方法不需要预处理操作如字符二值化和细化,仅需要一个特征和一个分类器,与当前的多特征多级联分类器融合识别。提出的方法具有低复杂度的特点,实验结果也反映了该模型的鲁棒性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文档模型论文参考文献

[1].徐建民,何丹丹,吴树芳.基于文档关系的扩展信念网络检索模型[J].情报学报.2019

[2].县小平,马国俊.基于随机游走算法的中文文档信息处理模型[J].青海科技.2019

[3].邓思颖.基于卷积神经网络的文档库自动问答模型研究[D].华中师范大学.2019

[4].王寅.XML文档加权层次子树模型的建立[J].数字技术与应用.2019

[5].喻志超,施运梅.面向云平台环境下流式文档的访问控制模型[J].北京信息科技大学学报(自然科学版).2019

[6].陈巧红,董雯,孙麒,贾宇波.基于混合神经网络的单文档自动文摘模型[J].浙江理工大学学报(自然科学版).2019

[7].孙护军.基于大数据分析的增强型网络文档分类模型[J].计算机工程与设计.2019

[8].马永军,李亚军,汪睿,陈海山.基于WassersteinGAN的文档表示模型[J].计算机工程与科学.2019

[9].杨志明,时迎成,王泳,潘昊杰,毛金涛.基于BiDAF多文档重排序的阅读理解模型[J].中文信息学报.2018

[10].刘剑,黄桂敏,潘婷婷.基于文档分布式表示的英语作文跑题分析模型[J].桂林电子科技大学学报.2018

标签:;  ;  ;  ;  

文档模型论文-徐建民,何丹丹,吴树芳
下载Doc文档

猜你喜欢