单文档主题划分论文-陈志敏,沈洁,赵耀

单文档主题划分论文-陈志敏,沈洁,赵耀

导读:本文包含了单文档主题划分论文开题报告文献综述及选题提纲参考文献,主要关键词:主题划分,文档对象模型,语义相似度,自动摘要

单文档主题划分论文文献综述

陈志敏,沈洁,赵耀[1](2009)在《一种基于DOM的Web文档主题划分方法》一文中研究指出主题划分是多主题文档自动摘要中的一个重要问题,提出了一种以网页结构为指导,利用页面对应DOM树中节点的自然分割功能以及相邻边界节点语义相似度的比较进行网页主题划分的方法。实验结果表明该方法具有较高的划分准确率,在此基础上抽取的网页摘要可显着增加文摘内容对原文的覆盖率、有效解决Web文档摘要分布不平衡问题。(本文来源于《计算机应用与软件》期刊2009年08期)

张元虹[2](2009)在《基于主题划分的中文单文档自动文摘系统的研究》一文中研究指出自动文摘作为自然语言处理领域的一个重要应用,也是一项极具难度和挑战性的工作,在信息检索、信息管理、数字图书馆等领域有着广泛的应用。因此,对自动文摘的研究具有很大的理论意义和实际意义。基于统计的自动文摘是一种研究较早、并被广泛使用的文摘方法。这种方法的一大优点就是领域不受限制,不同领域的文章都可以使用此种方法进行文摘。但是这种方法的文摘又存在着不全面、不简洁和不连贯叁个方面的缺点,使得摘要的结果不太尽人意。本文以统计的自动文摘方法为基础,将主题划分和摘要句优化两部分技术溶入基于统计的自动文摘方法中,使生成的摘要更全面、简洁、连贯。本文的研究内容主要包括以下几个方面:1.提出了使用改进的K-means算法来划分文本的主题,使抽取出的摘要句更加全面。2.在生成粗摘要句的基础上对粗摘要句进行优化处理,使输出的摘要句更简洁、连贯。3.在以上两步的基础上,开发一个中文单文档自动文摘原型系统。对该系统,运用内部评测手段评估系统的性能,包括与“理想”摘要对比和与机械式自动文摘以及Word2003自动摘要系统进行了比较,试验结果证明,本系统性能指标优于机械式自动文摘和Word2003自动文摘系统。(本文来源于《昆明理工大学》期刊2009-05-31)

孔庆苹,刘宗田,廖涛[3](2008)在《基于概念获取的多文档主题划分研究》一文中研究指出对多个相关文档进行主题划分对于信息检索、自动摘要等研究领域都有重要的应用价值。当前流行的文本主题划分技术中,多采用词频向量进行文本表示,而研究表明将特征向量映射到概念级,将改善多文档主题划分的效果。本文提出了一种应用知网(HowNet)来获取多文本的概念作为特征向量,再应用聚类的方法对文档集中的相似段落进行归类,得到主题划分的结果,解决了多文档的结构分析问题。实验结果表明该方法对多个相关文档的主题划分取得了良好的效果。(本文来源于《计算机科学》期刊2008年05期)

单文档主题划分论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

自动文摘作为自然语言处理领域的一个重要应用,也是一项极具难度和挑战性的工作,在信息检索、信息管理、数字图书馆等领域有着广泛的应用。因此,对自动文摘的研究具有很大的理论意义和实际意义。基于统计的自动文摘是一种研究较早、并被广泛使用的文摘方法。这种方法的一大优点就是领域不受限制,不同领域的文章都可以使用此种方法进行文摘。但是这种方法的文摘又存在着不全面、不简洁和不连贯叁个方面的缺点,使得摘要的结果不太尽人意。本文以统计的自动文摘方法为基础,将主题划分和摘要句优化两部分技术溶入基于统计的自动文摘方法中,使生成的摘要更全面、简洁、连贯。本文的研究内容主要包括以下几个方面:1.提出了使用改进的K-means算法来划分文本的主题,使抽取出的摘要句更加全面。2.在生成粗摘要句的基础上对粗摘要句进行优化处理,使输出的摘要句更简洁、连贯。3.在以上两步的基础上,开发一个中文单文档自动文摘原型系统。对该系统,运用内部评测手段评估系统的性能,包括与“理想”摘要对比和与机械式自动文摘以及Word2003自动摘要系统进行了比较,试验结果证明,本系统性能指标优于机械式自动文摘和Word2003自动文摘系统。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

单文档主题划分论文参考文献

[1].陈志敏,沈洁,赵耀.一种基于DOM的Web文档主题划分方法[J].计算机应用与软件.2009

[2].张元虹.基于主题划分的中文单文档自动文摘系统的研究[D].昆明理工大学.2009

[3].孔庆苹,刘宗田,廖涛.基于概念获取的多文档主题划分研究[J].计算机科学.2008

标签:;  ;  ;  ;  

单文档主题划分论文-陈志敏,沈洁,赵耀
下载Doc文档

猜你喜欢