抽取框架论文-毛瑞彬,吕华揆,朱菁

抽取框架论文-毛瑞彬,吕华揆,朱菁

导读:本文包含了抽取框架论文开题报告文献综述及选题提纲参考文献,主要关键词:上市公司公告,序列标注,语义分析,篇章级信息抽取框架

抽取框架论文文献综述

毛瑞彬,吕华揆,朱菁[1](2019)在《上市公司公告篇章级信息抽取框架与实现》一文中研究指出【目的/意义】构建一个面向上市公司公告的篇章级信息抽取框架,实现多种类型信息的抽取,并服务于投资和监管。【方法/过程】以深圳A股市场公告中的635篇并购重组公告为例,从中抽取了交易信息和公司财务指标等信息,对框架和方法进行验证。【结果/结论】运用本文所提框架和方法实现的字段抽取准确率为87.6%,效果较好。本文提出的信息抽取框架及方法在上市公司公告信息抽取中是有效的,可以为投资者的投资决策和监管机构的监管提供数据基础。(本文来源于《情报科学》期刊2019年11期)

方芳,王亚,王石,符建辉,曹存根[2](2019)在《基于语义分类和描述框架的网络攻击知识抽取研究及其应用》一文中研究指出随着计算机技术的迅猛发展,自然语言处理成为计算机科学领域与人工智能领域中的一个重要方向,且文本知识获取(knowledge acquisition from text,KAT)是人工智能的重要研究内容。当前对于文本研究,大多采用关键字以及机器学习方法,准确率并不高。该文提出了一种基于语义文法的中文网络攻击事件知识获取方法。首先介绍参考FrameNet构建的语义分类和描述框架,它在现代汉语基本句模分类的基础上进行了扩充和改进。其次,重点介绍了攻击文本中最常见的遭受类语义类的设计和形成过程。然后将语义分类和描述框架应用在"网络安全"领域,形成"网络攻击语义类",并介绍在建立"网络攻击语义类"时遇到的难题,包括文法的设计中对事元的确定、复合句的处理、"的是"结构句型的分析设计、谓词设计等。最后,使用国家某安全部门提供的真实数据进行网络攻击知识抽取,实验表明该方法具有较高的准确率。(本文来源于《中文信息学报》期刊2019年04期)

程传鹏[3](2019)在《一种Spark GraphX框架下的关键词抽取方法》一文中研究指出TextRank算法根据文本词语的位置关系构造图,应用图排序的算法计算出词语的权重,在计算过程中需要进行大量的迭代运算,在数据规模较大的时候,计算时间尤为可观.针对此问题,提出了一种基于Spark GraphX的关键词抽取方法,利用Spark GarpX所提供的分布式计算的图框架,将文本图数据分布式存储在不同的节点上,高效地实现了文本关键词的抽取.实验表明,本文中提出的基于Spark GraphX的关键词抽取方法,不仅计算时间短,抽取的关键词与人工标注的结果非常接近,具有一定的合理性.(本文来源于《小型微型计算机系统》期刊2019年02期)

王安然[4](2018)在《基于事件框架的生物信息抽取的研究》一文中研究指出生物医学领域的事件作为对生物实体及其变化的细粒度的表示,对于构造通路信息以及调控网络有着重要的意义。生物事件抽取任务包含两个子任务,生物事件触发词识别任务和生物事件元素检测任务。在自然语言处理领域,随着深度学习和表示学习的发展,越来越多的任务使用基于深度学习的方法来代替传统的基于特征工程的方法,避免了人工抽取特征。本文在这些工作的基础上,将深度学习和生物事件抽取任务相结合,使用深度学习模型实现事件触发词识别和事件元素检测。对于事件触发词识别任务,本文提出了两种触发词识别方法。第一种方法将触发词识别任务抽象成一个单词分类的任务,在结合分布式语义空间的基础上,提出了一种基于动态分段池化的CNN模型。该模型可以获取候选单词所在句子的句子级别特征信息,并结合其上下文的语义及实体特征信息作为单词的特征表示。最后通过训练分类器,构建生物医学事件触发词识别模型。该方法有效地将单词的位置信息与模型结构融合起来,实验结果表明,该方法相比于传统的基于特征工程的方法可以提高触发词识别性能。第二种方法将触发词识别任务抽象成一个序列标注的任务,提出了一种基于Bi LSTM-Attention-CRF的生物医学事件触发词识别的方法。该方法通过对文本中的单词以BIO标签形式进行标注构造样本,以解决以往方法不能识别多词触发词的问题;采用双向LSTM网络进行特征构建,在此基础上,通过注意力机制有效地融合了文档级别的特征;最后通过条件随机场学习BIO标签之间的相关性,最终对当前候选词进行标注,完成对文本中触发词的抽取。对于事件元素检测任务,本文提出了一种基于标注的方法来实现事件元素检测。不同于传统的基于二分类、多分类方法构造样本,本文将其抽象成对于当前触发词触发事件的文本序列的序列标注任务。因为事件元素的检测与触发该事件的触发词息息相关,本文将触发词所在句子作为基本的序列信息,并结合句子中单词对应的实体类别和触发词类别信息,最后对该序列标注事件元素的类别标签,来实现对事件元素的检测。在实验部分,本文使用MLEE数据集进行实验,使用大量的相关领域语料PubMed文献摘要训练词向量表达,分别针对任务的形式构建了相应的分布式特征表示,使用准确率、召回率和F1值评价模型效果,在触发词识别和事件元素检测上均取得了不错的效果。实验结果验证了本文所提出的模型的有效性。(本文来源于《大连理工大学》期刊2018-05-01)

李枫林,柯佳[5](2018)在《基于深度学习框架的实体关系抽取研究进展》一文中研究指出【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识,实体关系抽取将会取得更好的效果。(本文来源于《情报科学》期刊2018年03期)

卿勇,刘梦娟,薛浩,刘冰冰,秦志光[6](2018)在《OPEN:一个基于评论的商品特征抽取及情感分析框架》一文中研究指出针对电商平台提出一个基于评论的商品特征抽取及情感分析框架,并将该框架在京东生鲜类商品的评论中进行应用。实验结果表明该框架确实能够成功抽取出商品的典型特征及该特征对应的情感极性,且在小样本数据集上测试了特征词和观点词抽取算法以及情感极性计算方法的性能,其中显式<特征词,观点词>词对抽取的准确率达到了53.6%,召回率达到了81.5%,极性判断的准确率达到了98.3%。主要贡献包括:提出一种依据观点词与特征词关联度的隐含特征词映射方法;基于word2vec词向量模型计算特征词相似度,并利用改进的半监督层次聚类算法对特征词进行典型特征聚类,建立特征词关联表。(本文来源于《计算机应用与软件》期刊2018年01期)

杨波,王继周,马维军,毛曦[7](2017)在《事件框架的应急地理信息抽取》一文中研究指出针对现有的通用信息抽取技术无法实现结构化的应急信息抽取和完整的地名地址识别的问题,该文提出了面向众源数据的地理信息抽取技术,采用了基于事件框架的应急信息抽取方法,利用层次模型与N-最短路径算法,解决了完整的地名地址的识别与提取的问题,较好地实现了应急地理信息的自动化抽取。通过实验的进一步分析,此方法取得了最优化的应急地理信息抽取结果。实验表明,基于事件框架的应急地理信息抽取技术不仅可以快速有效地抽取应急地理信息,还能够识别完整的地名地址。(本文来源于《测绘科学》期刊2017年12期)

林心宜,严睿,赵东岩[8](2018)在《融合词、句层级信息的抽取式摘要优化框架》一文中研究指出提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。(本文来源于《北京大学学报(自然科学版)》期刊2018年02期)

刘姝林[9](2017)在《基于框架语义的高考语文阅读理解答案句抽取》一文中研究指出目前存在于互联网的海量知识大多是以文本形式呈现,计算机对文本知识的表示与深度理解在一定程度上代表着智能信息处理的水平。问答系统在一定程度上可以验证计算机对文本知识理解的能力。阅读理解问答一直以来被看作是问答系统的重要组成部分,尤其在问题分析以及答案句抽取方面受到诸多研究机构的青睐。本文依托国家863计划,针对高考语文科技文阅读理解问答题,提出借助框架语义匹配、框架语义关系、篇章框架语义视图抽取答案候选句,在排序时引入流形排序模型,通过答案句之间的框架语义句子相关度将排序分数进行迭代传播,最终选取分数较高的Top-4作为答案句。文章的主要研究内容及成果如下:一是在答案候选句抽取时引用了汉语框架语义知识。利用框架语义抽取答案候选句,一方面由于框架网络包含了比其它词典更为详细的“句法-语义”信息;另一方面,框架语义关系针对的不是相邻句子之间的关系,而是阅读材料中所有句子所揭示的语义场景之间的关系。二是答案候选句排序时利用了流形排序模型。该模型是一种半监督全局排序算法。在该模型中又充分利用了答案候选句之间的框架语义相关性,将排序分数进行迭代传播,直到全局稳定状态,最终所有的节点都得到了合理的排序分数。实验表明,定位问句出处补全或者扩展了问句的语义场景,答案候选句抽取方法很大程度上提高了答案句的召回率,流形排序模型极大地提高了答案句的准确率。本文主要内容分为叁部分,首先介绍的是本文所研究的高考阅读理解问答的相关概述,包括任务与难点;其次,详细介绍汉语框架语义网,以及在此基础上,提出的句子框架语义相关度计算方法和篇章框架语义视图的构建方法;最后将这些方法应用于真实高考语文阅读理解问答语料上,并进行了评估与分析。(本文来源于《山西大学》期刊2017-06-01)

赵文娟,刘忠宝[10](2016)在《基于汉语框架的网络事件抽取及相关算法研究》一文中研究指出文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介绍,对流程中使用的技术和方法进行了描述。最后通过"空难"框架下的"德国之翼坠机事件"为例对方法的有效性进行了验证。(本文来源于《情报理论与实践》期刊2016年10期)

抽取框架论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着计算机技术的迅猛发展,自然语言处理成为计算机科学领域与人工智能领域中的一个重要方向,且文本知识获取(knowledge acquisition from text,KAT)是人工智能的重要研究内容。当前对于文本研究,大多采用关键字以及机器学习方法,准确率并不高。该文提出了一种基于语义文法的中文网络攻击事件知识获取方法。首先介绍参考FrameNet构建的语义分类和描述框架,它在现代汉语基本句模分类的基础上进行了扩充和改进。其次,重点介绍了攻击文本中最常见的遭受类语义类的设计和形成过程。然后将语义分类和描述框架应用在"网络安全"领域,形成"网络攻击语义类",并介绍在建立"网络攻击语义类"时遇到的难题,包括文法的设计中对事元的确定、复合句的处理、"的是"结构句型的分析设计、谓词设计等。最后,使用国家某安全部门提供的真实数据进行网络攻击知识抽取,实验表明该方法具有较高的准确率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

抽取框架论文参考文献

[1].毛瑞彬,吕华揆,朱菁.上市公司公告篇章级信息抽取框架与实现[J].情报科学.2019

[2].方芳,王亚,王石,符建辉,曹存根.基于语义分类和描述框架的网络攻击知识抽取研究及其应用[J].中文信息学报.2019

[3].程传鹏.一种SparkGraphX框架下的关键词抽取方法[J].小型微型计算机系统.2019

[4].王安然.基于事件框架的生物信息抽取的研究[D].大连理工大学.2018

[5].李枫林,柯佳.基于深度学习框架的实体关系抽取研究进展[J].情报科学.2018

[6].卿勇,刘梦娟,薛浩,刘冰冰,秦志光.OPEN:一个基于评论的商品特征抽取及情感分析框架[J].计算机应用与软件.2018

[7].杨波,王继周,马维军,毛曦.事件框架的应急地理信息抽取[J].测绘科学.2017

[8].林心宜,严睿,赵东岩.融合词、句层级信息的抽取式摘要优化框架[J].北京大学学报(自然科学版).2018

[9].刘姝林.基于框架语义的高考语文阅读理解答案句抽取[D].山西大学.2017

[10].赵文娟,刘忠宝.基于汉语框架的网络事件抽取及相关算法研究[J].情报理论与实践.2016

标签:;  ;  ;  ;  

抽取框架论文-毛瑞彬,吕华揆,朱菁
下载Doc文档

猜你喜欢