中文关键词论文-郭庆

中文关键词论文-郭庆

导读:本文包含了中文关键词论文开题报告文献综述及选题提纲参考文献,主要关键词:淋巴细胞白血病,AKT,细胞淋巴瘤,嵌合抗原受体

中文关键词论文文献综述

[1](2019)在《2019年27卷1-6期中文关键词索引》一文中研究指出(本文来源于《中国实验血液学杂志》期刊2019年06期)

邢永康[2](2019)在《谷歌搜索引擎的中文关键词优化研究》一文中研究指出在当今全球的电子商务营销中,搜索引擎成为了各大跨境电商的拓展用户群最重要的手段。搜索引擎营销(SEM)是为了用于根据搜索引擎的关键字排名获得网站的可见度。消费者往往对于搜索结果的靠前结果更加感兴趣,因此,将网页排在搜索结果最前面成为了互联网公司的最重要获得客户的渠道。搜索引擎优化(SEO)往往对自身的网站结构和内容进行优化,达到对搜索引擎的爬虫友好。我们将澳大利亚华人企业的网站平台发布,并在把网站结构图上传到谷歌主机,在谷歌搜索引擎中测试该网站的可见性。测试的结果表明站内SEO技术是较为有效率的搜索引擎快速识别网站的解决方案。(本文来源于《数字技术与应用》期刊2019年06期)

郭庆[3](2019)在《基于图与LDA的中文文本关键词提取算法》一文中研究指出信息时代的科技进步伴随着海量数据的产生,从复杂冗余的信息中获得有价值的关键信息显得异常重要,这也是数据挖掘的意义所在。文本信息作为人们接触最多的信息形式之一,快速让读者了解文本内容的方法之一就是提取文本的关键词。但是,人工手动对关键词进行提取与标注不仅费时费力,也无法应对目前文本数据产生的速度。因此,本文进行了中文文本关键词提取算法的研究,从统计因素和语义因素两个角度进行算法的设计。本文的主要工作如下:(1)针对TextRank算法仅仅依靠共现窗口建立候选词之间的联系,没有充分利用文档内的信息从而使得关键词提取效果欠佳的问题,提出了基于词句协同的中文文本关键词提取算法WSC-Rank。该算法在图模型的基础上,加入了更多统计因素,考虑了词语在句子中的分布,同时结合句子的重要性,建立了词句矩阵完成了中文文本的关键词提取。实验结果表明,该算法在关键词提取个数较多时,其精确率、召回率和F1-measure相比TextRank、SingleRank和HMM-Rank均有较为明显的提升,但是该算法牺牲了一定的时间效率,算法平均运行时间接近SingleRank的3倍。(2)由于基于词句协同的算法在只提取一到叁个关键词时的表现不如SingleRank,本文将语义因素与图模型相结合,提出了基于LDA主题模型的中文文本关键词提取算法LDA-Rank。与WSC-Rank不同的是,该算法通过计算候选词与文档的主题相关性,使得图模型中的阻尼因子随着候选词的主题相关性而改变。实验结果表明,该算法避免了WSC-Rank在提取关键词个数较少时精确率低的问题,并在关键词提取个数较多时相比其他算法具有更高的召回率和F1-measure。在时间效率上,LDA-Rank算法的平均运行时间略高于WSC-Rank,但低于Word2vec-Rank。(本文来源于《北京邮电大学》期刊2019-06-03)

黄丹丹[4](2019)在《基于深度学习的中文分词和关键词抽取模型研究》一文中研究指出随着人工智能在越来越多领域的突破,基于深度学习的自然语言处理这一重要领域已经引起了众多研究者的关注。分词作为中文自然语言处理中最重要的基础工作之一,已经取得了一些成果。关键词自动抽取任务指从文档集合中抽取可以代表其中心主旨重要性的词语,是文本摘要等相关文本挖掘任务的必要且关键的环节。从机器学习角度来看,中文分词与关键词自动抽取都可转化成序列标注任务。序列标注任务指在给定的标签集合中为观察序列里每个元素中分配一个特定的标签的过程。鉴于传统序列标注方法需要人工构造特征不具有广泛的适用性的不足,本文借用深度学习自动学习任务特征的这一优势,利用深度学习技术对中文分词和关键词自动抽取任务进行研究。在中文分词技术中,本文基于已有工作基础上,提出融合BILSTM-CRF(双向长短期记忆神经网络-条件随机场)模型与attention机制的方法。具体的工作如下:(1)本文选用的BILSTM-CRF模型在解决自然语言处理中的序列标注问题时有很大的优势,它利用双向LSTM神经网络既保存了文本序列中前面的上下文又考虑了未来的上下文信息;之后结合条件随机场解决了序列标注中的标记偏置问题。(2)提出在模型中融入注意力机制方法,利用注意力机制计算BILSTM模型的输入和输出之间的相关性的重要性,并根据重要性程度获得文本的整体特征,以突出特定的字对于整个文本的重要程度。(3)本文探索了网络中向前LSTM与向后LSTM对整个模型的贡献程度,并对向前LSTM与向后LSTM的权重矩阵进行了调节,以便进一步提高分词性能。(4)在本文的模型中加入一个去噪层对固定窗口内的信息进行过滤,使得输入的字窗口内的上下文各字以一定的概率出现,不再受上下文字的共同作用从而达到去噪效果提升模型分词性能。本文利用改进的attention-BILSTM-CRF模型,在MSRA corpus、PKU corpus和人民日报2014公开数据集上进行了实验。实验结果表明,使用本文改进的模型以及训练方法可以有效地进行中文自然语言处理中的分词问题,并提高了精度。传统有监督关键词抽取方法的分类思想是假设候选词相互独立,割裂了词之间的联系,丢失了文本结构的语义信息,针对这一不足,本文基于神经网络的特征学习方法,探索了一种新的思路:将关键词抽取任务转化成序列标注问题,利用BILSTM神经网络和CRF相结合的方法对关键词抽取任务实现关键词自动抽取。本文基于BILSTM-CRF关键词抽取模型,在文本预处理和数据标注上做了两点工作:其一,基于分布假说(词的语义由其上下文决定),针对关键词抽取任务中的文本预处理不够准确这一挑战,以CBOW模型为基准模型,提出了字词组合的词向量预训练表示方法。该方法在词表示空间中融入上下文当中的字,借助字的平滑作用,更好地对词进行建模。为了使字表示含有更丰富的语义,同时借鉴了分布语义推广到字层面能够优化模型的性能,本文将不含有语义但拥有更优性能的字表示和本身带有语义信息的词表示组合起来。虽然字本身不具备语义信息,但当把两者放在同一个语义空间中时,利用字词组合的方式进行预训练,可以更有效地对词进行建模。其二,本文考虑到在标注数据集时可能会出现带有个人主观性或者无法保证在标注数据过程中时刻集中注意力,而造成的误标、漏标等现象,提出一种对训练数据补充词典标注的方法,以尽可能地避免影响数据的标注质量。我们引入一个变量P表示在线标注中被标注的关键词w次数与语料中w出现次数的比值。之后设定一个阈值,统计所有关键词的p(w),筛选出高于设定阈值的词作为补充标注添加到补充词典当中。利用自动补充词典对已标注的数据进行补充,减少样本数据标注的错误。本文在文本分类任务上对比了字词组合训练与单独训练的字表示,实验表明字词组合训练得到的词向量,在关键词抽取任务上有明显的优势,实验结果展示了字词组合训练的有效性。同时,我们以条件随机场作为参考模型,构建特征模板,在标注好的数据集上进行了对比实验。实验结果表明,由本文提出的BILSTM-CRF关键词抽取模型以及训练方法在单个词语和词组上表现均优于传统的CRF模型,也证明了本文BILSTM-CRF优越性。(本文来源于《北京邮电大学》期刊2019-05-28)

张少迪,郑炅,艾山·吾买尔,赵全军[5](2019)在《基于Django的中文关键词提取系统的设计与实现》一文中研究指出随着机器学习的不断兴起,python编程语言也逐渐的被更多人所知和使用,而Django作为由python编写的Web应用框架,也开始被更多的工程和项目所使用。但是随着互联网进程的不断推进,人们对于速度的要求也在逐渐加大,多线程的成为了各大企业和机构不可或缺的需要,而传统的Django在多线程上的拙劣表现也让人大失所望,因此,本系统采用了Django+uWSGI+Nginx的框架,很好的解决了多线程和高并发的问题,而且还拥有了负载均衡的功能,使得中文关键词提取系统的速度提升到了一个新的高度。(本文来源于《电脑知识与技术》期刊2019年13期)

侯丽微,胡珀,曹雯琳[6](2019)在《主题关键词信息融合的中文生成式自动摘要研究》一文中研究指出随着大数据和人工智能技术的迅猛发展,传统自动文摘研究正朝着从抽取式摘要到生成式摘要的方向演化,从中达到生成更高质量的自然流畅的文摘的目的.近年来,深度学习技术逐渐被应用于生成式摘要研究中,其中基于注意力机制的序列到序列模型已成为应用最广泛的模型之一,尤其在句子级摘要生成任务(如新闻标题生成、句子压缩等)中取得了显着的效果.然而,现有基于神经网络的生成式摘要模型绝大多数将注意力均匀分配到文本的所有内容中,而对其中蕴含的重要主题信息并没有细致区分.鉴于此,本文提出了一种新的融入主题关键词信息的多注意力序列到序列模型,通过联合注意力机制将文本中主题下重要的一些关键词语的信息与文本语义信息综合起来实现对摘要的引导生成.在NLPCC 2017的中文单文档摘要评测数据集上的实验结果验证了所提方法的有效性和先进性.(本文来源于《自动化学报》期刊2019年03期)

[7](2018)在《中文关键词索引(2018年第32卷)》一文中研究指出(本文来源于《中国药理学与毒理学杂志》期刊2018年12期)

[8](2018)在《2018年26卷1-6期中文关键词索引》一文中研究指出(本文来源于《中国实验血液学杂志》期刊2018年06期)

[9](2018)在《《医药导报》2018年第37卷中文关键词索引》一文中研究指出(本文来源于《医药导报》期刊2018年12期)

张海潮,王昊,唐慧慧,薛蔚[10](2019)在《CRFs字角色标注方法在中文附加关键词抽取中的应用研究》一文中研究指出[目的/意义]探讨中文社会科学领域题名关键词最佳抽取模型,用以获取引文题名关键词,完成附加关键词的抽取。[方法/过程]文章以2014年CSSCI全部文献的题名为语料,运用条件随机场(CRFs),通过探究不同特征(或集合)和参数对关键词识别的影响,构建字角色标注的题名关键词标引模型,最终迁移应用到引文题名。[结果/结论]通过实验,获得最佳题名关键词标引模型,F1值可达到52.03%,每篇原文可获得附加关键词9个左右。在恰当的特征组合与参数下,构建的标引模型可以有效完成附加关键词的获取工作。[局限]语料中的每个关键词平均出现两次可能会影响机器学习的效果,原文与引文题名的差异可能影响模型的适用性,此外模型得到的附加关键词尚需进一步斟酌选择。(本文来源于《情报理论与实践》期刊2019年02期)

中文关键词论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在当今全球的电子商务营销中,搜索引擎成为了各大跨境电商的拓展用户群最重要的手段。搜索引擎营销(SEM)是为了用于根据搜索引擎的关键字排名获得网站的可见度。消费者往往对于搜索结果的靠前结果更加感兴趣,因此,将网页排在搜索结果最前面成为了互联网公司的最重要获得客户的渠道。搜索引擎优化(SEO)往往对自身的网站结构和内容进行优化,达到对搜索引擎的爬虫友好。我们将澳大利亚华人企业的网站平台发布,并在把网站结构图上传到谷歌主机,在谷歌搜索引擎中测试该网站的可见性。测试的结果表明站内SEO技术是较为有效率的搜索引擎快速识别网站的解决方案。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

中文关键词论文参考文献

[1]..2019年27卷1-6期中文关键词索引[J].中国实验血液学杂志.2019

[2].邢永康.谷歌搜索引擎的中文关键词优化研究[J].数字技术与应用.2019

[3].郭庆.基于图与LDA的中文文本关键词提取算法[D].北京邮电大学.2019

[4].黄丹丹.基于深度学习的中文分词和关键词抽取模型研究[D].北京邮电大学.2019

[5].张少迪,郑炅,艾山·吾买尔,赵全军.基于Django的中文关键词提取系统的设计与实现[J].电脑知识与技术.2019

[6].侯丽微,胡珀,曹雯琳.主题关键词信息融合的中文生成式自动摘要研究[J].自动化学报.2019

[7]..中文关键词索引(2018年第32卷)[J].中国药理学与毒理学杂志.2018

[8]..2018年26卷1-6期中文关键词索引[J].中国实验血液学杂志.2018

[9]..《医药导报》2018年第37卷中文关键词索引[J].医药导报.2018

[10].张海潮,王昊,唐慧慧,薛蔚.CRFs字角色标注方法在中文附加关键词抽取中的应用研究[J].情报理论与实践.2019

标签:;  ;  ;  ;  

中文关键词论文-郭庆
下载Doc文档

猜你喜欢