计算文体学论文-翁玉秀

导读:本文包含了计算文体学论文开题报告文献综述及选题提纲参考文献，主要关键词:英语新闻标题,计算文体学,词长,词汇密度

计算文体学论文文献综述

翁玉秀^[1]（2018）在《英语新闻标题词汇层面的计算文体学研究》一文中研究指出词汇是语言结构的基本单位,是表达意义和实现交际目的的工具。新闻英语作为信息传播媒介,而新闻标题是对新闻信息的浓缩和概括,有其独特的用词特征。通过自建语料库,采用语料库驱动的计算文体学研究方法,量化分析新闻标题的词长、词汇密度和词频使用特征。研究发现新闻标题以短小词为主,平均词长5.13;其STTR值为63.07,表明标题词汇密度大、用词丰富多样;词频分布分析发现新闻标题中功能词常被省略、没有第一和第二人称代词、"say"词使用频繁、新闻标题词汇具有时代特征。同时本研究还分析了这些词汇特征产生的文体效果和成因。(本文来源于《集美大学学报(哲社版)》期刊2018年02期）

刘萌^[2]（2015）在《用计算文体学的方法分析现代女性的语言——以奥巴马和米歇尔的演讲为例》一文中研究指出计算文体学就是计算出文本多个层面的数值,如人称代词层面、数字层面、情态动词层面等等,以便用这些数值来分析文本,从而有利于掌握语言的特点。随着社会历史的发展,女性的语言也随之发生了一些变化。通过计算文体工具,如Concordance,分析女性和男性演讲语篇,对比分析出现代女性的语言特点。(本文来源于《兰州教育学院学报》期刊2015年02期）

王静^[3]（2013）在《《哈克贝利·费恩历险记》词汇层面的计算文体学分析》一文中研究指出利用《汤姆·索亚历险记》做参照文本,从词汇层面中的词汇密度、词长和关键词对马克·吐温的《哈克贝利·费恩历险记》进行计算文体学分析。研究发现,在词汇密度方面,《哈克贝利.费恩历险记》比《汤姆.索亚历险记》有更多的形符,但更少的类符,并且通过卡方检验,发现它们在类符/形符比值中存在显着性差异;在词长方面,平均而言,《哈克贝利.费恩历险记》比《汤姆.索亚历险记》少一个字母,并且通过T检验,发现它们在词长使用上存在显着性差异;《哈克贝利.费恩历险记》中关键词占用的比重较大,关键词的口语性充分体现在非标准形式的地方方言中。(本文来源于《大连海事大学学报(社会科学版)》期刊2013年01期）

渠新峰^[4]（2012）在《基于词汇层面的《浮生六记》两个英译本的计算文体学对比研究》一文中研究指出清朝文人沈复的笔记体小说《浮生六记》以平实的笔调记叙了一位平凡文人的闲适生活,该书迄今已有两个英语全译本,分别是“两脚踏中西文化,一心评宇宙文章”的学者林语堂和布拉特(Leonard Pratt)的译本。相对而言,前者的译本在中国流传更广,影响更大。然而,笔者认为,莱昂纳多的译本同样不容忽视。本论文所要研究的主要对象主要着眼于《浮生六记》的两个英译本的比较,以语料库为基础,研究两个译本在词汇等各个层面的差异以及可读性分析,从而更好的为研究两个译本提供科学可靠的数据；系统的阐述两个译者在翻译风格和翻译手法上的异同,为今后的研究者提供参考和借鉴,为翻译教学和研究提供思路。通过对比研究发现：林语堂和Pratt在翻译《浮生六记》时具有一定的相似点和不同点。在词汇的使用上,林语堂的翻译版本用词更加的丰富,同时,3字词的使用频率也较高；Pratt在使用词汇方面显得更加保守；从可读性方面来看,林语堂的翻译版本较Pratt的翻译版本更难一些。但从总体方面来看,两个译者在处理该文本的翻译时,在词汇使用上随着文章内容的变化词汇使用的丰富度趋势基本相似。本研究对于更好地对比研究翻译风格有着一定的启发和帮助,同时,帮助我们在研究林语堂及其作品时提供一定的参考和借鉴,有助于学者更好地对林语堂的翻译风格进行了解和研究。(本文来源于《大连海事大学》期刊2012-06-01）

孙爱珍,叶向平^[5]（2010）在《计算文体学模式构建》一文中研究指出计算文体学一直以来都被认为是计算语言学的分支,没有自己的学科地位。但是随着技术的发展,计算文体学的研究对象和目的逐渐超越了计算语言学的范围,形成自己的工作模式。那么,在这个意义上,计算文体学也许应该从计算语言学中独立出来,进行自己的学科建设。(本文来源于《外语电化教学》期刊2010年06期）

孙爱珍^[6]（2008）在《计算文体学工作模式探究》一文中研究指出本篇论文主要目的在于提出并证明计算文体学的工作模式,还不属于整个计算文体学的学科建设的最终建立,但期望通过对其计算模式的证明揭示计算文体学的学科地位应该得到承认。计算文体学已有很多成功的计算案例,但至今没有建立起独立的学科地位。本篇论文以计算案例为基础,提出一种通用的工作模式,并且为了证明此模式的可行性,以曼斯菲尔德作品中的情感计算为个案研究实例。计算方法吸收了计算语言学、语料库语言学、统计学的因素。计算文体学被认为是计算语言学的一个分支,尚无独立的学科地位。但是本项研究经过对大量文体计算案例的分析,发现计算文体学在研究对象和研究目的上已经超越了传统上对其的认定,而且有着自己的计算模式,所以我们认为,计算文体学应该从计算语言学中独立出来。在学科建设方面,我们认为,计算文体学在研究对象和研究目的方面与现代文体学保持一致,在工作模式上借助计算语言学、语料库语言学和统计学的工具,已形成了独特的系统。计算文体学的研究对象不再是边缘语言现象,它已经深入到语言的各个层面,可以完全按照现代文体学的定义进行语言现象的计算;其研究目的也不再仅仅专项服务于机器自动处理即人工智能的实现,而是把计算得到的数据与主题意义的分析联系起来。为了检验计算文体学的工作模式,本项研究以曼斯菲尔德的作品中的情感流动为研究对象,尝试利用计算文体学工作模式,实现对情感的计算,从而验证所提出的计算文体学模式的可行性。情感流动在文学批评和文体分析研究中并不是新生事物。情感(affect)、感情(emotion)、态度(attitude)被认为是同义词,都用于文本主体和美学意义的阐释。但是情感流动尚未被认作一种语法结构,更谈不上探究。然而,正如列文-斯特劳斯把结构主义方法运用于神话的分析,甚至创出术语‘神话素’,他的学生后来努力构建‘神话语法’,本篇论文试图揭示文学语篇中情感流动的结构构成。情感的计算是个艰难的探索过程,主要是因为情感被认为是纯主观的认识和反应,对其进行计算——客观的数据本身就很难让人产生共鸣,应用于文学语篇中的情感计算更是难以被人接受。但是本项研究者认为情感在语篇中表现于客观的语言层面上,就一定有客观基础,对这些客观的语言现象的确认就可保证情感计算的可行性。本项研究受评价系统的启发,提出语篇的情感主要由情感词汇所决定,情感流动主要由情感词汇在语篇中的分布所形成,由此我们探寻:文学语篇的情感流动是如何形成的,是否与情感词汇有重要关联?经过对汉语词汇学中褒贬义词的研究、文体学界对情感流动的研究、语料库语言学对搭配中形成的语义韵的研究,尤其是评价系统中的有关语篇态度研究的学习,本项研究逐渐形成了关于文学语篇情感流动形成机制的假设,并明确提出这一理论假设,即:情感词汇在语篇中形成自己的域,并对域中的中性词汇产生辐射;情感词汇携裹域中的辅助手段(级差手段),形成大小不一的域,波动向前,由此形成语篇中的情感流动;相连的同样色彩的情感词汇结合成链,形成更大的情感域;情感域的域界标志为两个相连的同样色彩的情感词汇。基于此项理论假设,本项研究析离出一些因子(factor):情感词汇、域界标志、级差手段,由此提出进一步假设:利用这些因子可以进行语篇情感的计算。接下来的研究就是对这些因子的进一步探寻。情感词汇可以划分为积极情感词汇、消极情感词汇和中性情感词汇,其中中性情感词汇中有些特别活跃,极容易被染上与其搭配的情感词汇的色彩,与积极情感词汇搭配,就呈现积极色彩,与消极情感词汇搭配,就呈现消极色彩,但有时保持中性,没有色彩。这些词汇在本项研究中,被命名为中性易感词汇,在文本中,根据语境中表现出的感情色彩,被称为中性积极词汇或中性消极词汇,很多词汇具有双重身份,对计算的准确度造成干扰,只能在人工修改阶段进行修订;另外有些词汇单独不可明确确定其情感色彩,只能以句子为单位才可确定,也只能在人工修改阶段进行修订。级差手段繁多,在目前技术条件下,尚无法完全纳入计算;再者由于级差手段是情感流动的辅助手段,只是对情感强度产生影响,不影响语篇情感基调,所以本项研究决定把级差手段留待以后的研究。这样,本项研究中的情感计算就是对语篇基本情感流动或语篇情感基调的计算。整个计算过程本着从词汇到语篇的原则进行设计,经历情感词汇的判断和收集—形成情感词汇库—绘制语篇中情感流动模式图几个阶段;中间设计了两项测试:检测本项研究者对情感词汇的个人判断与同类读者的判断有多少差异,即是否具有一定的代表性;检测情感词汇库在实际应用中的准确度。第一章:绪论。主要介绍本项研究的形成原因和操作过程,同时提出了研究的目的和范围。根据语料库语言学和统计学的理论,对参与研究的语料范围和容量进行了定义和限制。第二章文献综述(1)。介绍计算文体学的发展过程。展现计算机软件从对生语料到熟语料处理的发展进程,反映人们在运用计算机技术进行文体分析方面对技术不断提出的要求,从单纯地依赖技术进行文体标记统计上升到将人的定性分析和认识符号化,对生语料进行人工加标,从而提高方法的精确度和理论性。最后提出计算文体学的模式,并且提出情感流动研究中的计算模式,证明计算文体学模式的可行性。第叁章文献综述(2)。主要介绍有关情感流动的语言学研究。本项研究对于文体分析的意义是增加新的分析角度,而且采取语料库和计算语言学的方法。语料库语言学对语义韵的研究,表明情感词汇对与其搭配的中性词汇有情感辐射功能。系统功能语言学对人际意义的研究,特别是评价系统指出了情感词汇的中心作用,提出了语义韵域、级差手段、域界等概念,但其研究主要在新闻文体进行,而且其中的一些概念定义,例如对于域界的划分,解释不清楚。本章为情感流动结构理论假设的提出奠定了基础。第四章是对情感流动结构理论假设的详细阐述。对提出的文学语篇中的情感流动结构所牵涉到的几个因素,如中性易感词汇,语义韵域及域界标记、级差手段等等,进行更深一步的研究。第五章主要是对情感词汇的研究。主要讨论情感和情感词汇的划分标准以及本项研究对情感词汇的搜集方法。根据心理学、汉语词汇学、评价系统的研究,把情感划分为积极和消极情感,情感词汇划分为积极情感词汇、消极情感词汇、中性易感词汇(包括中性积极词汇和中性消极词汇)。确认的标准为:凡是表示褒扬、喜爱、尊敬的态度词汇和能给人带来幸福、安全和满足感的情绪词汇,为积极情感词汇;表示贬斥、憎恶、鄙视的态度词汇和给人带来不幸福、不安全和非满足情感的情绪词汇,为消极词汇。确认的依据是词典释义。搜集过程分为叁个阶段:1)根据词典解释,对曼斯菲尔德作品中的词汇逐个进行判断,确认和挑选出情感词汇;2)机器加标,对文本进行情感词汇辨识和加标,根据文本语境,对不合适的加标词汇进行人工修补;3)最终搜集文本中的标注词汇,得到曼氏情感词汇库。第六章是实验研究,对读者主观性与情感词汇确认之间的相关性进行分析。为了检验研究者的研究是否具有代表性,选定一些与研究者同类的读者阅读同样的小说文本;然后,对各位读者在阅读过程中确认标注的情感词汇进行对比,结果表明这些读者标注的差异并不是很大,表明研究者的判断和搜集具有代表性。第七章描述情感流动曲线图的绘制过程。在确认情感词汇的基础上,考察情感词汇在语篇层面上所表现出来的情感流动状态。通过对两个实例的分析,绘制出情感流动模式图;按照研究的思路,设计出软件,自动统计和计算文本中的情感词汇,而后给出所有样本文本的情感流动模式图和相关数据。第八章研究情感词汇分布对语篇情感的预测。根据情感流动模式图,对曼氏的42篇小说进行分类,结果表明这些模式图可以在一定程度上揭示主题意义和辅助主题意义的分析和表达,也证明情感的计算在一定程度上有助于主题意义的阐释。另外,根据情感词汇的分布数值,对语篇情感进行分类,设定数值标准,可用以预测曼氏小说的情感类别。第九章属于实验研究,检验所得到的曼氏情感词汇库在实际运用中的准确度。采用曼氏另外两部小说集中任选的小说,以及Irving和Lawrence作品中的小说片断作为语料。经过机器加标和人工修改,对判断的情感词汇进行统计。检验模式采用的是方差检验和T检验,结果表明曼氏情感词汇库在曼氏作品中有着极高的准确度;在不同作家的作品中存在误差,但是不显着,而不同的文体之间的情感辨识误差最大。这说明不同作家对情感词汇使用存在着一致性,这些一致的认识和词汇使用也许可以证明文学情感词汇库的设想在一定程度上是可行的;同时也表明这种方法的延展性:通过对大量文本的人工加标,建立通用情感词汇库,对某一领域的文本进行情感流动辨识也许值得一试。第十章结语。本章节总结了在整个计算过程中所取得的曼斯菲尔德的文体特点和计算文体学工作模式提出并被证明的意义,讨论了本项研究所取得的成绩,并且指出了其中尚存的问题和下一步的研究计划。如果说本文对相关研究有所贡献的话,应该表现在以下几个方面:明确提出了计算文体学的独立学科地位。目前国内的研究局限在语料库语言学对文体形式特征的提取方面,对计算文体学的定义和学科地位尚无明确定论;而国外研究也属个案论证阶段,也未给予计算文体学以独立学科地位。本项研究在大量文体计算个案的基础上,提出了计算文体学的定义和工作模式,理论上接受文体学的指导,工作模式方面吸收计算语言学、语料库语言学、统计学的因素。为了证明计算文体学工作模式的可行性,本项研究以情感计算为案例。依据计算文体学的工作模式,提出了情感计算的模式。在计算过程中,明确了情感词汇的定义、分类、加标和收集的方法,并且设计了软件对情感词汇的分布进行描述,形成了情感流动模式图,从而为文体分析增加新的分析角度—情感词汇以及其在语篇层面上的分布所反映出的文体特征,并且在实际计算过程中发现了作者的“写作指纹”和文本的“情感指纹”。在计算过程中,引入了统计学的方法,从实验设计到数据收集、统计建模、数据分析,对相关假设进行了检验,认识到,概率论的思想和方法对主观推断的证明有着毋庸置疑的作用。(本文来源于《河南大学》期刊2008-06-01）

陈岳红^[7]（2008）在《从计算文体学的角度分析《莫里斯·格斯特》和《乔治一家的妻子》》一文中研究指出文体学是运用现代语言学理论和方法研究文体的一门学科,是一门既古老又年轻的学科。文体学的研究可以分为定性分析和定量分析两种研究方法,定性分析的方法即印象主义的研究方法。定量分析的应用范围很广,可以是文学作品,也可以是各种实用文体,定量分析首先是在文学领域得到一定的应用,国外早已有人利用统计法对某些作家或者作品的风格进行统计分析。随着计算机语言学的不断发展,借助计算机所进行的文体分析的方法得到了越来越广泛的应用。与定性分析相比,文体的定量分析有很多不足,但文体定量分析也有不可否认的优点和应用价值,统计数据可以精确、客观、公正地表明文体的特征。虽然计算机不可能像人一样分析文体,但计算机可以在大量文本里对指定的语言特征进行查找、计数、汇总和统计,这些都是计算机的强项。本文试图从计算文体学的角度来分析澳大利亚着名现实主义女作家亨利·汉德尔·理查森的长篇小说《莫里斯·格斯特》和现代主义女作家伊丽莎白·乔利的长篇小说《乔治一家的妻子》。本文共分为五个章节。第一章为引言,介绍了本文的研究意义、研究目的与重点、研究方法与过程以及章节简介。第二章为基本理论,主要介绍了文体学以及计算文体学的相关理论以及相关术语简介。第叁章为作家及作品介绍,主要涉及澳大利亚文学及澳大利亚妇女小说简介、两位作家的生平及创作特色和两篇小说的梗概。第四章是本文的主要部分,介绍了具体的数据统计分析过程以及结果讨论。第五章为结论。国内对这两篇小说的研究主要采取定性分析的方式,对小说文体特征的分析缺乏必要的统计数据作为依据。因此,本文的目的是通过定量分析的手段对前人的分析提供数据上的依据以及发现两篇小说新的文体特征。本文通过对两篇小说的词汇密度、词频分布、共有词汇、独有词汇、单词长度、合成词特征以及句子长度和句法特征等语言特征的分析和比较,发现两位作家的文体特征既有相同之处,又有显着的差异。理查森的作品词汇和句法比较规范,有时使用较长和较为复杂、生僻的低频词,惯用派生词汇,句式以松散句为主,叙述视角为第叁人称全知视角,叙述话语惯用直接引语,并且擅长人物内心世界的刻画。因此,理查森不仅继承了当时民族文学的典型特色,即以叙述事件和塑造人物为主,叙述风格随意、自然、接近口语;而且有时也使用较为复杂的词汇,在叙述情节的同时,也着重刻画主人公的内心世界,使劳森开创的现实主义民族文学走向深化。乔利的作品用词丰富,善于创造词汇或使用不规范的词汇,惯用复合词,叙述视角为第一人称视角,内容复杂、在表现形式上突破了传统现实主义规范句法的限制,并使用结构极其灵活随意的句子,小句较多,大量使用自由直接引语和自由间接引语并把四种不同的话语叙述方式交错使用,善于采用对单词、短语、句子和事件的重复的手法。这些基本都反映了现代意识流小说的典型文体特征。尽管两篇小说在单词书写、单词长度和复杂程度以及句子长度方面有着共同之处,但是它们的文体特征还是具有显着的不同;理查森的创作具有典型的澳洲现实主义民族文学的特色,而乔利的小说较多地使用了现代意识流小说的表现手法,极富澳洲现代主义小说的典型特征。因此,以计算文体学的角度来分析文学作品,即以定量分析为主,辅之以必要的定性分析的文体研究手段,能够为文学作品分析提供统计数据作为依据以及发现和描述作家或作品的文体风格。(本文来源于《西华大学》期刊2008-04-01）

孙玉^[8]（2003）在《《飘》与《斯佳丽》的计算文体学分析——对比研究》一文中研究指出西方对文体的研究可谓源远流长。近几年来，随着现代语言学的发展，越来越多的学者意识到了语言学理论和计量统计方法对文体研究的重要性。本文运用定量和定性相结合的方法，对《飘》及其续集《斯佳丽》进行了计量文体对比和分析。研究结果表明在词汇和句法层面上二者虽有相似之处却存在显着差异。本文以科学的方法验证了前人对这两部作品存在文体差异这一主观印象。(本文来源于《大连海事大学》期刊2003-03-01）

计算文体学论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

计算文体学就是计算出文本多个层面的数值,如人称代词层面、数字层面、情态动词层面等等,以便用这些数值来分析文本,从而有利于掌握语言的特点。随着社会历史的发展,女性的语言也随之发生了一些变化。通过计算文体工具,如Concordance,分析女性和男性演讲语篇,对比分析出现代女性的语言特点。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

计算文体学论文参考文献

[1].翁玉秀.英语新闻标题词汇层面的计算文体学研究[J].集美大学学报(哲社版).2018

[2].刘萌.用计算文体学的方法分析现代女性的语言——以奥巴马和米歇尔的演讲为例[J].兰州教育学院学报.2015

[3].王静.《哈克贝利·费恩历险记》词汇层面的计算文体学分析[J].大连海事大学学报(社会科学版).2013

[4].渠新峰.基于词汇层面的《浮生六记》两个英译本的计算文体学对比研究[D].大连海事大学.2012

[5].孙爱珍,叶向平.计算文体学模式构建[J].外语电化教学.2010

[6].孙爱珍.计算文体学工作模式探究[D].河南大学.2008

[7].陈岳红.从计算文体学的角度分析《莫里斯·格斯特》和《乔治一家的妻子》[D].西华大学.2008

[8].孙玉.《飘》与《斯佳丽》的计算文体学分析——对比研究[D].大连海事大学.2003

标签：英语新闻标题; 计算文体学; 词长; 词汇密度;

计算文体学论文-翁玉秀

计算文体学论文文献综述

计算文体学论文开题报告

计算文体学论文参考文献

猜你喜欢