页面分块论文-杨丽

页面分块论文-杨丽

导读:本文包含了页面分块论文开题报告文献综述及选题提纲参考文献,主要关键词:科技革命,互联网,信息,分块算法

页面分块论文文献综述

杨丽[1](2018)在《Web页面分块算法MDSPS及其在Web信息抽取中的应用研究》一文中研究指出随着第叁次工业科技革命在新世纪进程中的发展,人们在社会生活进程中逐渐被电子产品和电子数据所占领,最明显的特点就是互联网的发展、普及和使用。人们获取信息的主要来源,在满足人们对相关信息的搜索、获取、传播的过程,也是对相关Web页面分块算法MDSPS及其在Web信息抽取的主要应用。(本文来源于《信息通信》期刊2018年02期)

李园园[2](2013)在《面向DIV+CSS布局的Web页面分块算法研究》一文中研究指出随着我国经济的大力发展以及电子技术的飞速提升,人们的生活越来越重视移动设备的使用,尤其是智能手机、平板电脑等。进一步,借助无线网络,人们通过移动设备能够随时随地的向网络获取信息和处理事务。然而,这些网络信息资源和处理事务的途径一般都是来自于Web网页,如有提供新闻资源的新闻网页,提供搜索服务的门户网页,提供商品出售的购物网页,提供视频观看的视频网页等等。但是这些网页都是基于PC端电脑而开发设计的,由于移动设备硬件具有其自身先天性的局限性:计算能力有限、存储量小、屏幕小以及带宽低等,当我们使用移动设备去直接浏览这些网页会出现许多问题,如加载速度慢甚至不完全,显示效果混乱不规整,滚屏操作繁琐等等。若要充分利用现有的Web网页资源,就必须将PC端网页转换成适用于移动设备显示的新网页。而这-转换过程中最为关键的环节是对Web网页进行页面分块,因此本文对Web页面分块算法进行了深入研究,目的是使移动设备能够直接快速的浏览PC端Web页面。基于文档对象模型(DOM树)的页面分块算法是现有页面分块算法之一,该算法适用于各种复杂网站。目前基于DOM树的页面分块算法包括利用HTML标记的布局规律、利用HTML标记之间的关系以及利用<TABLE>标记的布局特点的页面分块算法。这些算法只对对有固定格式、规范标记用法的Web页面和采用表格<TABLE>布局的Web页面有较高的分块效率和正确率。但是,随着网络技术发展的不断进步,现有网页的布局方式已经发展为DIV+CSS的布局方式,该布局方式解决了表格<TABLE>布局的嵌套关系复杂、网页维护和改版困难等缺点,使得网页制作更加方便灵活。故本文提出了面向DIV+CSS布局方式的页面分块算法。本文在过去算法以及DIV+CSS (Division+Cascading Style Sheets)布局特点的基础上设计出了基于该布局方式的Web页面分块算法。该方法实现了对采用DIV+CSS布局的网页进行页面分块,并通过实验证明,此方法具有一定的有效性和可行性。本文主要工作内容安排如下:1.对国内外的页面分块技术进行了研究与分析,并对各个分块算法的优缺点和网页针对性做了比较与分析。2.研究了DIV+CSS布局方法和它的HTML文本结构,并与表格<TABLE>布局方法进行比较。3.提出面向DIV+CSS布局的Web页面分块算法。利用DIV+CSS布局方式的Web页面结构,首先通过分析HTML文本,生成一颗DIV树;然后对该树进行前序遍历:提取对应的CSS文件中各个<DIV>标记的宽度,以移动设备小屏幕的宽度作为阈值,比较两个宽度的大小;最后根据比较结果对Web页面进行分块,再将分好的页面块按照原网页的布局格式进行重新组合,进而转换成适用于小屏幕浏览的新页面。4.实现了面向移动设备的Web页面分块转换系统。该系统以面向DIV+CSS布局的页面分块算法为核心,以普通PC端Web页面作为输入,以适用于移动设备小屏幕浏览的Web页面作为输出,有效地将Web页面进行了转换。(本文来源于《广西师范大学》期刊2013-04-01)

刘凤成[3](2012)在《面向移动终端的Web页面分块与转换方法的研究与应用》一文中研究指出随着移动终端的广泛普及和移动通信技术的不断发展,越来越多的人期望使用移动终端来浏览Web页面,但由于显示屏幕的局限、内存和无线网络带宽等因素的限制,移动终端难以正常显示网页资源。为了满足移动终端用户访问Web页面的需求,可以使用WAP规定的标记语言对Web页面进行重新设计,但是移动终端多样性加上Web页面数量庞大,因此进行专门的重新设计几乎不可行。更好的方法是将Web页面转换成适合移动终端浏览的XHTML MP页面,这样可以把互联网上已有的Web页面直接转移到移动终端支持的无线网络中。本文主要进行的工作如下:1.论文提出一种页面分块方法,该方法首先以div和table标签为线索对页面DOM树节点进行标注,然后深度优先遍历页面DOM树节点,根据节点标注结果分叁种情形对节点进行分块。实验结果表明该算法具有较理想的召回率。2.论文研究移动终端相关参数特征、Web内容适配规则,为Web页面转换的研究与应用奠定理论基础;提出一种基于有序二叉树的标签转换方法,该方法利用有序查找和标签映射来优化标签转换过程,实验结果表明该方法能提高Web页面标签转换效率。3.在面向移动终端的Web页面转换系统总体设计和前面的技术研究基础上,综合考虑实际应用系统的需求,论文对Web页面转换过程中的噪声信息过滤、图像自适应与内容优化、页面重组和缓存等关键技术进行应用研究,为解决相关技术的实际应用提供有效方案。(本文来源于《中南大学》期刊2012-06-30)

吕天,于长富[4](2012)在《Web页面分块技术综述》一文中研究指出有很多不同的分块算法都可以对Web网页进行分块,研究分块的目的是为了相关领域进一步研究的需要,例如通过页面块内容的重要程度研究基于块的搜索、定位网页的重要主题或内容,研究网页主要内容或主题的抽取,以及基于Web页面分块的Web存档等。首先给出Web页面分块问题定义和分类,并对几种典型的分块算法进行原理剖析,为进一步研究Web页面分块问题提供一些有益的参考。(本文来源于《现代计算机(专业版)》期刊2012年13期)

陈颖[5](2012)在《Web页面分块技术的研究与实现》一文中研究指出因特网技术的发展使得Web成为当前最大的信息来源。但是Web在给人们提供丰富信息的同时,又使人们在有效找到自己需要的信息方面面临巨大的挑战。大多数信息检索系统将页面视为最小的不可再分的单元,然而一个页面中往往包含多个并不紧密相关的主题,还含有导航、装饰、联系方式等零碎信息,因此用整个页面来表示一个单一的语义有时候并不合适。另一方面,随着通信技术的发展,手持移动设备(PDA、手机、智能手机等)正在快速发展。移动设备和因特网的结合是最具潜力的发展方向,如何在手持移动设备的小屏幕上显示合适的网页,也是很有价值的一个议题。Web页面分块技术,为上述问题提供了一种解决方案。论文首先对现有的Web页面分块技术进行了详细分析,总结了各类技术在实际应用中的优势和不足之处。在前人工作的基础上,提出并实现了一种基于多线索的Web页面分块方法。该方法考虑到了实际网页设计常用的布局模式,结合了页面视觉信息和页面对应标签树中的结构信息,最后生成的分块既符合人分析页面的逻辑,也保留并体现了网页的整体结构,还为后续子块信息的提取、生成提供了方便。实验结果表明新的方法能对常规Web页面进行有效的分块,并弥补了现有的一些页面分块技术在实际应用中的不足,结合了结构信息和视觉信息线索,在算法的效果和效率间找到了平衡。进一步,在面向移动设备的Web页面转换应用中,新方法中产生的符合常规页面布局的分块提供了额外的重要信息,有较好的应用价值。(本文来源于《华中科技大学》期刊2012-05-01)

蒋建中,丁宝琼,吴琼,邱文武[6](2010)在《基于页面分块的网页排序算法:BHITS》一文中研究指出介绍大型搜索引擎应用的主流网页排序算法,改进其中的HITSS算法,提出一种基于网页分块技术的BHITS算法。BHITS算法通过对分好的页面板块进行主题标定,根据待采集信息的主题为不同主题的板块设定不同的权值实现相关度判定,在保持算法高效率的前提下,提高了算法区分链接重要性的能力。与相关算法的对比实验结果表明,BHITS算法网页排序的准确率明显优于其他算法。(本文来源于《计算机工程》期刊2010年11期)

苗苗[7](2010)在《基于页面分块的网页内容提取的研究与实现》一文中研究指出随着互联网时代的来临,Web已经成为世界上最大的信息源,给人们生活带来了极大的方便。但是Web在给人们提供丰富信息的同时,又使人们在对它们的有效使用方面面临一个巨大的挑战。一方面网上的信息多种多样、丰富多彩,另一方面用户却找不到他们所需要的信息。为了更好的使用Web上的信息,人们不断研究能够有效组织和利用网上信息的技术。然而,Web文档不像传统的文本那样整齐、干净,其中包含大量噪音内容,例如为了增强用户交互性而加入的脚本,为了便于用户浏览而加入的导航链接,以及出于商业因素所加入的广告链接等。这些噪音内容往往和网页的主题不相关,在网页分类、信息检索等Web应用中,如果不去除这些噪音内容,不仅降低信息处理程序的执行速度,还将影响分类和检索的准确度。比如在信息检索时,可能仅仅因为某一页面广告信息中包含用户所查找的关键字而将该页面返回给用户。因此,快速准确地提取从网页的主题内容和主题相关内容已经成为Web信息处理系统预处理环节中一个必不可少的环节。本文在网页内容提取方面主要做了以下几点研究:(1)提出了并实现了一种主题型页面识别算法,该算法利用主题型页面的多个特征,首先通过启发式规则过滤,然后再通过分类器对不能识别网页进一步分类,实验证明了该算法具有较好的识别效果。(2)针对以往网页分块算法只使用一种线索的不足,提出并实现了基于多线索的网页分块算法,该算法综合利用了标签线索,视觉线索和文本线索,对网页进行分块,生成语义块树结构,并保留语义块的视觉信息等,方便后序利用。通过实验证明和现有分块算法相比,本文提出的算法提高了分块准确率,并且更为鲁棒,适用范围更广。(3)总结了网页内容块的主要特征,提出并实现了一种基于组合特征的主题内容块识别算法,该算法将基于文字特征识别的算法和基于布局特征识别的算法组合起来。基于文本特征识别算法偏重于语义块内部的文字内容,而基于布局特征的算法反映的是语义块内部的结构信息。两个算法组合起来使用,最后识别出的主题块既能反映其文本的重要性,又能反映其内部结构的重要性,防止了使用单个特征可能导致的偏差,提高了网页主题内容信息提取的准确率和召回率。(4)在网页相关内容提取方面,通过使用启发式规则,实现了相关链接提取算法和相关图片提取算法。(本文来源于《武汉理工大学》期刊2010-04-01)

郭坤银,邢永康[8](2009)在《基于Web标准的页面分块算法研究》一文中研究指出页面分块在文档分类,信息抽取,主题信息采集,以及搜索引擎优化等方面具有重要的作用。首先提出了一种基于Web标准的页面分块算法,通过对网页进行解析和布局分析,利用Web标准对网页进行分块。实验证明该算法在对遵循Web标准的网页进行分块时,在分块准确性和复杂页面适应性方面得到了提高。(本文来源于《微处理机》期刊2009年06期)

于长富[9](2009)在《基于页面分块的Web档案构建技术研究》一文中研究指出随着Internet的普及和飞速发展,万维网累积了大量的信息资源。它作为一个巨大的资源库和知识库,与人们的生活联系越来越紧密。通过万维网看新闻、写博客、查找资料等等,已经成为日常生活不可或缺的一部分。但是,随着时间的推移,万维网也在默默地发生着变化,其体积在不断的增大,其中的内容也在不断消失、更换和增多。在万维网不断发展壮大的过程中,Internet有一部分内容在逐渐地消失,像一些过期的网页、个人博客等等。这种消失分为两种情况,一是Web页面所在的服务器不再提供服务,二是这些内容被新的内容替换了,但这两种消失都可能是永久性的。针对这种情况,近年来很多机构开始研究和建立各自Web档案系统,并不断地扩展其应用,使其成为一个不断增长的知识库,一个Web的历史博物馆。网页档案系统按照时间顺序将Internet上存在的大量网页收集起来,进行必要的整理,以供将来的研究和使用。其意义在于它能够将随着时间大量流逝的网页保留下来,为针对Internet的研究提供一个比较全面的数据源,并可以以近似原貌的形式将其显示出来,通过更深入的研究还可以在其基础上实现进一步的应用。基于此,本文提出了一种面向Web档案的页面分块方法,初步建立了一个基于页面分块的Web档案原型系统,该系统以页面块为单位探测Web页面的变化,并能够实现块级别的增量存储,为历史页面的查询和研究提供数据源。与传统的基于整个页面的Web档案构建方法相比,本文工作的特点是基于页面分块技术,使版本比较、存储均以块为单位,减少了版本比较和存储的开销。实验表明,本文提出的基于页面块的Web档案系统构建方法是可行和有效的。(本文来源于《东北大学》期刊2009-06-01)

张玉连,刘娟,齐峰[10](2009)在《基于页面分块的手机显示算法》一文中研究指出随着移动上网业务的日益发展,人们迫切希望能够通过手机访问Web内容。由于手机技术存在着多方面的局限性,使得须对所要访问的Web页面进行转换处理。将Web页面信息智能化地切割成多个内容相关子块,然后对子块进行优化,构建其适应手机屏幕的大小的子页。基于以上内容,提出了一种基于可视化分析和DOM结构的手机显示SADA算法。实验结果表明,此算法能够高效快速地访问Web内容。(本文来源于《2009国际信息技术与应用论坛论文集(上)》期刊2009-05-01)

页面分块论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着我国经济的大力发展以及电子技术的飞速提升,人们的生活越来越重视移动设备的使用,尤其是智能手机、平板电脑等。进一步,借助无线网络,人们通过移动设备能够随时随地的向网络获取信息和处理事务。然而,这些网络信息资源和处理事务的途径一般都是来自于Web网页,如有提供新闻资源的新闻网页,提供搜索服务的门户网页,提供商品出售的购物网页,提供视频观看的视频网页等等。但是这些网页都是基于PC端电脑而开发设计的,由于移动设备硬件具有其自身先天性的局限性:计算能力有限、存储量小、屏幕小以及带宽低等,当我们使用移动设备去直接浏览这些网页会出现许多问题,如加载速度慢甚至不完全,显示效果混乱不规整,滚屏操作繁琐等等。若要充分利用现有的Web网页资源,就必须将PC端网页转换成适用于移动设备显示的新网页。而这-转换过程中最为关键的环节是对Web网页进行页面分块,因此本文对Web页面分块算法进行了深入研究,目的是使移动设备能够直接快速的浏览PC端Web页面。基于文档对象模型(DOM树)的页面分块算法是现有页面分块算法之一,该算法适用于各种复杂网站。目前基于DOM树的页面分块算法包括利用HTML标记的布局规律、利用HTML标记之间的关系以及利用<TABLE>标记的布局特点的页面分块算法。这些算法只对对有固定格式、规范标记用法的Web页面和采用表格<TABLE>布局的Web页面有较高的分块效率和正确率。但是,随着网络技术发展的不断进步,现有网页的布局方式已经发展为DIV+CSS的布局方式,该布局方式解决了表格<TABLE>布局的嵌套关系复杂、网页维护和改版困难等缺点,使得网页制作更加方便灵活。故本文提出了面向DIV+CSS布局方式的页面分块算法。本文在过去算法以及DIV+CSS (Division+Cascading Style Sheets)布局特点的基础上设计出了基于该布局方式的Web页面分块算法。该方法实现了对采用DIV+CSS布局的网页进行页面分块,并通过实验证明,此方法具有一定的有效性和可行性。本文主要工作内容安排如下:1.对国内外的页面分块技术进行了研究与分析,并对各个分块算法的优缺点和网页针对性做了比较与分析。2.研究了DIV+CSS布局方法和它的HTML文本结构,并与表格<TABLE>布局方法进行比较。3.提出面向DIV+CSS布局的Web页面分块算法。利用DIV+CSS布局方式的Web页面结构,首先通过分析HTML文本,生成一颗DIV树;然后对该树进行前序遍历:提取对应的CSS文件中各个<DIV>标记的宽度,以移动设备小屏幕的宽度作为阈值,比较两个宽度的大小;最后根据比较结果对Web页面进行分块,再将分好的页面块按照原网页的布局格式进行重新组合,进而转换成适用于小屏幕浏览的新页面。4.实现了面向移动设备的Web页面分块转换系统。该系统以面向DIV+CSS布局的页面分块算法为核心,以普通PC端Web页面作为输入,以适用于移动设备小屏幕浏览的Web页面作为输出,有效地将Web页面进行了转换。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

页面分块论文参考文献

[1].杨丽.Web页面分块算法MDSPS及其在Web信息抽取中的应用研究[J].信息通信.2018

[2].李园园.面向DIV+CSS布局的Web页面分块算法研究[D].广西师范大学.2013

[3].刘凤成.面向移动终端的Web页面分块与转换方法的研究与应用[D].中南大学.2012

[4].吕天,于长富.Web页面分块技术综述[J].现代计算机(专业版).2012

[5].陈颖.Web页面分块技术的研究与实现[D].华中科技大学.2012

[6].蒋建中,丁宝琼,吴琼,邱文武.基于页面分块的网页排序算法:BHITS[J].计算机工程.2010

[7].苗苗.基于页面分块的网页内容提取的研究与实现[D].武汉理工大学.2010

[8].郭坤银,邢永康.基于Web标准的页面分块算法研究[J].微处理机.2009

[9].于长富.基于页面分块的Web档案构建技术研究[D].东北大学.2009

[10].张玉连,刘娟,齐峰.基于页面分块的手机显示算法[C].2009国际信息技术与应用论坛论文集(上).2009

标签:;  ;  ;  ;  

页面分块论文-杨丽
下载Doc文档

猜你喜欢