网页搜索引擎优化(本文的分析系统着手的主要工作步骤及注意事项介绍)
优采云 发布时间: 2021-11-12 21:15网页搜索引擎优化(本文的分析系统着手的主要工作步骤及注意事项介绍)
摘要:本文从搜索引擎的分析系统入手,介绍分析系统的工作流程,从网页结构、网页减重、PR值等角度探讨优化原因,并提出有针对性的网站 优化方法。
关键词:搜索引擎;分析系统;网站 优化
随着互联网技术的飞速发展,搜索引擎变得越来越重要。据统计,约有80%的网民使用搜索引擎来查找自己需要的信息。新兴的中小企业和传统的大企业都看到了电子商务的潜力,纷纷开始发展线上业务,这也带动了电子商务的蓬勃发展网站。那么什么样的网站容易被搜索引擎分析网站呢?
一、什么是搜索引擎
搜索引擎是一种计算机程序,用于检索计算机网络上的各种文件,尤其是万维网上的文件。搜索引擎通过用户输入的查询关键词推断用户的查询意图,然后快速聚合各种重要且有价值的相关网页为查询结果供用户选择。
二、搜索引擎分析系统
搜索引擎按功能可分为下载、分析、索引、查询四大系统。其中,分析系统在搜索引擎的结构中主要承担网页结构化、网页去重、文本分词和PageRank计算四大基本任务。如下所示:
图1 分析系统*敏*感*词*
分析系统的主要工作步骤如下:
1. 爬虫通过页面库中的下载系统下载的原创网页。写论文
2、建立标签树,从网页中提取有价值的属性,完成将原创网页打包成网页对象的过程,即网页结构化的过程。
3、对于冗余页面,只保留一个相似或相同的网页,传递给分词模块,消除重复页面。
4、分词模块将网页正文以词集为单位进行划分。
5. 将分析结果发送到索引模块进行索引存储。
三、网站 分析系统优化
一、需要保留的信息
图2 网页结构化流程
网页是用 HTML 语言编写的,是一个半结构化的对象。其中有价值的信息,如标题和正文,应该保留,而无用的信息,如HTML标签,应该丢弃,主要通过网页进行结构化,如图2所示。 那又如何呢?有用的信息会被保留吗?
(1)TITLE标签是搜索引擎考虑的最重要的网页信息。在搜索引擎蜘蛛抓取的过程中,之间的内容往往是蜘蛛获取的网页的第一个文字内容。TITLE描述是网页最直观的部分,因此,网页本身是什么内容,蜘蛛首先会从TITLE中找出。
(2)MEAT标签是嵌入在网页中的一种特殊的html标签,里面收录了一些关于网页的隐藏信息。它的作用是向搜索引擎解释网页是关于什么信息的。描述标签用于 是用户在搜索引擎结果列表中链接到网站的描述,这些描述的好坏直接影响到网站的访问次数。关键字标签为搜索引擎提供与一组页面相关的关键字或关键短语列表,正确的关键字标签对于提高排名是有效的。
(3)H标签,该标签中的文字一般用作body title,是对网页body内容的描述。与标题相关的标签按重要性排序如下:TITLE >H1 >H2 >H3 >STRONG 特别要注意的是H1标签在网页中仅次于TITLE标签,只能使用一次,否则容易被搜索认为引擎作为过度优化或作弊。
(4)Anchor text(锚文本),通常是指超链接中可以点击的文字,也就是里面的内容。它是网站优化的重要部分,不仅针对viewer 链接目的地的入口也将目标页面的内容信息传达给搜索引擎。
(5)Alt标签,用来描述带有超链接的内容,比如文字、图片等。尤其是图片,因为搜索引擎无法抓取图片中的信息,如果你把图片的描述写到Alt标签,可以通过查询Alt标签描述的关键词快速搜索相关图片。
(6)Body:无论是锚文本,还是标题或正文标题,都只是对网页的简短描述,而正文是网页的主要内容,完整地表达了网页的主要内容并且不能被忽略。一般文本出现在
在 HTML 标记中等待。
2.页面内容
Internet 上有数亿个网页。存储和处理大量网页是一项艰巨的任务,而这些网页收录许多相同或相似的页面。因此,搜索引擎的分析系统对网页进行形式化分析的首要任务就是消除网页的权重。
搜索引擎将这 4 种类型的页面视为相同或相似。两个页面的内容和格式完全一样(全版面复制),两个页面的内容完全一样,但格式不同(全版面复制)。, 两个网页有一些重要内容相同且格式相同(部分布局重复),两个网页有一些重要内容相同,但格式不同(部分内容重复)。
可见,网页内容的独特性很重要,但互联网的魅力在于信息的共享。好的内容会以多种方式快速传播和推广。对于搜索引擎,它会导致“在哪里保存相同或相似的网页集合?” 一个,哪些要消除。
(1)从网页生活的角度,过滤掉那些网站低质量的网页,保留大的网站网页。
(2)从版权的角度来看,一般都会尊重原创,过滤转载或复制的网页。所以对于一些新的网站第一篇文章可能不太满意,那么原创@ 文章 的 > 尤为重要。
3. PR值的优化
PR值,即PageRank,网页的技术水平。它是 Google 排名算法的一部分,用于识别网页的排名/重要性。级别范围从 0 到 10,其中 10 为满分。PR值越高,网页越受欢迎。例如:PR值为1的网站表示这个网站不是很受欢迎,而PR值为7到10表示这个网站很受欢迎。
PR值计算公式:PR(A)=(1-d)+d(PR(t1)/C(t1)+...+PR(tn)/C(tn) ),其中PR(A)表示根据Pagerank系统从外部链接站点t1添加到网站的PR值;PR(t1)表示外部链接网站的PR值本身;C(t1)表示外链站点拥有的外链数量;d为阻尼因子,即投票或链接到其他站点时获得的实际PR分数,一般0.85。
现在越来越多的电商企业关注外链网站的PR值,但公式显示PR值需要考虑网站的外链质量和数量。一般来说,PR值大于或等于6的外链站点可以显着提高站点的PR值。但是如果这个外链网站还有100个其他外链,那么可以获得的PR值几乎为零。同理,如果一个外链站点的PR值只有2,但该站点是其唯一的外链,那么得到的PR值远大于6的PR值,外链数为100网站。
提升PR值的方法:
(1)设置友情链接,最好PR值不低于4且与话题网站相关或互补,极少导出链接。
(2)写一些高质量的软文并张贴到大型网站。
(3)提供有价值的网站内容。
(4)花钱买流量,或者去QQ、群、论坛等热门场所推广。
四、总结
一个容易被搜索引擎访问的网站收录需要考虑很多方面,比如关键词、网站地图的使用、导航栏技术等。只是从分析的角度,从系统的角度,提出了需要注意的内容。网站优化是一系列完整的优化过程。通过不断研究网站的特点和SEO策略,不断更新网站内容,增加网站流量,进而提升网站的市场竞争力。
参考:
[1] 欧朝晖.解读SEO-搜索引擎优化与网站成功策略[M]. 北京:电子工业出版社,2008.
[2] 陆良,张博文.搜索引擎的原理、实践与应用[M].北京:电子工业出版社,2007.
[3] 格拉夫,库欣。搜索引擎优化[M].北京:清华大学出版社,2007.