SEO基础:各种网络链接结构对搜索结果(PageRank值)的影响
优采云 发布时间: 2021-05-21 06:32SEO基础:各种网络链接结构对搜索结果(PageRank值)的影响
SEO基础:基于PageRank算法的搜索引擎优化策略
近年来,Google已成为世界上使用最广泛的搜索引擎之一。 Google的优势不仅在于删除无用的(广告)标语以形成单个页面,其自己的缓存系统,动态生成摘要信息以及为高速检索而构建的去中心化系统(成千上万个集群)等。
本文的目的是在分析PageRank算法的基础上,分析各种网络链接结构对搜索结果(PageRank值)的影响以及由此产生的搜索引擎优化策略。
1 PageRank算法
简而言之,PageRank是一个数字,代表Internet上网页的重要性。
通用搜索引擎使用网页排名值和网络搜索结果的相似性作为对搜索结果进行排名的基础。如稍后将说明的,搜索语句将不会出现在PageRank自己的表达式中。 PageRank还是文档的固有分数,无论获得多少搜索语句,它都仅取决于网络的链接结构。
PageRank算法的具体思想是将页面的PageRank除以页面中存在的前向链接,然后将获得的值添加到前向链接所指向的页面的PageRank中以获得链接页面的PageRank。该算法基于“从许多高质量页面链接的页面仍必须是高质量页面”来判断所有网页的重要性。页面获得的投票越多,它就越重要。此外,投票页面的重要性还决定了投票本身的重要性。
在计算网页的页面等级值时,应考虑所有传入链接。第一页排名值的计算公式如下:
公共关系(A)=(1 d)+ d(pr(t 1) / c(t 1) +?+ pr(TN)/ c(TN))
公式中的
PR表示页面的PageRank值,T1〜TN表示具有到页面A的链接的网页,C是网页的链接数,D是阻尼系数(常数,Google通常取0 。8 5)因为在Internet上浏览时,用户可以跳转到完全不相关的页面而无需关注当前页面中的链接,因此d实际上表示用户关注该网页的链接并且不会产生随机的可能性跳。
(1)是用于计算网页排名值的初始公式。到目前为止,Google尚未宣布其算法,因此Google可能在使用该公式时对其进行了一些修改。几乎不可能会影响以下分析。
根据公式(1),网页的页面排名值的计算始终取决于其他相关页面,因此页面排名值的计算实际上是一个迭代过程,计算结果的准确性取决于初始值和迭代次数的选择,通常初始值为1.为了确保结果在实际应用中始终收敛,需要添加阻尼系数d。
此*敏*感*词*从0到10。之所以称为“标记”,是因为它不是网页的真实页面排名值,而是网页的日志索引实际值,对数底应为5-6。
PageRank在所有链接的页面上执行。投票。由于可能会出现随机跳转,因此页面总排名值略小于网页本身的页面排名值(其自身值为3天)。此值平均分布在所有传出链接中。因此,网页的页面排名值非常重要,但是无法忽略此页面的输出链接数:输出链接越多,网页获得的页面排名值就越低。另外,由于pr值是PageRank真实值的对数索引,这意味着网页需要更多PageRank值才能从较高的PR值而不是从较低的PR值进行改善。在这种情况下,哪一个比带有更多传出链接的PR8页面和另一个带有更少传出链接的PR4页面更有效?这可能取决于PR值的对数基础和特定的链接条件。
应该注意的是,当一个页面被“投票”并且其他页面的页面排名值受此方法影响时,其页面排名值不会降低。这不是PageRank的转移过程。
2基于PageRank的优化策略
假设我们有一个网站,将网站的页面等级平均分配给每个页面(如果可能)显然是不明智的,因为我们不能也不需要对[网站很高。如果网站的大多数页面排名值可以某种方式指向一页或几页,从而可以大大提高其排名,则效果肯定要好于均匀分布的结果。因此,以下讨论的重点不是单个页面的权重,而是整个网站或网站中重要页面的页面排名值。这些页面可以是索引页面,中心页面或为某些搜索词优化的页面。
2. 1考虑内部连接的影响
网站的页面等级值是网站中所有页面的页面等级值的总和。 网站的最大页面数等于其页面数。入站链接可以增加此最大值,出站链接可以减少此最大值。 网站中的链接组织不好,网站可能尚未达到最大页面排名值,但是不可能超过该值。应当注意,尽管添加页面可以增加网站的页面排名值,但并非总是可以添加任何页面。那些相同或几乎相同的页面称为“垃圾邮件”。 Google认为这是垃圾邮件,会触发相应的警报机制,因此该页面甚至整个网站都将受到惩罚。因此,基本上,网页应该具有一定的质量。
让我们分析网站内部链接如何影响页面排名。我们在这里考虑的是相对独立的网站,目前不会考虑入站和出站链接的影响。
假设网站具有三页并且没有外部链接(图1)。在(a),(b)和(c)的情况下,我们将初始值指定为1,即阻尼系数,使用Google的(0.8 5)。
(a):PageRank A = 0. 15,PageRank B = 0. 15,成绩C = 0. 15;
(b):等级A = 0. 15,PageRank B = 0. 277±5,等级C = 0. 15;
(C):第一级= 1,第二级= 1,第三级= 1;
网站(a)的页面等级值为0。45,这严重浪费了潜在的PageRank值。 (b)中的情况稍好一些,总值为0。与前面的示例相比,增加了5775,但仍仅是最大值的一小部分(此处不讨论此结构中的摆动页面) 。在(C)的链接结构下,网站达到了最大页面等级,也可以通过循环以下结果来获得:A到B,B到C,C到A。可以增加到3页以上。
可以看出链接不好,可能会完全浪费潜在的PageRank值。根据实验规则,得出了内部链接结构的第一个优化策略:一般来说,当有链接时,圆形链接或任意两个页面都可以达到页面排名值网站。
假设A被用作索引页,并且有两个链接结构(A)和(B)。省略计算过程后,迭代结果如下:
第一页= 1.459 459,B页=0。770270 3,C页=0。770270 3;
第一页= 1.298 245,B页= 0.9999 999 9,C页= 0.701 754 3;
这两个结构的总值仍为3(最大值),因此没有浪费。但是,在(B)的情况下,A显然会丢失部分页码,而C也会丢失部分页码,因为A和B共享而不是互斥,并且A传递了链接A和rarrc减少了。
因此,获得第二种优化策略:为了获得索引页的最大PageRank值,其他页应尽量减少相互链接。如果页面链接到具有循环链接的页面,则向该页面添加新的出站链接将间接失去部分PageRank值。如果没有这样的循环,则页面等级值不会降低。这在内部链接中并不重要,但在网站外部的链接中则不同。可以看出,网站的页面排名值可以通过组织的内部链接指向所选页面。内部链接可以根据网站的页面排名要求进行组织,但内部链接必须是Google批准的页面。
2. 2入站和出站链接
入站链接(从网站外部输入的链接)是增加网站页面排名值的方法之一。入站链接来自哪里都没有关系。 Google相信,只要网站管理员不控制与网站链接的其他网站,他就不会因此受到惩罚。
链接页面的页面排名值非常重要,但是链接数也非常重要。例如,如果它是网页的唯一输出链接,而PageRank的值为2,则它将获得0的值。15 + 0.85(2 / 1) = 1.85;具有100个输出链接的PageRank 8页面获得0 。15 + 0.85(7/10 0) = 0.209 5.显然,PR2链接更有效。将页面等级值注入网站后,将需要重复计算。某些页面的值会增加,而其他则保持不变,具体取决于内部链接结构,但是肯定没有页面会丢失页面排名值。
对于入站链接,指向您要指向的重要页面更为有益。如果将PageRank注入其他页面,由于内部链接,它将分散在网站中。索引页面也将被提升,但不如直接链接那么多。直接获得入站链接的页面将获得最大值。
第三个优化策略:以网站索引页为最佳目标并引入入站链接。
出站链接将消耗网站页的排名值。为了抵消这种消耗,有必要确保链接相互链接。双向链接可能会获得或失去PageRank值,因此链接交换应格外小心。
当PageRank值与另一个网站链接一起显示时,所有内部链接的页面都会受到影响。尽管PageRank值的具体变化取决于链接结构,但通常,提供链接的网页通常丢失最大的PageRank值,因此可以得出第四个优化策略:将出站链接放置在具有较低PageRank的页面上,从而PageRank中的损失较少。
几乎没有任何网站没有出站链接,但是不幸的是,一切正常。链接泄漏了PageRank值。但是,仍然有一些特殊的方法不公开链接。 PageRank是否泄漏取决于Google是否可以识别链接,因此您可以使用Google无法识别或忽略的链接,包括表单操作和收录JavaScript代码的链接。
表单的action属性不一定是处理表单脚本的url,它可以指向网站中的任何页面。示例:
此外,action属性甚至可能不是形式,而是JavaScript代码,并且JavaScript代码可能位于存储路径的js目录中,通常Google的蜘蛛程序无法访问它。
3摘要和排名的改进
PageRank值由网络链接结构确定,与特定的搜索内容无关,因此它在搜索过程中消耗很少,并且比早期的H ITS算法要好。无论Web内容的特定需求如何,所提出的优化策略都有利于提高搜索引擎搜索结果中网页排名算法的排名。短期内这种效果可能并不明显,但是随着网页和网站之间的链接的增加,最终效果仍然很大。
同时,由于PageRank算法的搜索独立性,它也可能导致某些不利的结果。例如,对于在特定上下文中具有特定含义的某些单词,或对于某些专业单词,仅PageRank排名的结果可能不令人满意,例如,在体系结构的上下文中,该单词的相同搜索“结构”在芯片制造的背景下,用户想要的搜索结果必然会有所不同。但是,页面等级是网页的固定属性,可能无法达到预期的效果。如果您将整个Internet视为一个维度,那么PageRank就是这个维度的载体。鉴于上述缺点,我们可以考虑建立这样的向量的向量集。换句话说,可以为某些指定的关键词计算多个页面排名值,然后可以根据搜索内容匹配相应关键词的页面排名值[4]。当然,排名结果中使用的PageRank值仍然是唯一的。这种改进增加了检索过程的成本,但大大提高了结果的排名。
参考:
大型超文本网络搜索引擎的分析[A]。第七届国际万维网会议论文集[C],1998年。
[2]巴巴,马常昭。 Google-PageRank的机密说明[EB / OL]。 〜巴巴,2003年。
[3] JEH,IDOM。缩放个性化Web搜索[R]。斯坦福大学,2002年。
[4]拥有伊瓦拉号。前IC2敏感页面排名[A]。 2002年第十一届国际互联网会议论文集[C]。
版权声明:网站的原创 文章由秦皇岛的搜索引擎优化发布。如果转载,请注明出处。秦皇岛搜索引擎优化博客
要转载,请指定:seo- 网站优化-网站构建-外部链分布»基于PageRank算法的搜索引擎优化策略