seo优化搜索引擎工作原理(资源推荐Zac出版的《SEO实战密码》(图))

优采云 发布时间: 2021-12-31 15:41

  seo优化搜索引擎工作原理(资源推荐Zac出版的《SEO实战密码》(图))

  资源推荐

  Zac出版的《SEO实用密码》是一本介绍SEO的好书。很遗憾,我在当当网购买的电子书受DRM版权保护,无法与您分享。

  我在网上找到了这本书中关于理解搜索引擎的章节,很详细,很容易理解。链接如下:

  前言

  SEO来自英文Search Engine Optimization的缩写,中文译为“搜索引擎优化”。SEO是指从自然搜索结果中获取网站流量的技术和过程。基于对搜索引擎自然排名机制的理解,对网站进行内外部调整优化,提高网站关键词在搜索引擎中的自然排名,获取更多流量。博客搜索引擎优化的目的是增加博客的访问量和受欢迎程度。

  如果你想做好SEO,你必须简单地了解搜索引擎的工作原理和自然排名机制。

  搜索引擎的工作过程非常复杂。我只会简单介绍一下搜索引擎是如何实现页面排名的,我只需要了解注册博客的SEO知识即可。本文章介绍的内容,对于真正的搜索引擎技术来说,只是小菜一碟,但对于博客的SEO来说已经足够了。我尽量以最简单的方式去理解,不去设计算法和深奥的理论知识。

  搜索引擎的工作过程大致可以分为三个阶段:爬取爬取、预处理、返回搜索结果。

  爬行和爬行

  搜索引擎蜘蛛通过链接访问网页,获取网页的HTML代码并存入数据库。

  搜索引擎蜘蛛如何抓取网页?

  找到某个链接→下载这个网页→添加到临时库→从网页中提取链接→下载网页→循环。

  首先,搜索引擎蜘蛛需要找到链接。至于怎么找,很简单,就是通过链接找到链接。方法包括深度优先和广度优先。当然,我们注册的博客基本没有考虑网站的目录结构问题。一般网站结构通常分为以下三个层次:首页-频道-文章页面。理想的网站结构应该是扁平化的,从首页到内容页的层级越少越好,这样搜索引擎会更容易处理。

  对于博客SEO,如果想让蜘蛛爬到我们的文章,必须导入文章的链接。无论是外链还是同一个博客的内链,都可以增加蜘蛛发现网页并爬取的概率。否则,蜘蛛就没有机会知道页面的存在。

  比如我写系列博客的时候,喜欢在博文里写文章的相关链接,虽然我的文章一开始都没有被百度收录发布。一天,博客园-原创精华区有一篇关于http协议分析工具的文章文章,由于页面权重高,百度蜘蛛爬取的频率更高。继本博文的收录之后,我所有的博文都被百度了收录。

  预处理

  索引程序主要进行关键词提取、倒排索引生成、页面PageRank值计算、关键词和页面相关、TrustRank值计算等,准备排序程序调用。这是搜索引擎在极短的时间内返回搜索结果的关键。其中,我们最关心的是PR值和相关性。

  PageRank原则

  了解 PageRank 意味着了解为什么 SEO 需要一定数量的高质量外部链接。

  PageRank可以形象地比喻为:一个页面的排名是链接“投票”的结果,是不同权重的投票。为您投票的优秀 网站 将使您获得更高的排名。,垃圾网站没用。因此,高质量的外链对SEO非常有帮助。

  计算页面的PageRank值后,网页会得到一个与页面主题(内容)无关的排名。

  PageRank 值决定因素:(来自维基百科)

  PageRank 的工作原理是计算页面链接的数量和质量,以确定对网站重要性的粗略估计。基本假设是,更重要的网站可能会收到来自其他网站的更多链接。

  上一段的大致思路是:PR值是由页面链接的数量和质量决定的。

  如何理解链接的质量?

  假设一个网页的PR值高(重要性高),那么网页中出现的链接质量就更好。通常一些权威网站有更高的PR值。

  这也意味着网页的重要性将通过。一个链接传递的PR值是由该链接被导入的页面的PR值决定的。发送链接的页面的PR值越高,可以通过的PR就越高。

  关键词与页面的相关性

  理解关键词和页面的相关性,就是理解为什么SEO需要文章的好的锚文本和关键字优化。

  影响页面相关性和搜索关键词的因素包括链接分析、词频和密度、关键词位置和形式、关键词距离。链接分析占了相当大的比重。

  不得不提百度创始人李彦宏的超链接分析专利。

  建立链接词典,记录链接的锚文本的一些相关信息,例如锚文本中收录哪些关键词,发送链接的页面索引,收录特定链接的链接总数锚文本,以及收录特定 关键词 哪些页面都指向的链接。词库中不仅收录关键词的原型,还收录同词干关键词的其他派生词。

  基于链接数据,尤其是锚文本,计算基于链接的网页的相关性。用户搜索时,将获得的基于链接的相关性与基于关键词匹配的传统相关性相结合,以获得更准确的排名。

  页面上使用搜索词作为锚文本的导入链接越多(这句话要仔细理解),页面的相关性就越高。链接分析还包括链接源页面本身的主题,锚文本周围的文字等。比如一个服装类网站有一个java语言学习页面的链接,那么这个页面与搜索关键词 性低。

  返回搜索结果

  用户输入关键词后,排名程序调用索引库数据,匹配关键词,然后生成一定格式的搜索结果页面。这是因为之前的预处理,搜索引擎可以在很短的时间内返回结果。

  百度搜索结果显示格式

  自然结果格式分析

  百度自然结果记录格式如下:

  第一行是页面标题,通常取自页面HTML代码中的Title Tag。这是结果列表中最引人注目的部分。用户可以点击标题访问相应的网页。因此,页面标题标签的书写方式对于排名和点击率都具有重要意义。

  第三行二、是页面描述。有时页面描述取自页面HTML中的描述标签(DescriptionTag),有时则从页面可见文本中动态抓取相关内容。因此,显示什么页面描述文本是在用户查询时确定的。

  第四行是百度快照和百度口碑的好评率。注意这个好评率是整个网站的好评率,不是单个网页的好评率。

  转载于:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线