博客搜索引擎优化(资源推荐Zac出版的《SEO实战密码》(图))
优采云 发布时间: 2021-09-18 12:27博客搜索引擎优化(资源推荐Zac出版的《SEO实战密码》(图))
资源建议
Zac出版的SEO实用密码是一本SEO介绍的好书。不幸的是,我在当当网上购买的电子书受DRM版权保护,无法与您共享
我在网上找到了这本书的搜索引擎章节,内容非常详细,很容易理解。链接如下:
前言
SEO是英文搜索引擎优化的缩写,中文翻译为“搜索引擎优化”。SEO是指从自然搜索结果中获取网站流量的技术和过程。在了解搜索引擎自然排名机制的基础上,对网站进行内外调整优化,提升网站在搜索引擎中的关键词自然排名,获得更多流量。博客seo的目的是提高博客的流量和知名度
要做好SEO,我们必须简单了解搜索引擎的工作原理和自然排名机制
搜索引擎的工作过程非常复杂。我只简单介绍一下搜索引擎是如何实现网页排名的,我只需要知道注册博客的SEO知识。与真正的搜索引擎技术相比,这篇文章介绍的内容只是肤浅的,但对于博客seo来说已经足够了。我尽量以最简单的方式去理解,并没有设计算法和深刻的理论知识
搜索引擎的工作过程可以分为三个阶段:爬行和爬行、预处理和返回搜索结果
爬行和抓取
搜索引擎爬行器通过跟踪链接访问网页,以获取网页HTML代码并将其存储在数据库中
搜索引擎蜘蛛如何抓取网页
查找链接→ 下载此网页→ 添加到临时库→ 提取网页中的链接→ 下载网页→ 循环
首先,搜索引擎蜘蛛需要找到链接。至于如何查找链接,通过链接查找链接很简单。方法是深度优先和广度优先。当然,我们注册的博客基本上不考虑网站目录结构。一般的网站结构通常分为以下三个级别:主页-频道-文章页面。理想的网站结构应该更扁平,从主页到内容页的层次更少,这样搜索引擎就可以更容易地处理它
对于博客seo,如果你想让蜘蛛抓取我们的文章,你必须导入文章的链接。同一博客的外部链接和内部链接都会增加蜘蛛发现网页和爬行的概率。否则,蜘蛛就没有机会知道页面的存在
例如,当我写一系列博客时,我喜欢在我的博客文章中写文章的连接,尽管在开始时,我的文章没有一个是百度写的收录。有一天,博客花园里有一个文章HTTP协议分析工具-原创essence区域,因为它的页面权重高,百度蜘蛛爬行更频繁。有了这篇博文的收录,我所有的博文都将被百度收录
预处理
索引程序主要对捕获的页面数据进行关键词提取、生成反向索引、计算页面PageRank值、关键词与页面的相关性、计算trustrank值等操作,以调用排名程序。这是搜索引擎在很短的时间内返回搜索结果的关键。其中,我们最关心的是PR值和相关性
PageRank原则
理解PageRank就是理解为什么SEO需要一定数量的高质量外部链
PageRank可以形象地比作:一个页面的排名是链接“投票”的结果,是具有不同权重的投票。优秀的网站投票会让你的排名更高,垃圾网站也没用。因此,高质量的外链对SEO非常有帮助
计算页面的PageRank值后,页面将获得独立于页面主题(内容)的排名
PageRank值行列式:(来自维基百科)
PageRank通过计算网页链接的数量和质量来粗略估计网站的重要性。潜在的假设是,更重要的网站可能会从其他网站收到更多的链接
以上段落的主要思想是,PR值由页面链接的数量和质量决定
如何理解链接的质量
假设一个网页具有高PR值(高重要性),网页中的连接质量会更好。通常是一些权威网站PR价值很高
这意味着网页的重要性将被转移。链接传递的PR值取决于导入链接所在页面的PR值。发送链接的页面的PR值越高,可以传递的PR值就越高
关键词与页面的相关性
理解阶段关键词和页面之间的相关性就是理解为什么SEO需要好的锚文本和关键字优化文章
影响页面与搜索关键词相关性的因素包括链接分析、词频和密度、关键词位置和形式、关键词距离等,其中链接分析占相当大的比例
不得不提到百度创始人李彦宏的超级连锁分析专利。p>
建立链接叙词表,记录链接锚文本的一些相关信息,如锚文本中收录的关键词内容、链接的页面索引、收录特定锚文本的链接总数以及收录特定关键词的链接指向的页面。同义词表不仅收录关键词原型,还收录同一词干的其他派生词关键词
根据这些链接数据,特别是锚文本,计算基于链接的网页的相关性。在用户搜索时,将基于链接的相关性和基于关键词匹配的传统相关性相结合,以获得更准确的排名
页面上以搜索词作为锚文本的导入链接越多(这句话需要仔细理解),页面的相关性就越强。链接分析还包括链接源页面本身的主题和锚文本周围的文本。例如,如果某个服装类的网站与Java语言学习页面有连接,则该页面与搜索关键词之间的相关性较低
返回搜索结果
用户输入关键词后,排名程序调用索引库数据,匹配关键词,然后根据特定格式生成搜索结果页面。这是因为之前的预处理,搜索引擎可以在很短的时间内返回结果
百度搜索结果显示格式
自然结果的格式分析
百度自然搜索结果记录格式如下:
第一行是页面标题,通常取自页面HTML代码中的title标记。这是结果列表中最引人注目的部分。用户可以单击标题访问相应的网页。因此,页面标题标签的书写方法对排名和点击率都具有重要意义
二、第三行是页面描述。有时,页面描述取自页面HTML中的description标记,有时,相关内容从页面的可见文本中动态捕获。因此,当用户查询时,将确定要显示的页面描述文本
第四行是百度快照和百度口碑的好评率。请注意,此表扬率是整个网站的表扬率,而不是单个网页的表扬率