百度搜索引擎优化原理(关于网站百度快照更新的一些事儿,你知道多少? )
优采云 发布时间: 2021-10-08 04:10百度搜索引擎优化原理(关于网站百度快照更新的一些事儿,你知道多少?
)
搜索引擎为用户显示的每一个搜索结果都对应于互联网上的一个页面。每个搜索结果从生成到被搜索引擎展示给用户,都需要经过四个过程:抓取、过滤、索引和输出结果。
1、关于爬取
如何让蜘蛛24小时守护你的网站,这位细心观察的SEOer会发现,每个网站百度快照的更新时间都不一样,有些网站百度快照是每天24小时更新,是最新的;部分网站百度快照3天前更新;有些是 7 天前;有些网站需要更长的时间,也许有无期徒刑。影响百度蜘蛛抓取频率和数量的因素有哪些?百度给出了官方回复:
(1)、网站更新频率:更新来得快,更新来得慢,直接影响百度蜘蛛的访问频率
(2),网站更新质量:更新频率增加,只引起了百度蜘蛛的关注。百度蜘蛛对质量有严格要求。如果网站每天更新大量内容,被百度蜘蛛判定为低质量页面仍然没有意义。
(3),连通性:网站要安全稳定,对百度蜘蛛保持开放。经常保持百度蜘蛛不是什么好事
(4),网站评价:百度搜索引擎会对每个网站都有一个评价,这个评价会根据网站情况不断变化,是百度搜索引擎对网站的基本评分(绝不是外界称为百度权重)是百度内部非常机密的数据,网站评分从不单独使用,会与其他因素和阈值共同影响网站的抓取和排名。
2、关于过滤
百度会自己过滤掉一些垃圾页面,哪些是垃圾页面?以下是官方回复:
(1),重复内容的网页:已经在网上的内容不需要百度去收录。
(2), 一个短而空的主要内容的网页
[1] 部分内容使用了百度蜘蛛无法解析的技术,如JS、AJAX等,虽然用户访问时可以看到丰富的内容,但还是会被搜索引擎抛弃
[2] 加载过慢的网页也可能被视为空的短页面。请注意,广告加载时间计为网页的整体加载时间。
[3] 很多主体不突出的网页,即使被抓取回来,也会在这个链接中被丢弃。
(3),一些作弊页面
3、关于建库
百度检索到的页面会根据页面质量分为优质库、普通库和低质量库。那么百度是如何判断一个页面的质量的呢?以下为官方回复:
(1),对用户的价值:
[1] 独特的内容,百度搜索引擎喜欢独特的内容
[2] 主体突出,不要表现出网页的主要内容不突出,被搜索引擎误判为空的短页而未被抓取
[3] 内容丰富
[4] 适当的广告
(2), 链接重要性
[1] 目录级别-浅优先级
[2] 网站内链接的流行度,内部链接
4、关于输出结果
最后,百度会根据用户搜索到的关键词从索引库中提取相关网页,然后根据不同维度的得分对提取的网页进行综合排序。“不同维度”包括:
(1),相关性:网页内容与用户搜索需求的匹配程度,例如网页中收录的用户检查关键词的次数,以及这些关键词出现的位置; 外部网页指向页面上使用的这个锚文本等。
(2),权威:用户喜欢网站提供的内容,具有一定的权威性。相应的,百度搜索引擎也更相信优质权威网站提供的内容。
(3),时效性:时效性结果是指收录新鲜内容的新网页。时效性结果在搜索引擎中变得越来越重要。
(4), Importance: 网页内容与用户检查需求匹配的重要性或流行度
(5),Richness:Richness看似简单,其实是一个覆盖面很广的命题。可以理解为网页内容丰富,完全可以满足用户的需求;它不仅可以满足用户的单一需求,也满足用户的需求,扩展需求。
(6), 流行度:指网页是否流行。