网站内容抓取(百度搜索引擎快照出现快照异常的问题怎么解决?问题)
优采云 发布时间: 2022-02-06 11:06网站内容抓取(百度搜索引擎快照出现快照异常的问题怎么解决?问题)
当搜索引擎在 收录 网页上时,该网页将被备份并存储在自己的服务器缓存中。当用户点击搜索引擎中的“网页快照”链接时,搜索引擎会存储当时Spider系统抓取并保存的网页。显示内容,称为“页面快照”。网页快照的时间应该和搜索引擎收录网页的时间同步,但实际上站长朋友看到的快照时间是不一样的。
针对目前百度搜索引擎出现的快照异常问题,柴晓总结了以下三点:
一、快照时间更新慢;
二、快照时间没有更新;
三、快照时间倒退。
这三个问题经常被SEO人员纠结,今天我们就来分析这三个问题。
一、快照时间更新慢
快照更新时间缓慢是正常的。但可以简单概括为两种情况,1、网站不更新;2、 快照更新需要时间。
1、网站没有更新
网站 的快照的更新时间必然与 网站 本身的更新时间有关。如果网站没有更新,那么搜索引擎蜘蛛在爬的时候就看不到任何新的东西,自然会转身离开,索引库中的备份时间也不会更新。
2、快照更新需要时间
搜索引擎蜘蛛爬取网页后,首先更新索引数据库中的时间。用户看到的网页快照时间是在界面上显示的时间。搜索引擎快照的更新存在一定的延迟。并非所有 网站 都会在索引数据库更新后立即反映快照。因此,快照时间没有及时更新,这与搜索引擎的更新延迟有关。不过,这也和网站长期以来自己建立的更新周期有一定的关系。如果你的网站一如既往的每天及时更新,那么搜索引擎会抓取你的网站的更新周期也会相应调整。
二、快照时间未更新
如果快照时间不更新,有两种简单的情况:1、网站长时间不更新;2、网站 无法访问或被阻止。
1、网站 长期无人看管,不更新,不用说,即使搜索引擎照顾你,它也不会照顾你没有纪律。您的 网站 上次更新的时间将始终保留,从而造成快照时间未更新的错觉。
从上图可以看出,虽然网站说SEO这个词排名不错,但是快照时间一直没有更新。通过查看页面内容,你会发现该页面是一个固定列表页面,其中的内容是2008年发布的,至今没有变化。这就是排名不错,但快照不更新的原因。
2、如果网站中途无法访问,或者服务器关闭,或者其他原因蜘蛛爬取异常,都会导致快照更新异常。
有时候,网站正在更新,或者网站可以正常访问,但是快照时间还是很久以前。这是因为搜索引擎显示给用户的时间不一定是最近更新的时间,而是会选择一个它认为更合适的时间收录。
三、快照时间倒退
如果前两种情况大家都能理解,那么第三种情况可能很少有人能理解。为什么?因为有的网站是2013年建的,所以截图显示时间是2006年,这个时差让人哭笑不得,甚至有种骂百度脑残的冲动。百度工作人员在多次站长大会上都提出过这个问题,但一直没有正面回应。这个问题的答案是基于第二个现象。今天,柴晓图文并茂地分析了这一现象。首先,我们来看看下面这张图。
上图是柴晓的个人博客,这里显示的时间是2006-5-12,但实际上他的博客是2013年成立的。所以看到这个快照时间后,很难理解,想知道这个时间是从哪里来的。经过一番研究,我发现了这个秘密,请看下图:
当时我打开网站查看,发现首页的内容摘要显示的是英文时间,翻译的时候正好是2006年5月12日。回想起来,在这段时间里,这个 网站 一天由于服务器过期而无法访问。看到这些,问题还是解决了。
原来百度快照时间除了选择一个合适的收录时间显示给用户外,还可以在网站内容中抓取时间,作为快照时间显示。
有人可能会认为这是巧合,所以为了进一步证明,柴肖再次进行了实验。请看下图:
SEO研究协会网之前的快照是2014年1月10日,当我把网站页面内容中的时间改成2014年7月25日,百度快照时间开始更新。更新的快照时间与我修改的时间一致。
因此,从以上实验可以看出,百度快照时间主要有3个来源:
一、根据收录的时间及时更新;
二、系统从索引库中的备份时间中选择一个百度认为比较合适的时间作为快照时间进行展示;
三、当网站服务器无法访问时,网站的快照时间容易出现异常,搜索引擎蜘蛛会抓取网站内容中的时间为要显示的快照时间。
当然,以上只是柴晓总结的部分现象,并非全部。由于文章篇幅关系,我就不一一列举了。以后会在聚推学院的课程中分享。
以下是您遇到的一些 SEO 问题:
Q:网站快照时间倒带如何解决?
A:首先,回想一下网站本身近期一直无法访问服务器,或者暂时关闭。如果没有,请通过百度快照投诉或百度站长平台投稿等渠道更新;如果近期服务器出现异常,请查看网站首页内容,看是否有与百度快照时间相符的时间,如果有,请修改时间,或删除时间。下次百度蜘蛛爬取,发现原来的时间不存在,会更新快照时间。
Q:网页URL中出现关键词对SEO有帮助吗?,
A:从用户体验的角度来看,url 可读性最好。用户可以通过url简单判断页面的主题内容。当然,推荐符合用户体验的百度;从直接的角度来看,并没有明确指出它有帮助,但是从间接的角度来看,它仍然是有用的。建议如果可以在URL中体现关键词或关键词拼音,可以尽量体现。
Q:拒绝外部链接多久生效?
A:拒绝外部链接的有效性问题涉及爬取、更新、计算的环节较多,最快生效时间为30天左右。还有一点需要考虑的是,作弊站需要增加作弊成本。拒绝立即生效是不可能的,还有一段时间的处罚。