网站内容抓取(为什么搜索引擎只抓取一个固定页面?只需抓取页面)
优采云 发布时间: 2021-09-08 11:00网站内容抓取(为什么搜索引擎只抓取一个固定页面?只需抓取页面)
如果你是一个seo项目的seo从业者,我们经常做的一件事就是查看网站日志,偶尔我们会遇到这样的情况:
搜索引擎爬虫只是每天固定爬取一个页面,而不是爬取网站内的任何其他页面,这让seo从业者很头疼,难以长时间连续运行。
为什么搜索引擎只抓取固定页面?
那么为什么搜索引擎只抓取一个固定的页面呢? 1、page 内容更新
一般来说,如果你是一个新站点,在网站建设的初期,首页通常是一个被反复爬过很长时间的页面。在这个过程中,你几乎每天都会看到蜘蛛爬行。首页甚至你的索引都只是一条直线。
一般来说,如果你是一个刚上线的新网站,我们认为这种情况是可以理解的。您可能需要不断地在整个网站上输出内容,并经常将其显示在主页上。
搜索蜘蛛可能有更高的概率抓取相关内容。
2、页面可访问性
这是一个司空见惯的情况。我们认为应该从两个角度讨论页面可访问性:
①页面加载速度
②页面的机器人协议
如果您的页面不是经常被抓取的页*敏*感*词*有非常高的打开率,我们认为与快速访问的页面相比,其他页面很难对搜索友好。 网站本身,如果没有重量,很容易就少了。抢。
当然,如果robots协议配置错误,在一定程度上,其他相关页面也难以抓取,比如首页以外的页面被错误屏蔽。
3、Internal Links Less
这是一个比较特殊的情况。有时我们总会在企业网站内部构建一些高质量的页面,类似于主题单页面。在一定程度上,我们希望该页面能够获得更高的搜索排名。
采用nofollow策略,而不是对站点中的任何页面进行加权,这会阻止页面上的所有链接。
基于这个策略,在某种程度上,其他页面不会被抓取。
4、低页面质量
有时候,我们在做网站内容更新的时候,为了快速让网站看起来更加丰富,偶尔采集会结合一些低质量的内容来填充页面。
这导致搜索引擎早期在爬取目录时使用了大量低质量的内容评价策略,认定某个目录下的内容没有搜索价值,导致基本不爬取任何内容目录。
有时,即使您重新调整目录中内容的质量,也可能无济于事。
5、网站非告案
从目前来看,网站在国内非备案搜索引擎中的表现并不是特别理想。搜索引擎长时间只抓取一个页面是很常见的。
而这样的网站收录是极其困难的。一般来说,如果你的内容不够优质,外链资源不够优质,很难获得有效信任。
所以,长时间只抓取一个页面是正常的。
6、page 目录级别
在SEO诊断工作中,我们经常会遇到这样的情况。 网站好像没有什么问题,而且公司已经备案了,页面加载速度也不错。在长期运行的过程中,网站的总页面数很难被蜘蛛抓取。
在这种情况下,我们通常会检查站点中的某些目录级别。如果你的优质内容页面有很深的目录层次,例如:达到4-5级,新的网站很难被搜索引擎发现,这会导致蜘蛛长时间抓取一个页面。
7、page 投稿频道
在早期的SEO工作中,我们知道,如果您的页面质量好,并且保持较高的输出频率,通常搜索引擎会主动访问,但随着信息内容的快速发展而增加。
搜索引擎在抓取页面时,往往会设置一定的级别,比如:先抓取哪些渠道的链接,再审核。
页面提交的渠道尤为重要,尤其是API百度网址提交。
总结:搜索引擎长期只抓取固定页面,还有很多细节需要讨论,以上内容仅供参考!
如果还没有接触过系统SEO的朋友,可以关注我,参考我为大家准备的资料教程。也可以来专门的SEO社区一起学习交流,在我的微信公众号“爱雪SEO”中了解最新的行业资讯和最新技术,希望共同交流、共同成长。