网站内容抓取(网站频次频次和页面收录到底有什么关系?(图))
优采云 发布时间: 2021-10-16 15:30网站内容抓取(网站频次频次和页面收录到底有什么关系?(图))
问题:网站抓取频率和页面收录有什么关系?
问题补充:我在百度搜索资源平台上看到网站的抓取频率相当高,但是为什么更新的页面不能及时收录?新页面不仅收录慢,而且收录还少!那么,网站的抓取频率和页面收录有什么关系呢?为什么抓取频率高但页面收录慢?
答:严格来说,网站的抓取频率与收录页面没有直接关系。要澄清这个问题,您需要了解两个方面。下面就来详细说说吧。
1. 页面的爬取不代表该页面会收录
百度搜索蜘蛛抓取页面内容,并不意味着一定要建数据库。内容爬取后,百度搜索会对内容进行初步审核,质量不合格的直接过滤掉。只有通过初审的页面才会被建立到数据库中,然后它们可能会反映在网站索引中。有一种情况需要了解。将页面添加到索引后,SITE 命令可能无法找到它。
如果网站在这些低质量的页面上爬得更频繁,很明显网站收录不会明显增加,这就是网站爬行频率变高的原因之一高,但页面 收录 低。
2. 蜘蛛抓取已经收录 的页面
有时可能会出现这种情况。网站被抓取了很多,但是大部分抓取的对象都是已经收录的内容,而那些新更新的页面没有或者很少被抓取如果你得到了,收录的数量新页面上的@>自然会少一些。
需要注意的是,百度抓取并不完全针对新页面。对于那些已经更新,百度搜索认为值得更新百度快照的页面,蜘蛛也会抓取它们。因此,如果遇到百度抓取频率高,但新页面收录低的情况,需要分析网站日志,查看新页面是否被抓取。如果不爬取,即使内容质量再高也不会收录。
综上所述,一个页面成为收录的前提是被蜘蛛爬取,但被爬取后并不一定是收录。所以,要想提高网站收录,需要抓住两点。第一,确保被蜘蛛爬取成功(如果蜘蛛能更好的爬取?可以主动提交链接,做外链,做内链的方法引导蜘蛛及时爬行),二是保证内容的质量。如果这两点都能做到,网站页面收录就不会有问题了,这就是网站爬取的频率与页面收录的关系。
关于收录页面的问题,建议阅读网站收录一般需要多长时间,以及收录@删除文章的原因>、排名从关键词分析页面不是收录的原因,如何让页面被搜索引擎蜘蛛抓取等文章。
修订后的补充内容:
关于网站的抓取频率和页面收录的关系,大家要注意一个问题。蜘蛛爬取是页面收录的前提,页面网站只能被爬取。它可能是 收录。但是被爬取的页面并不一定是收录,所以仅从爬取频率来分析收录是不合理的。回到网站优化的基础上,如果网站能够提供有价值的内容,那么无论是抓取频率还是页面收录都不是问题。