seo诊断分析工具(分析一下百度抓取诊断失败的原因有哪些或302重定向设置错误)
优采云 发布时间: 2021-12-27 06:00seo诊断分析工具(分析一下百度抓取诊断失败的原因有哪些或302重定向设置错误)
对于SEO站长来说,他们经常使用百度站长平台的爬虫诊断工具。主要功能是从百度蜘蛛的角度分析网站内容,判断百度蜘蛛的爬行情况,解决百度蜘蛛和seo站长的眼睛。内容是否一致。如果频繁出现抓取失败,将极大影响网站的正常收录。接下来分析一下百度抓取诊断失败的原因。
1.301 或 302 重定向设置错误
301重定向是指百度蜘蛛访问链接时发生的重定向。如果重定向后的链接过长或者连续重定向次数超过5次,就会出现重定向错误,爬取失败。
2.网站访问速度
很多SEO站长说本地测试访问返回的HTTP状态码是200,但是爬虫诊断一直显示爬虫在进行中,没有反馈。这是由于服务器线路不同和百度蜘蛛的爬行速度不同造成的。可能会有延迟,会导致可以正常访问但爬取失败的情况。一般遇到这种情况时,需要定期检查服务器各部分的访问速度,以优化网站的打开访问速度。
3.robots.txt 被禁止
在抓取诊断工具中,如果抓取失败,请确认您是否对网站设置了robots.txt禁止,以防止百度蜘蛛抓取网站的某些内容。如果您没有使用robots.txt文件屏蔽百度,请点击旁边的错误链接,百度会立即更新您网站的robots信息;如果您的操作不当导致robots.txt被禁,请及时修改robots文件,以免影响您的网站被百度收录。
4.DNS 错误问题
DNS错误是指百度蜘蛛无法与DNS服务器通信,因为服务器停止运行或DNS到您域的路由有问题。对于持续或重复出现的 DNS 错误,请联系您的 DNS 提供商。通常,您的 DNS 提供商是 Web 服务器托管服务提供商。配置您的服务器,使其可以响应不存在的带有 HTTP 错误代码(例如 404 或 500)的主机名。
5.404 错误
一般情况下,当百度蜘蛛访问一个不存在的网页时(因为您删除或重命名了网页并且没有将旧网址重定向到新网页,或者链接中存在拼写错误),“未找到”状态会出现Errors(通常是404 HTTP状态码),404错误也会导致爬取失败。
6.访问被拒绝
一般情况下,百度会通过网页之间的链接来查找内容。百度蜘蛛必须能够访问某个网页才能抓取该网页。如果您不小心看到“拒绝访问”错误,可能是由于以下原因:
(1)百度蜘蛛无法访问您网站上的网址,因为您网站上的全部或部分内容需要用户登录才能查看。
(2)您的服务器要求用户使用代理进行身份验证,或者您的托管服务提供商阻止百度蜘蛛访问您的网站。
总结:
百度站长工具抓取诊断失败的原因有很多。以上笔者分析了一些常见的,提供给大家参考。您需要将它们一一排除以找出原因。