明月的小博客“攻击”不断,百度蜘蛛常见IP地址

优采云 发布时间: 2021-06-10 21:18

  明月的小博客“攻击”不断,百度蜘蛛常见IP地址

  总结:

  最近明月的小博客被连续“攻击”,大部分是扫描和SQL注入,甚至导致前两天“主机资源耗尽”被关闭,所以我认真分析了一下服务器。在日志中发现了很多可疑的IP,直接屏蔽了。没想到这些IP中有6-7个是百度蜘蛛的IP。我无语了。还好我通过“爬虫诊断”找到了,不然后果不敢想象!因为需要知道百度蜘蛛的常用IP,所以搜索了相关资料,得到了下面的IP排序。记录下来,知道的时候会用到。

  

  百度蜘蛛抓取是搜索引擎获取页面内容的重要方式。通过蜘蛛的爬取,可以获得一个页面最重要的内容。 收录百度DB系统,每次爬取然后与数据库中的原创信息进行对比,判断页面的整体质量。

  那么,每次有蜘蛛来爬取,都会记录在网站日志文件中,包括爬取时间、爬取的页面和蜘蛛来源的IP地址。上次我们讲了百度蜘蛛(Baiduspider)的ip来源,基本上可以反映不同蜘蛛对网站不同页面的偏好,也从侧面反映了整个网站不同页面的权重值。通过一系列的分析,可以更准确地评估整个站点的权重分布。 seo、文章内容价值、用户体验都起到很好的参考价值。

  百度蜘蛛常用IP地址

  注:以上IP的尾数很多,但123.125.71.*段IP代表内页收录的权重较低,可能是由于你采集文章或spell文章暂时收录但不会被释放。

  一般爬取成功返回码为200,返回304,表示网站没有更新。

  谷歌蜘蛛常用IP地址

  谷歌蜘蛛IP段分析

  360蜘蛛IP段

  360蜘蛛IP段分析

  搜狗蜘蛛常用IP段神马蜘蛛常用IP段163搜索引擎蜘蛛IP地址大全iask搜索引擎蜘蛛IP地址大全msn搜索引擎蜘蛛IP地址大全搜索蜘蛛IP地址新浪搜索引擎蜘蛛IP地址搜狐搜索引擎蜘蛛IP地址雅虎搜索引擎蜘蛛IP地址雅虎中国搜索引擎蜘蛛IP地址搜索蜘蛛搜索引擎蜘蛛IP地址

  好的,终于通过本文提供的IP,百度蜘蛛的IP被排除在屏蔽之外了。综上所述,“我真的对自己太残忍了”。看来还是要保留一些基础数据啊!就像这篇文章,采集起来,随时可以参考!封IP一定要慎重,容易误伤,这两天浏览器老是出现“403”错误,很可能跟封IP有关!我一定要去看看!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线