网页抓取数据百度百科(发现站长工具的死链工具填写数据的有效链接吧)
优采云 发布时间: 2021-11-10 14:15网页抓取数据百度百科(发现站长工具的死链工具填写数据的有效链接吧)
刚刚去百度站长平台研究了一下,发现站长工具填写数据的例子的死链接工具是“sitemap.txt和sitemap.xml。估计很多人对这两个词的第一反应是sitemap 网站Map,博客栏的sitemap.xml也提交了,然后我立马把新站的sitemap.xml提交给死链接工具,顺便更新了下里面的数据博客栏的死链接工具。。
突然有几个疑问。提交的 sitemap.xml 应该是一个有效的链接,对吗?又看到百度平台的提示了
如果提交死链数据,需要做以下操作才能成功从百度搜索结果中移除: 1、 提交的链接页面必须设置为404,以确保快速准确的删除死链数据
看来我懂了。我在百度上快速搜索“百度死链工具是否提供死链?”。结果震惊了。死链工具提交的不是sitemap.xml地图文件,而是网站的死链地址。我发现很多站长和我做了同样的事情。
百度“死链工具”的作用:主要是处理消除、删除或无效的网页链接。
更可悲的是,百度官方表示死链接文件的*敏*感*词*式与站点地图格式和*敏*感*词*式一致!
然后,当我提交sitemap.xml给百度时,我想自动告诉百度:我的网站的所有链接都是死链接,请帮我删除!虽然说提交死链接数据需要把提交的链接页面设置为404,但不保证百度会一时兴起把我的正常页面的数据当成死链接删除。或许,博客栏中的收录重置不是因为我网站有什么问题,而是因为我愚蠢地把站点地图提交和死链接工具弄不清楚了,虽然这不可能大。但是百度蜘蛛每天都来博客爬行,却依然不是博客恢复收录。