网站内容抓取(蜘蛛池出租那禁止搜索引擎抓取后会有什么效果呢?)
优采云 发布时间: 2021-12-17 11:04网站内容抓取(蜘蛛池出租那禁止搜索引擎抓取后会有什么效果呢?)
大家做seo都是想尽一切办法让搜索引擎爬取收录,但很多时候我们也需要禁止搜索引擎爬取收录
比如公司内测网站,或者内网,或者后台登录页面,肯定不想被外人搜索到,所以一定要禁止搜索引擎爬取。蜘蛛池出租
禁止搜索引擎抓取会有什么影响?
给你发一张禁止搜索引擎爬取的搜索结果截图网站:
可以看到,描述没有被抓取,但是有提示:由于网站的robots.txt文件有限制指令(限制搜索引擎抓取),系统无法提供内容的描述这一页
所以禁止搜索引擎收录其实是通过robots.txt文件控制的
百度官方对robots.txt的解释如下:
机器人是网站与蜘蛛交流的重要渠道。本站通过robots文件声明本网站中不想被搜索引擎收录或指定搜索引擎搜索到的部分仅为收录特定部分。
9月11日,百度搜索机器人升级。升级后robots会优化网站视频网址收录的抓取。只有当您的网站收录不想被视频搜索引擎收录搜索到的内容时,才需要使用robots.txt文件。如果您想要搜索引擎收录网站 上的所有内容,请不要创建robots.txt 文件。
如果你的网站没有设置robots协议,百度搜索网站视频地址的收录会收录视频播放页面地址、页面上的视频文件、周围的文字视频等信息,搜索已经收录的短视频资源,会以视频速度体验页面的形式呈现给用户。另外,综艺、影视等长视频,搜索引擎仅为收录页面URL。
从上面的话,我们可以得出两个结论:
1、robots.txt 不要这样做
2、网站在robots.txt中有不想让搜索引擎声明的内容收录