网站内容抓取(禁止搜索引擎抓取和收录,有什么效果?抓取效果)
优采云 发布时间: 2021-09-03 22:24网站内容抓取(禁止搜索引擎抓取和收录,有什么效果?抓取效果)
大家做seo都是千方百计让搜索引擎爬取收录,但是很多时候我们也需要禁止搜索引擎爬取收录,比如公司内部测试的网站,或者内部互联网,或者后端登录页面,绝对不想被外人搜索到,所以应该禁止搜索引擎抓取。
禁止搜索引擎抓取后会有什么影响?给你发个禁止搜索引擎爬取的搜索结果截图网站:可以看到,描述没有被爬取,但是有一句话提示:因为网站的robots.txt文件有限制指令(限制搜索引擎抓取),系统无法提供页面内容描述
所以对搜索引擎收录的禁令实际上是由robots.txt文件控制的。百度官方对robots.txt的解释是这样的:Robots是网站与蜘蛛交流的重要渠道,网站通过robots文件声明这个网站。 @中收录部分不想被搜索或指定搜索引擎只搜索收录特定部分。
9月11日,百度搜索机器人升级。升级后robots会优化网站视频URL收录的抓包。仅当您的网站 收录不想被视频搜索引擎收录 搜索的人时,您只需要使用robots.txt 文件查找内容。如果您想要搜索引擎收录网站上的所有内容,请不要创建robots.txt文件。
如果你的网站没有设置robots协议,百度搜索网站视频URL的收录会收录视频播放页面的URL,以及页面上的视频文件,周围的文字视频和其他信息。搜索网站收录的短视频资源将作为视频极速体验页面呈现给用户。另外,综艺长视频搜索引擎只有收录page URL。