seo搜索引擎优化 深圳(建立索引库蜘蛛网页网页策略简单的工作原理概况)
优采云 发布时间: 2022-01-31 09:12seo搜索引擎优化 深圳(建立索引库蜘蛛网页网页策略简单的工作原理概况)
做SEO搜索引擎优化,当然要先了解搜索引擎的工作原理,不需要完全掌握,但概念性的东西一定要印在脑子里。至于不同的搜索引擎,其实是大同小异的,比如:百度、360、搜狗、google等都是大同小异的,没必要划分太多。
搜索引擎的组成
搜索引擎大致分为四个部分,分别是:引擎蜘蛛爬虫、数据分析系统、数据索引系统、查询系统。
搜索引擎工作原理的简单概述
搜索引擎蜘蛛发现连接→根据蜘蛛的抓取策略抓取网页→交给分析系统→分析网页→建立索引库
蜘蛛爬行策略
一、深度优先
什么是深度优先?简单来说,搜索引擎蜘蛛在一个页面上找到一个链接,然后沿着这个链接往下爬,然后在下一页找到一个链接,然后再往下爬,把所有的都爬过去。这是深度优先的爬取策略。下图是深度优先的*敏*感*词*,假设网页A在搜索引擎中的权限最高,网页D的权限最低,如果搜索引擎蜘蛛按照深度优先的策略,那么就会反过来,也就是D页的权限变成最高的,就是深度优先!
二、广度优先
宽度优先比较容易理解,即搜索引擎蜘蛛先爬取整个页面的所有链接,然后再爬取下一页的所有链接。下图是宽度优先的*敏*感*词*!这其实就是大家平时所指的扁平化结构。你可能会在一些网站中看到类似的文章文章,警告大家,网页的层数不能太多,如果太多了,就会导致收录,这是对付搜索引擎蜘蛛的广度优先策略,其实也是这个原因。
三、重量优先
如果说宽度优先优于深度优先,那也不是绝对的。只能说各有千秋。现在搜索引擎蜘蛛一般会同时使用两种抓取策略,即深度优先+宽度优先,而在使用这两种策略抓取的时候,应该参考这个连接的权重。如果这个连接的权重不错,那么使用深度优先,如果这个连接的权重很低,那么使用宽度优先!