seo优化搜索引擎工作原理(关于SEO优化的事情——搜索引擎的工作原理(一))
优采云 发布时间: 2021-12-13 14:15seo优化搜索引擎工作原理(关于SEO优化的事情——搜索引擎的工作原理(一))
老话说得好,产品经理要懂天文地理,人与人和谐,阴阳,懂八卦,懂奇门,懂遁甲,谋划战术,赢千里之外!今天我们来聊聊SEO优化——搜索引擎的工作原理。
什么是搜索引擎优化
搜索引擎优化,也称SEO,或Search Engine Optimization,是通过分析搜索引擎的排名规则,了解各种搜索引擎如何进行搜索,如何抓取网页,以及如何确定具体的关键词的一种方式对搜索结果进行排名的技术。搜索引擎采用易于搜索和引用的方式,有针对性地优化网站,提高网站在搜索引擎中的自然排名,吸引更多用户访问网站,提高网站的访问量,提高了网站的销售和宣传能力,从而提升了网站的品牌效应。
换句话说,当用户在搜索引擎(如百度)中搜索与您的网站内容相关的某个关键词时,SEO可以使您的网站排名更高,这可以是您的网站带来源源不断的流量,给你带来更多的用户。
搜索引擎的工作原理
搜索引擎的工作原理简单的分为三个部分,即爬取爬取、预处理、排序。
爬行和爬行:爬行和爬行是搜索引擎工具获取内容的基础。搜索引擎本身不产生内容。搜索引擎只不过是内容(自然)的搬运工。
预处理:就像我们整理文件一样,搜索引擎在获取大量内容后,必须对杂乱的内容进行预处理。
排名:按照一定的规则,对这么多有组织的内容进行排名。
爬行和爬行:
说到爬取爬取互联网内容,就不得不提蜘蛛(人)。
蜘蛛是搜索引擎用来抓取和访问页面的程序。就像现实世界的蜘蛛一样,它在互联网的这个大网上不断地爬行。当它爬到一个网站时,它会把网站记录@>的内容,这样搜索引擎就会收录下来,其他用户就可以通过这个网站搜索引擎。
搜索引擎收录网站内容的过程其实收录更复杂的逻辑,这里就不做任何推导了。另外,关于反爬,第一版master在爬取网站时会先访问根目录下的robots.txt。如果该文件禁止搜索引擎抓取某些文件或目录,蜘蛛将不会抓取。禁止 网站。
接下来我们将抓取网络爬虫策略:
广度优先遍历策略:广度优先策略是根据树的层次进行搜索。如果在这一层没有完成搜索,则不会进入下一层搜索。也就是说,先完成一级搜索,再进行下一级搜索。我们也可以将其理解为分层处理。换句话说,就是先遍历*敏*感*词*页的所有二级页。遍历二级页面后,遍历所有三级页面。
深度优先遍历策略:深度优先遍历策略是指网络爬虫会从它的起始页开始,逐个跟踪每一个链接,处理完这一行的链接后,切换到下一个起始页继续按照链接。也就是说,优先遍历*敏*感*词*页的某个二级页之后的所有分支。当蜘蛛爬到分支的最低端并且没有新的链接让蜘蛛继续爬行时,蜘蛛回到*敏*感*词*页面,爬到另一个二级页面分支下。如下所示:
除了这两种策略外,还有一些PageRank策略、OPIC策略、各大站点优先策略,这里就不推导了。
一般情况下,在实际的爬取过程中,爬取策略会根据不同的页面结构进行有机组合。