seo优化搜索引擎工作原理(简单的来说就是派出探测器,抓取网页系统,进行分析 )
优采云 发布时间: 2022-02-09 09:02seo优化搜索引擎工作原理(简单的来说就是派出探测器,抓取网页系统,进行分析
)
简单来说,搜索引擎发送检测器,爬取网络系统,分析它,然后将不合格的和存储在存储过程中。
符合条件的将被删除并选择,搜索引擎将向正在搜索的用户显示符合条件的用户。
搜索引擎的组成如下图所示
如图1所示:一个搜索引擎可以分为五个基本部分,即网页抓取系统、数据分析系统、数据存储系统、缓存系统和展示系统。
1、网页抓取系统:分为检测系统和下载系统。检测系统就是我们通常所说的蜘蛛。当蜘蛛在互联网上爬行时检测到一个网站 URL,它会将下载系统指向的页面的URL(标识网页定位)下载到搜索引擎的服务器上,然后页面交给数据分析系统。
2、数据分析系统:分为数据分析和数据处理两个系统。当数据分析系统从网页爬虫系统获取下载的页面时,首先进行数据分析,去除无关文本或网站重复内容,对页面文本进行处理,然后判断处理后的页面内容是否符合< @收录 标准,并移交给存储系统,但不删除。
<p>3、存储数据系统:保存