搜索引擎优化seo高手(详解搜索引擎优化网站的原理结构框架四部分结构结构)
优采云 发布时间: 2022-02-22 04:25搜索引擎优化seo高手(详解搜索引擎优化网站的原理结构框架四部分结构结构)
作为一名SEO,你可能知道优化网站的数百个步骤,熟悉HTML、PHP等语言,但你可能不知道搜索引擎的原理。以下是搜索引擎的工作原理:
搜索引擎原理结构框架分为四部分:爬取-过滤-存储索引库-展示排名
一、抢
搜索引擎发送蜘蛛来发现新的网页并爬取 Internet 上的文件。蜘蛛是可以在 网站 处爬行和爬行的程序。百度蜘蛛叫Baiduspider,360蜘蛛叫360Spider等等。
蜘蛛跟随网页中的超链接和外部链接,从这个网站爬到另一个网站,跟随网页中的链接,从网页中发现并访问更多的网页,在互联网上发现一个这些网页上的大量信息并从互联网上采集网页到自己的数据库中,这个过程称为爬取。在爬取过程中,搜索引擎蜘蛛一般有两种策略:深度爬取和广度爬取
不利于蜘蛛爬取和识别的内容?
1、网站使用js、flash、iframe框架(多层次)
2、马赛克表格,需要登录的页面不利于蜘蛛爬行,尽量避免。
3、图片太多,蜘蛛无法识别(使用alt属性辅助识别)
二、过滤
为避免重复爬取、爬取网址,造成过多垃圾,影响用户体验,搜索引擎在爬取后会通过各种算法过滤所有网页,过滤一些作弊的网站,或者网站@k11@ >,文字不是标题,对用户没有价值的内容进行降级,提取高质量的网站和信息展示
三、存储索引库
蜘蛛爬了多少页无所谓,关键是爬取的页面进入索引库,搜索引擎会提取和整理信息,建立索引库。搜索引擎的索引库是分层的,优质的网页会放在重要的索引库中,常用的页面放在普通库,其次是低级库,作为备份资料. 搜索只需要在存储索引数据库中查找。目前62%的重要库的内容基本满足搜索引擎的需求,所以有些网站收录高,但是没有流量。这是根本原因。收录 的页面不进入重要索引库。
四、印象排名
数据采集结束后,接下来要做的就是排名。当我们在搜索引擎中看到的只是一个结果,搜索引擎会根据信息的有效性和有价值的页面,原创属性和信息的识别,将其交给综合算法,网站@ >自重等综合算法。显示相应的排名,统计搜索用户的搜索量,最后根据用户的搜索习惯给出相应的结果。