seo优化搜索引擎工作原理(SEO工作人员的工作原理是什么?初学者学习之用?)
优采云 发布时间: 2022-01-28 12:04seo优化搜索引擎工作原理(SEO工作人员的工作原理是什么?初学者学习之用?)
SEO知识的初步学习,网上的资源极其丰富,但常常让初学者看不懂,本文主要介绍搜索引擎的工作原理,供SEO初学者学习。
注意:本文适合SEO初学者拓展视野。如果你是资深的 SEO 工作者,则不必继续阅读。
搜索引擎的工作原理很复杂,但是作为SEO人员,我们基本上需要了解搜索引擎是如何显示页面排名的。
搜索引擎的工作原理大致可以分为以下三个阶段:
1、爬行和抓取。
搜索引擎通过网络中的链接跟踪访问网页,获取网页的HTML代码并存入数据库。
2、预处理。
索引程序对爬取的页面进行文本提取、单词提取和索引。
3、排名演示。
进入关键词后,排名程序调用索引数据库数据,计算相关性,生成结果展示页面。
一、爬取和抓取
为了爬取更多的页面,负责爬取的爬虫程序通过广度优先和深度优先的爬取策略将页面爬入数据库。对于这种形式,网站构造,网站优化时避免蜘蛛陷阱,让蜘蛛程序可以正常抓取网页。
二、预处理
爬取的网页在数据库中建立后,不能直接用于查询排名处理。因此,必须先进行预处理,而这个过程是在后台处理的。
有:
1、文本提取,
搜索引擎抓取页面中的HTML标签,预处理需要去除标签,程序
2、中文分词,
捕获的页面根据字典匹配或搜索量进行分段。
3、寻找停用词,
一些无用的助词(of、have、to)、感叹词等。
4、去除噪音,
5、删除重复项,
这就需要SEO人员在优化网站的时候要注意原创,否则会在去重这一步直接被刷掉。
6、正向索引,
7、倒排索引,
8、链接关系计算,
9、特殊文件处理
三、排名显示
1、搜索词处理
2、文件匹配
3、相关页面选择
4、相关性计算
5、排名过滤和调整
6、排名显示
7、搜索缓存
仅供初学者参考,有兴趣的可以关注新浪微博:电商商人王林