seo优化搜索引擎工作原理(以一个给刚入行的新人做一下搜索引擎普及)
优采云 发布时间: 2022-01-16 00:00seo优化搜索引擎工作原理(以一个给刚入行的新人做一下搜索引擎普及)
作为SEO行业的从业人员,我们都知道SEO是基于搜索引擎来展示排名的。那么在这里,你有没有想过什么是搜索引擎?有人回复:我知道,百度、360、搜狗、搜狐、谷歌等都是搜索引擎。那么我们再补充一个问题:我们的SEO排名在搜索引擎上展示的原理是什么?当然,大多数seoer都明白这个问题,但今天我们为这个行业的新手普及搜索引擎的基础知识。
关于SEO,网上众说纷纭,但是当我们不懂搜索引擎的时候,我们对SEO知识的吸收就显得那么的模糊,就像小孩学跑一样,不能站也不能走路跑。父母会放心吗?现在让我谈谈什么是搜索引擎?
搜索引擎是指按照一定的策略从互联网上采集信息并使用特定的计算机程序,对信息进行组织和处理,为用户提供检索服务,并将用户检索到的相关信息展示给用户的系统。搜索引擎的定义很短,但它所收录的信息量还是很大的。从它的定义我们也可以看出,它先是在互联网上采集信息,然后组织检索出来,展示给搜索客户。具体来说,它是如何工作的?
第 1 步:爬行
搜索引擎通过特定的常规软件跟踪网页的链接,从一个链接爬到另一个链接,就像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”,也被称为“机器人”。搜索引擎蜘蛛的爬取是有一定规则的输入,需要遵循一些命令或文件的内容。
第 2 步:抓取存储
搜索引擎通过爬虫跟随链接爬到网页,并将爬取的数据存储到原创页面数据库中。页面数据与用户浏览器获取的 HTML 完全相同。搜索引擎蜘蛛在抓取页面时也会进行一定数量的重复内容检测。一旦他们在一个低权重的网站上遇到大量抄袭、采集或复制的内容,他们很可能会停止爬取。.
第 3 步:预处理
搜索引擎从蜘蛛爬回页面并执行各种预处理步骤。
1、提取文本:搜索引擎输入网站提取文本内容,但停留时间有限,所以要爬取的内容也有限。一般搜索引擎进入的第一页是首页,所以我们在建站的时候会更加注重首页的布局关键词
2、中文分词:搜索引擎会自动对提取出来的文字进行分词,如“矿泉水厂家批发”,会自动切入矿泉水、矿泉水厂家、矿泉水批发。我们的优化器在做关键词布局和索引的时候,应该尽量让搜索引擎爬取,自动剪掉我们想要的词。
3、去掉停用词:的、地、得等对网站意义不大的词;
4、去除噪音:搜索引擎需要识别和去除这些噪音,比如版权声明文字、导航栏、广告等...
5、Forward indexing:即通过一个URL来对应一个关键词的访问;
6、倒排索引:访问一个关键词对应的URL;
7、链接关系计算:得分网站通过网站权重、用户体验等;
8、特殊文件处理
除了 HTML 文件,搜索引擎通常可以抓取和索引各种基于文本的文件类型,例如 PDF、Word、WPS、XLS、PPT、TXT 文件等。我们还经常在搜索结果中看到这些文件类型。但搜索引擎无法处理图像、视频、Flash 等非文本内容,也无法执行脚本和程序。
第 4 步:排名
用户在搜索框中输入关键词后,排名程序调用索引数据库数据,计算排名并展示给用户,排名过程直接与用户交互(根据用户的搜索习惯,地区等,一些排名结果也可能不同。)。但是,由于搜索引擎的数据量巨大,虽然每天都能做到小幅更新,但总的来说,搜索引擎的排名规则每天、每周、每月都会进行不同级别的更新。
作为一名SEO从业者,只有了解搜索引擎,才能更好地为你的网站服务。希望这个文章可以帮助到你,感谢关注易七宝公众号:yiqibao168