seo搜索引擎优化 惠州(以一个给刚入行的新人做一下搜索引擎普及)
优采云 发布时间: 2021-11-25 12:08seo搜索引擎优化 惠州(以一个给刚入行的新人做一下搜索引擎普及)
作为SEO行业从业人员,我们都知道SEO是基于搜索引擎来展示排名的。那么在这里,你有没有想过什么是搜索引擎?有人回复:我知道,百度、360、搜狗、搜狐、谷歌等都是搜索引擎。再补充一个问题:那么,我们的SEO排名在搜索引擎上的显示是按照什么原理来的呢?当然,这个问题大部分seoer都懂,但是今天我们是新手做搜索引擎基础知识。
关于SEO,网上众说纷纭,但是当我们不了解搜索引擎的时候,我们对SEO知识的吸收就显得那么模糊。就像一个孩子学会跑步,他不能站立或走路,然后他跑了。家长放心吗?现在让我谈谈什么是搜索引擎?
搜索引擎是指按照一定的策略从互联网上采集信息,并使用特定的计算机程序,对信息进行组织和处理,为用户提供检索服务,并将与用户检索有关的相关信息显示给用户的系统。搜索引擎的定义很短,但它收录的信息量还是很大的。从它的定义我们也可以看出,它首先在互联网上采集信息,然后组织检索并呈现给搜索客户。具体来说,它是如何工作的?
第 1 步:爬网
搜索引擎通过特定的常规软件跟踪到网页的链接,从一个链接爬到另一个链接,就像蜘蛛在蜘蛛网上爬行一样,因此被称为“蜘蛛”或“机器人”。搜索引擎蜘蛛的爬行是有一定的规则进入的,需要遵循一些命令或者文件的内容。
第 2 步:获取存储空间
搜索引擎通过蜘蛛跟踪链接抓取网页,并将抓取到的数据存储在原创页面数据库中。页面数据与用户浏览器获取的 HTML 完全相同。搜索引擎蜘蛛在抓取页面时也会进行某些重复内容检测。一旦他们遇到大量抄袭、采集或网站上权重极低的复制内容,他们很可能会停止爬行。.
第三步:预处理
搜索引擎将在各个步骤中对蜘蛛检索到的页面进行预处理。
1、提取文本:搜索引擎输入网站提取文本内容,但停留的时间也是有限的,所以抓取的内容也是有限的。一般搜索引擎进入的第一个页面是首页,所以我们在建站的时候会更加注重首页的布局关键词
2、 中文分词:搜索引擎会自动切出提取的词,如“矿泉水厂家批发”,会自动切为矿泉水、矿泉水厂家、矿泉水批发。我们的优化器在做关键词布局和索引的时候,应该尽量让搜索引擎爬行,自动截取我们想要的词。
3、 停用词:例如“、”、“得”等词,在网站中意义不大;
4、 消除噪音:搜索引擎需要识别并消除这些噪音,例如版权声明文字、导航栏、广告等...
5、正向索引:即一个URL对应一次关键词的访问;
6、倒排索引:通过一个关键词来对应一个网站的访问;
7、链接关系计算:通过网站权重、用户体验等对网站进行评分;
8、特殊文件处理
除了 HTML 文件,搜索引擎通常可以抓取和索引多种基于文本的文件类型,例如 PDF、Word、WPS、XLS、PPT、TXT 文件等,我们经常在搜索结果中看到这些文件类型。但是,搜索引擎无法处理图像、视频和 Flash 等非文本内容,也无法执行脚本和程序。
第 4 步:排名
用户在搜索框中输入关键词后,排名程序调用索引库数据,计算排名,展示给用户。排名过程直接与用户进行交互(根据用户的搜索习惯、地理区域等,部分排名结果也可能不同。)。但是由于搜索引擎的数据量巨大,虽然可以做到每天小幅更新,但一般来说,搜索引擎的排名规则是按日、周、月分不同阶段更新的。