搜索引擎优化行业排行(云无限网站优化公司给刚入行的新人做一下搜索引擎普及)

优采云 发布时间: 2021-12-17 15:35

  搜索引擎优化行业排行(云无限网站优化公司给刚入行的新人做一下搜索引擎普及)

  作为SEO行业从业人员,我们都知道SEO是基于搜索引擎来展示排名的。那么在这里,你有没有想过什么是搜索引擎?有人回复:我知道,百度、360、搜狗、搜狐、谷歌等都是搜索引擎。

  <IMG border=0 alt=seo src="/web/UploadFiles_1049/201706/2017061417564261.jpg" width=650 height=350>

  再补充一个问题:那么,我们的SEO排名在搜索引擎上的显示是按照什么原理来的呢?当然,这个问题大部分seoer都懂,但是今天云无羡网站优化公司给新人一个搜索引擎的基础知识。

  <IMG border=0 alt=搜索引擎 src="/web/UploadFiles_1049/201706/2017061417583537.jpg" width=420 height=340>

  关于SEO,网上众说纷纭,但是当我们不了解搜索引擎的时候,我们对SEO知识的吸收就显得那么模糊。就像孩子学跑一样,他不能站立也不能走路,所以他会跑。家长放心吗?现在让我谈谈什么是搜索引擎?

  搜索引擎是指按照一定的策略从互联网上采集信息,并使用特定的计算机程序,对信息进行组织和处理,为用户提供检索服务,并向用户展示与用户检索相关的相关信息的系统。

  搜索引擎的定义很短,但它收录的信息量还是很大的。从它的定义我们也可以看出,它首先在互联网上采集信息,然后组织检索并呈现给搜索客户。具体来说,它是如何工作的?

  第 1 步:爬网

  搜索引擎通过特定模式的软件跟踪到网页的链接,从一个链接爬到另一个链接,就像蜘蛛在蜘蛛网上爬行一样,因此被称为“蜘蛛”或“机器人”。

  搜索引擎蜘蛛的爬取是有一定的规则进入的,需要遵守一些命令或者文件的内容。

  <IMG border=0 alt=百度蜘蛛 src="/web/UploadFiles_1049/201706/2017061418010184.jpg" width=635 height=534>

  第 2 步:获取存储空间

  搜索引擎通过蜘蛛跟踪链接抓取网页,并将抓取到的数据存储在原创页面数据库中。页面数据与用户浏览器获取的 HTML 完全相同。

  搜索引擎蜘蛛在抓取页面时也会做一定量的重复内容检测。一旦遇到大量抄袭、采集或网站上权重极低的复制内容,他们很可能会停止爬行。

  第三步:预处理

  搜索引擎将在各个步骤中对蜘蛛检索到的页面进行预处理。

  1、提取文本:搜索引擎输入网站提取文本内容,但是停留的时间也是有限的,所以爬取的内容也是有限的。一般搜索引擎Z最先进入的页面是首页,所以我们在建站的时候会更加重视首页关键词的布局。

  2、中文分词:搜索引擎会自动切出提取的词,如“矿泉水厂家批发”,会自动切为矿泉水、矿泉水厂家、矿泉水批发。

  我们的优化器在做关键词布局和索引的时候,应该尽量让搜索引擎爬行,自动截取我们想要的词。

  3、 停用词:例如“、”、“得”等词,在网站中意义不大;

  4、 消除噪音:搜索引擎需要识别并消除这些噪音,例如版权声明文字、导航栏、广告等...

  5、前向索引:即一个URL对应一次关键词的访问;

  6、倒排索引:通过一个关键词来对应一个网站的访问;

  7、链接关系计算:通过网站权重、用户体验等对网站进行评分;

  8、特殊文件处理

  除了 HTML 文件,搜索引擎通常可以抓取和索引多种基于文本的文件类型,例如 PDF、Word、WPS、XLS、PPT、TXT 文件等。

  我们经常在搜索结果中看到这些文件类型。但是,搜索引擎无法处理图像、视频和 Flash 等非文本内容,也无法执行脚本和程序。

  <IMG border=0 alt=搜索引擎工作原理 src="/web/UploadFiles_1049/201706/2017061418020590.jpg" width=700 height=397>

  第 4 步:排名

  用户在搜索框中输入关键词后,排名程序调用索引库数据,计算排名并展示给用户。排名过程直接与用户进行交互(根据用户的搜索习惯、地理区域等,部分排名结果也可能不同。)。

  但是,由于搜索引擎的数据量巨大,虽然每天可以实现小幅更新,但搜索引擎的排名规则一般是按照日、周、月等不同级别进行更新。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线