百度搜索引擎优化原理(学习搜索引擎优化,搜索引擎的工作原理是必须要了解的)

优采云 发布时间: 2021-10-24 15:07

  百度搜索引擎优化原理(学习搜索引擎优化,搜索引擎的工作原理是必须要了解的)

  学习搜索引擎优化,有必要了解搜索引擎的工作原理。今天我们就来聊聊百度搜索引擎的工作原理。了解了搜索引擎的工作原理后,会涉及到收录的一些问题,那么网站与收录有什么关系呢?

  我们先来了解一下什么是搜索引擎蜘蛛?搜索引擎蜘蛛是抓取信息的程序。各大搜索引擎对应的蜘蛛不一样。

  百度蜘蛛:百度蜘蛛

  谷歌蜘蛛:Googlebot

  360蜘蛛:360蜘蛛

  搜狗蜘蛛:搜狗新闻蜘蛛

  ...

  

  一、搜索引擎工作流程

  1、 Crawl:沿着链接爬行,抓取页面信息。

  蜘蛛沿着链接爬行,然后爬行,在深度和广度上爬行。泛抓取:对首页、栏目页、栏目页中的标签进行抓取,一一抓取。深度爬取:首页、栏目页、栏目页分页、栏目页)蜘蛛沿着链接爬行。

  2、过滤:对内容质量不好进行过滤,如:采集内容、不正确的内容、不丰富的内容。如果一些质量好的内容延迟收录,那是因为它需要一个周期,经过一段时间后,就会成为收录。

  3、存储索引库:提取、整理质量信息,构建索引库。

  4、Show:将内容存放在临时索引库中。经过一些算法排序,当用户搜索到某个关键词时,搜索者会根据用户输入的查询关键字,在索引库中快速检测,给出有价值的内容展示。

  二、网站没有出现收录的原因

  1、 是否允许蜘蛛爬行。首先要看是否有蜘蛛来找你网站爬取,然后再分析其他原因。Robots 文件中禁止使用蜘蛛,蜘蛛不会来爬行。

  2、 需要一个周期。好的内容放在临时索引库中,通过一些算法进行排序。如果一些优质的内容延迟收录,那也是因为它也需要一个周期。

  3、内容质量不好。过滤时直接过滤。

  4、 如果蜘蛛不能识别那个东西,那么蜘蛛会直接过滤它。无法识别的蜘蛛有哪些?

  (1)js蜘蛛无法识别,建议只用一两个地方。

  (2)图片上的内容人眼可以识别,蜘蛛不能识别,需要加alt属性。

  (3)Flash,以视频为例。需要在视频上下文中说明这段视频的主要内容。

  (4)iframe 框架。有很多层次。

  (5)嵌套表。

  5、需要登录的信息页面,蜘蛛无法进入此类页面。

  三、备注

  1、有收录的内容,不要改变文章的全部内容,尤其是标题,不要动,不要删除,否则会形成死链接。

  2、 显示结果需要一定的时间(2个月内是正常的)。网站一周还没上线收录,这需要一个循环时间。

  3、 内容的丰富性。文字、图片、视频等。

  4、吸引蜘蛛。主动提交到搜索引擎(重复提交),链接。主动。

  5、蜘蛛跟踪,网站IIS日志。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线