SEO优化:一下搜索引擎的工作原理是怎样的??
优采云 发布时间: 2021-08-27 03:07SEO优化:一下搜索引擎的工作原理是怎样的??
说到SEO优化,相信你已经学到了很多。如果你要问搜索引擎的工作原理,你可能不太了解。现在我们来谈谈关于搜索引擎的一些事情。
1 提取文本。
由于搜索引擎蜘蛛抓取网页的HTML代码,其中收录了大量无法用于排名的HTML标签、js等内容,所以搜索引擎索引的首要任务就是去除HTML标签和 js,并保留页面的其余部分。文字内容。
2 中文分词。
中文分词是中文搜索引擎独有的一步。英文单词之间用空格隔开,但中文单词之间没有分隔符,一个句子的单词是相互连接的。在中文搜索引擎中,首先要区分哪些词构成一个词,哪些词本身就是一个词。例如,“健身方法”可以分为“健康”和“方法”。
3停用词。
网页内容中会有很多对内容没有影响的词,如“这些”、“它”、“但是”、“啊”等。当被搜索引擎索引时,这些词会被删除,以使页面内容的主题更加突出。
4 去重(假原创为什么弊大于利)
在搜索结果中,搜索引擎会选择网页内容中出现频率最高的词,以减少重复内容,通常会选择大约10个关于网页的关键词来计算网页的“指纹”。
第五个指标
完成上述步骤后,搜索引擎可以提取出一些可以代表网页内容的关键词,并记录这些词在网页上的出现频率、出现次数、格式、位置等信息。
6 连接关系计算。
如果网页中有链接,搜索引擎会计算这些链接想要的页面,每个页面上有哪些导入链接,以及链接使用的锚文本。这些复杂的链接构成了网站和页面的权重。
这些连接关系也是百度计算权重的重要依据。至于百度的权重和链接分析,以后会有专门的文章@。
7 页的质量判断。
在这个阶段,搜索引擎会判断网页内容的质量和链接的质量,比如百度的“绿萝石榴”算法。