搜索引擎优化原理(搜索引擎工作原理的前两项:用户搜索关键词的处理方法)
优采云 发布时间: 2022-02-15 06:18搜索引擎优化原理(搜索引擎工作原理的前两项:用户搜索关键词的处理方法)
摘要:经过搜索引擎工作原理的前两项:蜘蛛爬取和爬取和预处理。基本上,用户可以直接在搜索引擎上搜索关键词。当用户搜索关键词时,搜索引擎进程的排名程序会调用索引数据库数据来计算排名。这样就可以将用户搜索到的与关键词相关的页面内容呈现在客户面前。这种页面内容非常庞大,搜索引擎需要在不到一秒的时间内完成对索引数据库数据的检索和排序。工作。
当用户在搜索框中搜索 关键词 时。
搜索引擎会首先处理用户搜索到的关键词。上一篇《搜索引擎的工作原理——预处理》中提到,需要对关键词进行中文分词。其分词原理与搜索引擎相同。预处理器是一样的。两者都将用户输入的短语转换为基于单词的 关键词 组合。然后,去除用户搜索过的关键词中的停用词,提高对用户意图的预判和关键词排名的相关性。剩下的处理就好比拼写错误的更正,搜索会触发用户搜索关键词,比如搜索苹果很可能会触发苹果手机的图片。
然后根据搜索引擎程序处理的关键词集合,找到对应的匹配文件。可以匹配的文件很多,因为搜索引擎需要在不到一秒的时间内处理完排名过程,而且由于用户只会看前几页,所以搜索引擎没有必要对所有的文件进行排名。页。排名是根据相关性计算的。只需要计算其中重要的一小部分。一般情况下,搜索引擎需要计算的搜索结果不超过1000条,即搜索页下方显示的页数一般不超过100页,每页以10页内容为准。在这里,搜索引擎需要从用户搜索到的与关键词相关的文件中找出前1000个,并对其进行排序。这时候就需要考虑页面权重了。通常会根据相关性选择大量文件,然后根据页面权重选择前千名并进行排名。
这基本上完成了搜索引擎从用户搜索关键词到确定关键词集合再到索引数据库数据调用,然后选择相关文件并根据页面权重排序。整个过程是搜索引擎如何工作的排名。
其中,SEO人员非常感兴趣的是搜索引擎程序对关键词组文件的相关性的计算。因为蜘蛛的爬取和爬取将页面内容存储在数据库中,所以预处理就是根据关键词和文件之间结构的索引来构造索引数据库数据。最后一步是根据用户的搜索关键词整合排名。这个排名的高低直接决定了我们网站的成败。
可能影响相关性的重要原因是:
关键词的共同频率,因为中文分词后形成的多个关键词对用户搜索有不同的关键词贡献。也就是说,当用户搜索收录关键词的词组时,我们在中文分词后形成了多个不同常用频率的关键词,而常用频率高的关键词具有低的常用频率。贡献。关键词 越小,对搜索到的关键词 意义的贡献就越高。例如,让我们搜索“我的太阳”。这里可以拆解成:“me”、“sun”、“my sun”和其他几个关键词组。其中,“me”和“sun”属于关键词高频,“my sun”属于关键词低频。一般来说,《我的太阳》是男高音帕瓦罗蒂的代表。因此,小众关键词越详细,搜索引擎了解用户意图的意义就越大。因此,搜索引擎会更加重视低频关键词。因为显示的结果应该对用户尽可能有用。
从搜索引擎的工作原理——关键词排名,我们可以看出为什么SEO强调核心关键词、关键词和长尾关键词的重要性。