搜索引擎关键词分析流程及解决办法(一)

优采云 发布时间: 2021-07-27 02:03

  搜索引擎关键词分析流程及解决办法(一)

  在页面收录的处理过程中,搜索引擎已经爬取并存储了网站上的URL,然后搜索引擎会对爬取的页面内容进行分析,如图1所示。

  

  图一:页面分析流程

  在这个过程中,我们看到了两个“网页”:

  搜索引擎对页面的分析正式从原创页面开始。 1) 提取正文信息 这里提取的正文信息不仅收录页面的内容,还收录页面的header标签信息(Title、Keywords、Description)等。 2)Word Segmentation/Word Segmentation 提取信息后,搜索引擎根据机械分词法和统计分词法将文本信息分成多个关键词。这些关键词 构成了关键词 列表。

  我们在搜索引擎中搜索内容时,经常会输入关键词search。这里搜索引擎的工作就是将内容按照一定的规则划分成词,方便大家以后搜索。 3) 建立关键字索引搜索引擎在上一步已经将正文内容分成了多个关键词。这些关键词的位置和频率各不相同。这一步,搜索引擎会一一记录关键词,分类,索引,比如关键词的频率。

  一般来说关键词频率建议2%~8%比较合理。

  4)关键词 重新组织搜索引擎索引页面关键词后,重新组合这些关键词以关键词的形式重建一个新的网页,这个网页上的关键词是独一无二,完全没有重复。

  比如第三步,A关键词出现了3次。第四步,我们只记录了A关键词1次。重新整理网页后,A关键词没有重复。

  至此,搜索引擎已经完成了对页面的分析。在此链接中,搜索引擎从搜索引擎的角度完成了页面正文信息的提取、关键词切分、关键词索引、网页重组。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线