【谷歌】我为什么不收录你的网站

优采云 发布时间: 2022-05-11 02:42

  【谷歌】我为什么不收录你的网站

  蜘蛛最先访问的是网站的首页,而网站里又包含了非常多的页面。以国际站平台为例,一个平台里上传了1000个产品,当从首页开始需要经过多次点击跳转才能访问到第200个产品的详情页,那么这个详情页无疑是离首页距离很遥远的,因为点击跳转的次数太多太繁琐,蜘蛛也是懒的去抓取的,尤其是新站权重不高的情况下。

  4、网站与页面权重

  网站是需要养的,需要经过一段时间去沉淀数据的,权重越高的网站,蜘蛛的抓取频率会比较高,对于新站来说,建议至少养3个月到半年的时间。

  第二步:页面的预处理筛选

  蜘蛛每天抓取的页面非常非常多,但这么多的页面谷歌不可能全部保存。谷歌会通过它的预处理也称索引机制,将蜘蛛所抓取到源代码数据中的核心关键词信息挑选出来。那么谷歌是怎么挑选呢?

  1、提取文字

  蜘蛛抓取的页面中包含很多源代码,预处理要做的事情首先是先把代码中的文字信息提取出来,包含Meta标签文字、图片替代文字、链接锚文字、正文。

  如图展示:

  

  2、去停止词

  在提取的文字信息中会包含很多例如the, a, an, to ,of的词,这些词就像我们中文的啊、哈、呀的感叹词,出现频率很高,但有没有都不会内容中的主要意思,这些词称为停止词,也会被过滤掉的。

  3、消除噪声

  在网站的页头、导航、正文、页脚中会存在大量的重复内容,在这些页面中几乎都会有相同的源代码,谷歌会把重复的内容去掉,只留下不重复部分。

  4、去重复页面

  我们在做B2B平台时,往往将一个产品覆盖很多关键词重复发布,几乎产品的详情页都是一样的。但这种方法并不适用谷歌,因为当用户在搜索浏览前几页内容时多次看到同样的内容,对用户的体验会很差,谷歌是不会对重复内容重复收录的。

  从这些过程中谷歌可以出判断你的网站质量是如何。

  第三步:谷歌排名的相关性计算

  在预处理环节,谷歌已经过滤很多不必要的信息,最后进行非常重要的环节—排名的相关性计算。没错,就是排名,但是排名的相关性计算绝不是凭单一因素就可以决定,它包含了很多重要的维度。根据多年的谷歌优化经验,总结出一下4点大家都认可的重要因素:

  1、频率越高,密度越高,相关性越高

  频率=关键词的出现次数,举个例子,谷歌提取出源代码的文字信息有100个,而关键词basketball sock在里面出现了10次,那么密度就是10%,理论上说关键词出现次数越高,密度越高,则页面相关性越高。

  但因为以前很多SEO人会利用谷歌这个漏洞去钻空子堆砌关键词,谷歌对这方面进行了一些列的算法升级,现在如果还这么做,是会被谷歌查出来惩罚降权的。

  一切都得要合理,不要过度滥用。

  2、关键词位置的重要性

  在网站的页面的源代码中包含了很多标签,有些标签代表小标题,有些代表图片...当关键词出现在某些标签位置时,关键词和页面的相关性会更高,这些位置往往会包含标题、黑体字体、HI、图片Alt等等。(这部分会在外贸官网站内优化视频详细讲解)

  3、锚文本关键词与链接内容越接近,相关性越高

  

  以上图为,例在这段博文中,有个蓝色字体关键词“athletic socks”是可以点击打开的,这个关键词athletic socks就是锚文本,当访客点击了这个关键词,则代表锚文本链接与关键词athletic socks是密切相关的。

  如果我们在外部网站如博客、论坛、社区平台,在相匹配的关键词锚文本中添加了我们的网站页面,这是对谷歌的页面相关性提升有很好的帮助的。

  4、页面权重越高,导入链接相关性越高

  如果你的网站链接能够出现在某一个权威性的网站,并且链接了与网站相关的锚文本关键词,那么你的页面的相关性会越高。

  通过谷歌搜索引起的收录原理,已经告诉我们很多重要信息,那么网站如何优化符合谷歌的喜欢呢?

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线