百度网页关键字抓取(html代码中的注释内容会在正文提取环节忽略?)
优采云 发布时间: 2021-09-15 15:15百度网页关键字抓取(html代码中的注释内容会在正文提取环节忽略?)
问:百度会在页面代码中抓取评论吗
问题补充:很多时候在编写页面模板时,我们习惯于添加一些注释代码,以便在后续修改中了解每个模块在更多方面的作用。但有一个问题,那就是百度会在页面代码中抓取评论吗?这些内容会降低页面的相关性吗
答:百度会抓取页面代码中的评论吗?让我们看看百度官方所说的:HTML代码中的注释内容在文本提取链接
中会被忽略。
通过百度的官方回答可以看出,百度蜘蛛会抓取页面代码中的注释内容,但在提取正文内容时会忽略它,也就是说,这些注释内容对页面的整体质量没有影响
在我看来,这个问题其实更容易理解。首先,我们应该相信百度搜索技术。已经解释了页面代码中的注释内容本身。这是注释内容!所以百度不会对这些内容感到厌烦。另外,普通用户并不关注这些内容,也就是说,被标注的内容对用户来说是没有意义的,所以百度不需要对它们进行分析
我们可以想象,如果百度抓取并分析这些页面代码中的注释内容,并将其与页面的主题内容进一步链接,我们可以通过注释内容欺骗SEO吗?显然,这是百度搜索不允许的!在那些年里,meta中的关键词内容非常重要。百度搜索在判断时给出了很高的权重,所以很多站长朋友都利用这个因素作弊。但随着百度搜索机制的完善,关键词的权重已经被完全抛弃。页面代码中的注释内容是否比关键字更重要?显然不是。因为百度搜索可以放弃关键词,所以没有理由分析评论代码
百度会抓取页面代码中的评论吗?答案是百度会抓取它,但在提取文本时会直接忽略它,也就是说,页面代码的注释内容不会影响页面质量,所以你可以放心
事实上,如果你仔细观察,你会发现百度搜索将扮演分析器的角色,或者对大多数朋友和用户看不到的内容给予较低的权重。这应该是百度搜索改进的最好地方。因为这些内容对用户来说毫无意义,百度的分析和计算将变得多余