网页中flash数据抓取(齐鲁人才网检测发现百度新增工具:搜索引擎友好程度校验工具)
优采云 发布时间: 2022-03-31 12:09网页中flash数据抓取(齐鲁人才网检测发现百度新增工具:搜索引擎友好程度校验工具)
今天下午登录百度站长平台()时,发现百度在XML数据格式实例按钮左侧新增了一个工具:搜索引擎友好度验证工具。帮助搜索引擎更好、更高效地抓取您的 网站。该工具可以帮助您检测网页是否对搜索引擎足够友好。笔者满怀希望地去测试自己负责的齐鲁人才网,看看能不能从结果中得到一些优化建议。以下是测试结果截图:
从上图中的信息可以看出,百度列出了6个项目,
1、 URL 的长度放在首位,明确表示 URL 的最长长度不超过 255 个字节。
2、 静态页面参数,在静态页面上使用动态参数会导致爬虫重复爬取,增加爬虫的工作量。
3、元信息完整性检测,说明缺少关键词和描述可能会对网页的展示和排序产生一定的影响,提示站长对这两个标签的优化还是不能放松的。
4、图片的Alt信息检测,表示添加该属性可以方便用户检测。意味着图片的alt属性可以作为参数之一来匹配用户的搜索关键词,所以站长也要合理设计图片的alt属性来引导用户到达。
5、 框架信息检测,明确指出框架标签会让蜘蛛难以爬取,所以站长尽量不要使用这个标签。
6、 Flash 文本置信度检测:添加对 Flash 文件的描述可以让蜘蛛理解网页的内容。我们一直很清楚,flash 对搜索引擎并不友好。现在看来,百度也在合理调整方向。对于flash文件,只要合理添加文字说明,百度就会识别。
笔者查看了网页的html代码,为工具检测发现的两个问题。确实有文章中提到的不足,看来还需要优化。从给出的测试项目来看,虽然不多,但是很实用,确实可以帮助站长优化和调整网页的html代码。
搜索引擎友好度验证工具的推出,显示了百度对网站优化工作的逐步认可。自百度去年发布搜索引擎优化指南以来,可以看出百度对优化工作的态度正在发生变化。当然,优化指南的推出也是为了提高搜索引擎蜘蛛的工作效率。站长们已经按照这些说明进行操作,自然会省钱。蜘蛛的工作量提高了效率。总而言之,百度推出了搜索引擎友好度检查工具,这对站长来说是个好消息。