百度搜索引擎优化白皮书(从近网页资源现状及发展趋势分析(一))
优采云 发布时间: 2022-01-21 19:17百度搜索引擎优化白皮书(从近网页资源现状及发展趋势分析(一))
3、无效网页
常指网页的死链接和主要资源故障。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响百度搜索引擎的收录和评分。建议站长对此类网页进行相应设置,及时登录百度站长平台,使用死链接提交工具通知百度搜索引擎。
无效网页包括但不限于:
404、403、503等网页;
程序代码错误页面;
打开后提示内容被删除,或者因为内容不存在而跳转到首页的页面;
收录已删除内容、已删除视频页面的论坛帖子(主要在 UGC 网站上)
3 互联网网页资源现状
根据CNNIC 2014年初发布的《中国互联网发展状况统计报告》:截至2013年12月,中国网页数量为1500亿,同比增长22.2% 2012年同期。2013年,中国每网站的平均网页数和每网页平均字节数保持增长,表明中国互联网上的内容更加丰富:平均数网站的网页达到4.69万,比去年同期增加2.3%。
为保证搜索质量,提高用户满意度,百度搜索引擎每周都会进行网页质量抽样评估。但从过去一年的评价数据中,我们发现优质网页的绝对数量非常少,几乎没有增加;普通网页的比例在下降,相应地,劣质网页的比例显着增加。截至2014年5月,统计数据显示,在百度网络搜索发现的海量网页中,只有7.4%是优质网页,21%是劣质网页,7个1. 6%。
百度搜索通过一系列筛选、识别、分析、赋能等工作,力求将更多优质网页呈现给用户。每天,它与数以万计的劣质网站作斗争,涉及数百万个网页。可以减少用户对劣质网页的干扰。根据下图2014年5月网页呈现分析数据,当前呈现在用户面前的网页质量分布中,优质网页占比为40%,劣质网页占比降至11%。虽然这种变化已经非常明显,但百度网搜还是希望与广大站长一起努力,将劣质的比例降低到更低的水平。
上述低质量网页包括低质量网页和垃圾网页。低质量网页的分布如下图所示:
从上图我们可以看出,低质量网页中最严重的问题是广告过多、占据网页主要位置并超出预期弹窗导致的浏览体验不佳,内容为空而短,网页需要权限才能获取资源和过期。信息也是低质量网页的重要组成部分。
除低质量页面外,完全没有质量的垃圾页面问题分布如下图所示:
死链接对用户、网站 和搜索引擎没有任何意义,它们占垃圾邮件的比例最大。二是对用户和搜索引擎造成极大伤害的作弊网页。为用户浪费大量时间的网页,如无效资源、未回答的问题、不相关的搜索结果页面,并不是搜索引擎想要呈现给用户的。
百度搜索引擎给站长的4条建议
以上介绍了百度搜索引擎判断网页质量的标准。与这些标准相对应,站长在实际工作中应该遵循几个原则:
设计网页时要考虑用户,而不是搜索引擎
永远把用户体验放在第一位
根据用户需求创建内容
多思考如何让您的 网站 具有独特的价值
长远来看,滥发广告弊大于利
及时删除低质量内容
不要试图以任何方式欺骗用户和搜索引擎
下载《百度搜索引擎网页质量白皮书》完整版并移步百度文库
3