百度seo搜索引擎优化指南(采集知名小说网站的盗版小说页。实例参考:示例内容质量说明)

优采云 发布时间: 2021-12-25 18:21

  百度seo搜索引擎优化指南(采集知名小说网站的盗版小说页。实例参考:示例内容质量说明)

  • 从知名小说网站采集

盗版小说页面。

  示例参考:

  例子

  内容质量

  操作说明

  案例3.1.2-1

  中间

  网易直接转载了中国新闻的一条新闻。

  案例3.1.2-2

  中间

  网友上传图书馆“国庆放假安排”消息

  案例3.1.2-3

  中间

  采集

起点小说网盗版小说网站

  案例3.1.2-4

  中间

  *敏*感*词*的一个普通帖子

  3、内容质量差:

  百度搜索引擎认为主要内容的内容是信息较少,或没有有效信息,或信息无效并已过期。它是一个内容质量较差的网页,对用户没有任何实质性帮助,应减少其显示的机会。同时,如果此类页面在一个网站中所占比例过大,也会影响百度搜索引擎对该网站的评分。尤其是UGC网站、电子商务网站、黄页网站,要特别注意对过期和无效页面的管理。例如:

  • 已下架的产品页面,或已过期的团购页面;

  • 已过期的招聘和交易页面;

  • 资源已过期,如视频被删除、软件下载后无法使用等。

  4、 没有内容质量可言:

  完全没有内容质量的网页,就是制作成本低,以次充好;从其他地方采集

的内容无需编辑即可在线放置;挂木马等病毒;含有作弊行为或意图;完全无法满足用户需求,甚至是带有欺骗性内容的网页。例如:

  • 内容短,内容少,但不能支持页面的主要意图;

  • 问答页面有问题且无答案,或答案根本无法解决问题;

  • 站点搜索结果页面,但未提供相关信息

  除了上述网页之外,欺骗用户和搜索引擎的网页在完全没有内容质量的集合中占了很高的比例。百度搜索引擎对作弊网页的定义是:不满足用户需求的网页,通过不正当手段欺骗用户和搜索引擎牟利。目前,这部分网页在互联网上的数量还很少,但作弊网页的价值是负的,对用户的危害很大。搜索引擎对此类网页采取坚决打击的态度。

  衡量网页质量-浏览体验的维度

  不同质量的网页浏览体验会有很大的差距。一个高质量的网页应该给用户一个积极的浏览体验。用户希望看到干净且易于阅读的网页。混乱的版式和过多的广告会影响用户对网页主要内容的访问。在百度搜索引擎网页质量体系中,用户对网页主要内容的获取成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相近的网页,浏览体验更好的网页更有可能获得更高的排名。对于浏览体验较差的网页,

  影响用户浏览体验质量的因素有很多。目前,百度搜索引擎主要从内容布局和广告影响力两个方面考虑网页:

  内容布局:用户进入网页时首先看到的是内容布局。布局决定了用户对网页的第一印象,也决定了用户获取内容的成本。

  广告影响力:百度搜索引擎明白网站的生存和发展需要资金支持,支持在网页上投放合法广告。网页应以满足用户需求为主要目的,最好的状态是“主要内容和广告共同满足用户需求,内容为主,广告为辅”,广告应不是网页的主体。

  举个例子来体验一下百度搜索引擎是如何对网页浏览体验进行分类的,站长可以以此为基础对比测试自己网站的浏览体验:

  1、良好的浏览体验:

  页面布局合理,用户获取主要内容的成本低。一般来说,它具有以下特点:

  • 布局合理,布局美观,易于阅读和浏览;

  • 用户需要的内容占据网页最重要的位置;

  • 可以通过页面标签或页面布局清楚地区分哪些是广告;

  • 广告不抢占主要内容位置,不妨碍用户获取主要内容;

  示例参考:

  例子

  浏览体验

  操作说明

  案例3.2.1-1

  好的

  招聘和房地产网站首页也有很多广告,但都是和招聘相关的,浏览体验还可以。

  案例3.2.1-2

  好的

  文章页面,页面布局合理,无广告,布局好,结构合理

  案例3.2.1-3

  好的

  游戏首页,布局精美,布局合理,无广告,浏览体验极佳

  2、糟糕的浏览体验:

  页面布局和广告投放影响用户对主要内容的访问,增加用户获取信息的成本,让用户反感。包括但不限于以下情况:

  • 正文内容不换行、不拆分,用户阅读困难;

  • 字体和背景颜色相似,内容难以区分;

  • 页面布局不合理,网页首屏看不到有价值的主要内容;

  •广告掩盖了主要内容;或者一般分辨率下,首屏全是广告,看不到主要内容;

  • 弹出广告太多;

  • 太多影响阅读的浮动广告

  • 单击链接时,会出现意外的弹出窗口;

  • 广告和内容混淆,难以区分;

  衡量网页质量-可访问性的维度

  用户希望从搜索引擎中快速获取他们需要的信息。百度搜索引擎为用户提供了一次可以直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取主要内容的网页对用户不友好,会根据情况调整显示概率。

  百度搜索引擎会从正常打开、权限限制、有效性三个方面来判断网页的可访问性。对于可以正常访问的网页,可以参与正常排名;有权限限制的网页,通过其他维度观察;对于无效的网页,其呈现机制将被降低甚至从数据库中删除。

  1、一个可以正常访问的网页

  没有权限限制,您可以直接访问所有主要内容网页。

  2、 权限受限的网页

  此类网页有两种类型:打开权限和资源访问权限

  1)打开权限:表示所有网页都需要登录权限。未经许可,您根本看不到具体内容。普通用户无法获取或获取成本高。百度搜索引擎会降低其显示概率。不包括以登录为主要功能的网页。

  2) 资源获取权限:指获取网页的主要内容,如文档、软件、视频等,需要权限或需要安装插件才能获取完整内容。这时候会出现三种情况:

  • 对于提供优质、正版内容的网站,由于内容建设成本高,虽然查看全文或下载需要许可或安装插件,但在用户的预期之内。百度搜索引擎不认为许可行为会对用户造成伤害。通常可访问的页面被同等对待。

  • 对于一些非优质、非正版的资源,来自用户转载甚至机器采集

,成本低,内容不唯一。用户访问资源也有限制——用户需要注册登录或付费查看,百度搜索引擎会根据具体情况决定是否调整显示。

  • 还有一些视频和下载资源页面。或许自己的资源质量还不错,但是需要安装一个非常冷门的插件才能正常访问。例如,当需要安装“xx大片播放器”时,百度搜索引擎就会怀疑其存在恶意倾向。

  示例参考:

  例子

  无障碍

  操作说明

  案例3.2-1

  好的

  CNKI上的一篇论文可以付费下载,但是有版权,浏览体验不错

  案例3.2-2

  好的

  优酷看新电影需要付费,浏览体验不错。

  案例3.2-3

  中间

  内容已复制,但需要登录才能查看更多

  案例3.2-4

  不同之处

  入党申请表本身是转载的,网上到处都是,但是这个页面还是需要付费下载。

  3、无效网页

  它通常指具有死链接和主要资源故障的网页。百度搜索引擎认为这些页面无法提供有价值的信息。如果网站上此类页面过多,也会影响其被百度搜索引擎收录和评分。建议站长设置此类网页,及时登录百度站长平台,并使用死链提交工具通知百度搜索引擎。

  无效网页包括但不限于:

  •404、403、503等网页;

  • 程序代码错误网页;

  • 打开后提示内容被删除,或内容已不存在而跳转到首页的页面;

  • 收录

已删除内容的论坛帖子、已删除的视频页面(主要出现在 UGC 网站上)

  Internet Web资源现状

  CNNIC于2014年初发布的《中国互联网发展状况统计报告》称,截至2013年12月,中国网页数据为1500亿,较2012年同期增长22.2% . 2013年中国单个网站的平均页数和平均字节数保持增长,说明中国互联网内容更加丰富:网站平均页数达到4.@ >690,000,与去年同期相比增长2.3%。

  为了保证搜索质量,提高用户满意度,百度搜索引擎每周都会对网页质量进行抽样评估。但是,从过去一年的评测数据中,我们发现优质网页的绝对数量非常少,几乎没有增加;普通网页的比例在下降,相应地,低质量网页的比例显着增加。截至2014年5月,统计数据显示,在百度搜索发现的海量网页中,优质网页仅占7.4%,劣质网页占21%,其余普通网页占7个。 1.6%。

  

  通过一系列的筛选、识别、分析、赋能,百度搜索力求将更多优质的网页呈现给用户。它每天访问数以万计的劣质网站,涉及数百万个网页,并最大限度地减少劣质网站。网页对用户造成的干扰。从2014年5月的网页展示分析数据来看,下图显示在当前展示在用户面前的网页质量分布中,优质网页的占比为40%,劣质网页的占比降至11% ——虽然这个变化已经很明显了,但百度网搜索还是希望能和广大站长一起,把质量差的比例降到更低。

  互联网的所有页面

  百度搜索中显示的网页

  优质网页

  7.4%

  41%

  普通网页

  71.6%

  49%

  质量差的页面

  21%

  11%

  上述低质量网页包括两部分:低质量网页和垃圾网页。低质量网页问题分布如下图所示:

  从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。

  除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:

  

  从上图我们可以看出,低质量网页中最严重的问题是广告过多导致浏览体验不佳,占据网页主要位置,以及意外弹窗、短内容、需要权限的网页获取资源并过期。信息也是低质量网页的重要组成部分。

  除低质量网页外,没有质量垃圾页面的低质量网页问题分布如下图所示:

  

  死链接对用户、网站和搜索引擎没有任何意义,垃圾网页的比例最大。其次,对用户和搜索引擎造成极大伤害的作弊网页。无效的资源、未回答的问题和不相关的搜索结果页面都是浪费用户时间的网页。搜索引擎不希望呈现给用户。

  百度搜索引擎给站长的建议

  以上介绍了百度搜索引擎判断网页质量的标准。对应这些标准,站长在实际工作中应该遵循几个原则:

  • 设计网页时主要考虑的是用户,而不是搜索引擎

  • 始终将用户体验放在首位

  • 根据用户需求制作内容

  • 考虑如何让您的网站独一无二

  • 着眼长远,过度广告弊大于利

  •及时删除低质量内容

  • 不要试图以任何方式欺骗用户和搜索引擎

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线