网站内容复制(微信公众号今天下午复制内容的原因及解决办法(组图))

优采云 发布时间: 2021-12-31 23:13

  网站内容复制(微信公众号今天下午复制内容的原因及解决办法(组图))

  备注:原创内容已更新2周。微信公众号今天下午通过了原创的功能。收获还不错。感谢您的关注和支持。

  复制内容也可以称为重复内容。重复内容意味着两个或多个 URL 具有相同或非常相似的内容。复制内容可能发生在同一个 网站 或不同的 网站。

  1、复制内容的原因

  以下原因可能导致内容被复制。前面讨论的 URL 标准化问题会产生重复的内容。

  代理商和零售商从产品制造商处转载产品信息。这没有任何问题,大多数制造商都同意不存在版权问题。但是,大多数代理商、零售商和批发商直接复制而不做任何更改。每个人都使用完全相同的产品描述,因此这些电子商务网站充斥着大量复制内容。

  印刷版。很多网站除了提供普通的浏览页面外,还提供了更适合打印的页面版本。如果没有正确禁止爬行,这些网页的印刷版本将成为复制内容。 网站 结构导致的各种页面版本。例如,商品列表按价格、评论、发售时间等排序,以及博客分类存档、时间存档等。

  Web 内容由 RSS 生成。有很多网站,尤其是新闻网站,使用其他网站 RSS feeds 生成网站内容,在原创来源和很多其他类似的网站上面出现过很多次了。

  使用会话 ID。当搜索引擎蜘蛛在不同时间访问网页时,它们被赋予不同的会话 ID。事实上,网页的内容是一样的。由于Session 1D的参数不同,它们被视为不同的网页。

  页面内容太少。每个网页都难免有共同的部分,如导航栏、版权声明、广告等。如果网页的正文部分太短,内容量与一般部分不符,则可能被视为抄袭内容页面。

  转载和抄袭。有时是别人抄袭你的网站内容,有时是善意转载,有时是作者自己将文章发布在不同的网站,这些都会造成内容的抄袭。

  镜像网站。 Mirror 网站 曾经非常流行。当网站太忙太慢时,用户可以通过备用镜像查看或下载内容,也存在复制内容的风险。

  产品或服务类型之间的差异相对较小。比如有的网站把自己的服务按地区分类,但实际上每个地区提供的产品或服务都是一样的。这些按地区分类的页面只是改变了地名,其他服务的描述都是一样的。

  向 URL 添加任何字符仍会返回 200 状态代码。部分网站由于技术原因,用户在URL后添加任意字符或参数,服务器可以正常返回200状态码,返回相同的重复内容页面,不带任何字符。

  检查页面是否有副本相对简单。取出页面正文中的一句话,加双引号,在搜索引擎中搜索。从结果中可以看出是否有多个页面收录这句话。一般来说,一个随机选择的句子不太可能完全出现在另一个不相关的文章中。

  

  2、复制内容的危害

  很多SEO对抄袭内容​​有误解,认为如果网站上有抄袭内容,搜索引擎会惩罚他们。事实上,搜索引擎不会因为复制少量网站而惩罚或降权。搜索引擎所做的只是尝试从多个页面中选择真实的原创版本进行适当的排名,而其他复制的版本不会在搜索结果中返回或排名较低。

  但是,由于是留给搜索引擎来判断,可能会判断错误,将原本原创的页面视为转载或抄袭复制内容,所以排名不好这确实是对原创页面的惩罚,但不是因为内容本身的复制,而是因为搜索引擎没有判断原创。

  同一个网站的复制内容好像没那么严重。不管搜索引擎判断的是哪个版本原创,都是自己的页面网站。问题在于,搜索引擎考虑的最合适的 URL 可能与 SEO 站长考虑的最合适的 URL 不同。 SEO站长在优化和链接时关注页面A,但搜索引擎认为页面B是最好的。 (A的内容和B的内容一样),SEO站长在A页面下了不少功夫。

  在同一网站内复制内容会分散权重。由于页面出现在网站 上,因此必须有到这些页面的链接。如果一段独特的内容只出现在一个网址上,可以将网站上的链接集中在这个网址上,从而提高其排名能力。链接分散到多个网址,这样会使每个网址的排名能力不那么突出。外链也是一样,很可能会分散到不同的网址。

  同站抄袭也造成了收录太多无意义的页面。在域名权重较低的情况下,可能会挤出其他独特的内容收录机会。如果网站上存在大量抄袭内容,可能会导致搜索引擎怀疑网站的质量而受到处罚。

  

  3、消除重复内容

  URL 规范化导致的复制内容上面已经讨论过了。最好的解决办法是保证一篇文章文章只对应一个URL,不应该有多个版本,网站的所有内部链接都统一到这个URL。有时您需要使用 301 重定向。

  在同一个网站上复制内容不是由于网址标准化造成的。最好的解决办法是选择允许收录的版本,其他版本禁止搜索引擎爬取或收录。您可以使用 robots 文件禁止抓取,也可以使用 noindex 元机器人标签禁止索引。连翔不希望收录的链接使用nofollow标签、JavaScript等防止蜘蛛爬行。

  复制内容的另一种解决方案是使用规范标签。 canonical标签可以用于URL规范化导致的复制内容,也可以用于其他情况。比如网站上同款的鞋子可能会分不同的型号,型号之间唯一的区别就是颜色。这些模型生成多个URL,产品描述几乎相同,只是颜色不同。这时候可以使用canonical标签,用户不会被重定向,也不会看到不同的页面,但是搜索引擎会将权重集中在其中一个模型上,避免复制内容。

  带有Session ID的页面也可以使用规范标签,如页面:放置代码:

  这样,不管后面生成什么Session ID:

  以上网址会被搜索引擎加权:

  在不同的网站之间复制内容比较麻烦,因为其他网站上的内容是无法控制的。只有两件事可以做。一种是在页面添加版权声明,需要转载的网站保留版权声明和原文链接。一些联合网站 会抓取提要并自动生成内容,因此还应在提要中添加版权声明和链接。

  一般来说,原创版本的外链会比转载的多。即使在版权极其微不足道的中国互联网环境下,部分站长在转载时也会保留原出处链接。对于搜索引擎来说,原创来源的链接是判断原创的最重要信号。

  另外一点就是坚持原创。随着时间的推移,肯定会增加网站的权重,增加网站上的内容被判断为原创的几率。如果有其他网站的大量抄袭,且原创的内容无法排名,您也可以考虑联系对方索取版权链接或者删除抄袭内容,或者投诉向对方的主机或域名提供商,以及搜索引擎投诉等

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线