网站内容复制(复制网页(或者叫重复内容网页)(图))

优采云 发布时间: 2021-09-06 18:17

  网站内容复制(复制网页(或者叫重复内容网页)(图))

  重复网页(或重复内容网页)是指具有相同或非常相似内容的两个或多个网页。

  一般来说,搜索引擎不喜欢复制内容页面。他们会尝试确定哪个是原创版本,然后忽略其他复制的页面。

  有两点值得注意:

  1)复制网页的判断是没有比例的。例如,如果一个网页上60%或80%的内容与其他网页相同,则将其归类为重复网页。如果有比例,那就简单多了。

  2)复制网页不会带来处罚。搜索引擎会丢弃其他复制的页面,但不会惩罚搜索引擎认为的原创来源。

  然而,这可能会惩罚真正的原创来源。例如,搜索引擎出错,将原创来源视为副本,将复制的视为原创来源。

  复制内容页面的外观一般有以下几种可能:

  1) URL 标准化问题。

  代理商和零售商的2)网站 经常从产品制造商的网站 复制产品信息。这没有什么错,大多数产品制造商都同意,但大多数代理商,零售商和批发商都会直接复制而不做任何更改。所以这些电商网站充斥着大量复制内容的网页。

  3)printable 版本。许多网站 提供更多可打印的版本。如果不使用 robots.txt 文件,那么这些打印版本的网页可能会成为重复的网页。

  4)Web 内容由 RSS 生成。很多网站,尤其是新闻网站,利用其他网站的RSSfeeds生成网站内容,在原版和很多其他网站中都有出现。

  5)电子商务网站使用会话 ID。搜索引擎蜘蛛在不同时间访问网页时会被赋予不同的SessionID,但网页的内容实际上是相同的。但是由于Session ID的参数不同,被认为是不同的网页。

  6)页面内容太少。每个网页都不可避免地有共同的部分,例如导航栏、版权声明等。如果网页的正文部分太小,这些公共部分的数量不够,则可以视为内容网页的副本。

  7)文章plagiarism 转载等。有时别人抄袭你的网站内容,有时善意转载,有时作者自愿将文章发给不同的网站,可能造成抄袭内容页面。

  8)镜象网站。镜子网站曾经很受欢迎。当网站太忙太慢时,用户可以通过更换镜像来查看或下载内容。这也会造成复制内容网页的风险。

  9)产品或服务类型之间的差异比较小。比如有些网站把自己的产品或服务按地区分类,但实际上每个地区提供的产品或服务都是一样的。在这些按地区分类的网页上,只有地名发生了变化,其他内容都是一样的。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线