网站内容复制(复制网页(或者叫重复内容网页)(图))
优采云 发布时间: 2022-01-06 23:06网站内容复制(复制网页(或者叫重复内容网页)(图))
重复网页(或重复内容网页)是指具有相同或非常相似内容的两个或多个网页。
一般来说,搜索引擎不喜欢复制内容页面,他们会尝试确定哪个是原创版本,然后忽略其他复制的页面。
有两点值得注意:
1) 复制网页的判断没有比。例如,如果一个网页上60%或80%的内容与其他网页相同,则将其归类为重复网页。如果有比例,那就简单多了。
2) 复制网页不会带来惩罚。搜索引擎会丢弃其他复制的页面,但不会惩罚搜索引擎认为的原创来源。
但是,这可能会惩罚真正的原创来源。例如,搜索引擎出错,将原创来源视为副本,将复制的内容视为原创来源。
复制内容页面的出现一般有以下几种可能:
1) URL 标准化问题导致。
2)经销商和零售商网站经常从产品制造商的网站复制产品信息。这没有什么错,大多数产品制造商都同意,但大多数代理商,零售商和批发商都会直接复制而不做任何更改。因此,这些电子商务网站充斥着大量复制内容的网页。
3)可打印版本。许多网站 提供了更适合打印的版本。如果不使用 robots.txt 文件,则这些网页的打印版本可能会成为重复的网页。
4)Web 内容由 RSS 生成。有很多网站,尤其是新闻网站,都是使用其他网站 RSS feeds来生成网站的内容,在原创来源和很多其他网站已经出现在所有人身上。
5)电子商务网站使用会话ID。搜索引擎蜘蛛在不同时间访问网页时会被赋予不同的Session ID,但网页的内容实际上是相同的。但是由于Session ID的参数不同,它们被视为不同的网页。
6)页面内容太少。每个网页都不可避免地有共同的部分,例如导航栏、版权声明等。如果网页的正文部分太小,这些公共部分的数量不够,则可能会被视为复制内容网页。
7)文章抄袭、转载等。有时别人抄袭你的网站内容,有时善意转发,有时作者自愿将文章发给不同的网站,所有这些都可能导致内容页面的复制。
8)镜像网站。Mirror 网站 曾经非常流行。当网站太忙太慢时,用户可以通过备用镜像查看或下载内容。这也会产生复制内容网页的风险。
9)产品或服务类型之间的差异相对较小。比如一些网站,他们的产品或服务是按地区分类的,但实际上每个地区提供的产品或服务都是一样的。在这些按地区分类的网页上,只有地名发生了变化,其他内容都是一样的。