网站内容复制(复制网页(或者叫重复内容网页)(图))
优采云 发布时间: 2022-03-18 13:28网站内容复制(复制网页(或者叫重复内容网页)(图))
重复网页(或重复内容网页)是指两个或多个具有相同或非常相似内容的网页。
一般来说,搜索引擎不喜欢复制内容页面,他们会尝试确定哪个是原创版本,然后忽略其他复制的页面。
有两点值得注意:
1)复制网页没有万能的判断。例如,如果一个网页与其他网页有 60% 或 80% 的相同内容,则将其归类为重复网页。如果有比例,那就简单多了。
2)复制页面不会受到惩罚。搜索引擎会丢弃其他复制的页面,但不会惩罚搜索引擎认为是原创来源的内容。
然而,这有可能惩罚真正的原创出处。例如,搜索引擎判断错误,将原创来源视为复制来源,将复制来源视为原创来源。
重复内容页面的出现一般有以下几种可能:
1)由于 URL 规范化问题。
2)分销商和零售商网站 经常从产品制造商的网站 复制产品信息。这并没有错,大多数产品制造商都同意,但大多数代理商、零售商和批发商会直接复制而不做任何更改。所以这些电商网站充斥着大量的复制内容页面。
3)印刷版。很多 网站 提供了更适合打印的版本,如果不使用 robots.txt 文件,这些打印版本的页面可能会变成克隆。
<p>4)Web 内容由 RSS 生成。有很多 网站,尤其是新闻 网站,使用其他 网站 RSS 提要来生成 网站 内容,这些内容在原创源和许多其他