网站重复内容的8个原因和对应解决方案
优采云 发布时间: 2022-06-28 22:24网站重复内容的8个原因和对应解决方案
什么是重复内容?
重复内容是在网络上的多个 URL 上的相同内容。因为不止一个 URL显示相同的内容,搜索引擎不知道哪个URL 在搜索结果中列出得更高。因此,他们可能会将这两个 URL 排名较低,并优先考虑其他网页。
为什么要防止网站上的重复内容?
重复内容意味着类似的内容出现在网络上的多个位置 (URL),因此搜索引擎不知道在搜索结果中显示哪个 URL。这会损害网页的排名,而且当人们开始链接到相同内容的不同版本时,问题只会变得更糟。
另外,如果您的内容非常稀薄,并且结合了逐字复制的内容,甚至可能会因试图欺骗用户而面临 Google 的手动操作惩罚。
导致出现重复内容的原因有哪些?
1.技术人员对URL的误解导致的重复内容
由于开发人员不像浏览器甚至用户那样思考,更不用说搜索引擎蜘蛛了。以和为例,如果你问开发者,他们会说它只存在一次。在开发者看来,该文章的唯一标识符是该文章在数据库中的 ID,而不是 URL。但是对于搜索引擎来说,URL 是一段内容的唯一标识符。 所以需要你像开发人员解释清楚这一点,甚至可以为他们提供解决方案。
2.会话ID导致的URL重复
会话是访问者在您的网站上所做操作的简要历史记录,包含诸如购物车中的物品之类的内容。为了使访问者从一个页面点击到另一个页面时保持该会话,该会话的唯一标识符(称为会话 ID)需要存储在某处。最常见的解决方案是使用 cookie 来实现。但是,搜索引擎通常不存储 cookie。
此时,某些系统会退回到在 URL 中使用会话 ID。这意味着网站上的每个内部链接都会将该会话 ID 添加到其 URL,并且由于该会话 ID 对于该会话是唯一的,因此它会创建一个新 URL,因此会重复内容。
3.用于跟踪和排序的 URL 参数
重复内容的另一个原因是使用不会更改页面内容的 URL 参数,例如在跟踪链接中。你看,对一个搜索引擎来说,和 是不一样的。后者可能使您可以跟踪人们的来源,但也可能使您更难获得良好的排名-这是非常不希望的副作用!
当然,这不仅仅适用于跟踪参数。它适用于您可以添加到不会更改重要内容的 URL 的每个参数,无论该参数是用于“更改一组产品的排序”还是“显示另一个侧边栏”:所有这些都会导致重复内容。
4.抓取工具和内容联合
其他网站使用抓取工具抓取使用或手动复制您的内容,不论你是否同意。当它们不链接到您的原始文章时,搜索引擎必须处理同一篇文章的另一个版本。此时您的网站越受欢迎,您将获得越多的抓取工具,从而使这个问题变得越来越大。
5.参数顺序
另一个常见的原因是 CMS 不使用干净整洁的 URL,而是使用类似 的 URL /?id=1&cat=2,其中 ID 指的是文章,cat 指的是类别。URL/?cat=2&id=1将在大多数网站系统中呈现相同的结果,但对于搜索引擎来说它们是完全不同的。