php禁止网页抓取(网站被镜像的网站有任何更新,也叫恶意克隆)

优采云 发布时间: 2021-12-27 15:01

  php禁止网页抓取(网站被镜像的网站有任何更新,也叫恶意克隆)

  今天有客户问我网站镜像了怎么办,所以今天发一篇文章,介绍几种解决网站镜像的方法。您可以根据自己的情况选择适合自己的解决方案。

  

  网站恶意镜像介绍

  恶意镜像,也称为恶意克隆或恶意解析,是指利用域名A记录解析、反向代理、以及一些小偷程序,将镜像的网站复制到另一个域名。

  镜像网站与镜像网站,在用户眼中,除域名外,其网站布局、内容、文字、图片等均相同,并会随着镜像网站内容的更新而更新。

  网上有一篇文章说,网站的采集

和镜像是一样的。事实上,这种说法是错误的。一个网站的采集和镜像是有本质区别的。

  采集

到的网站一般都是提前抓取别人网站的内容,放到自己的数据库中,然后通过程序在页面上调用。

  镜像网站不是提前抓取内容,而是当有人访问该网站时,它会实时从镜像网站中检索内容,替换内容中的个别文字,或者添加一些SEO关键词,然后实时显示出来. 如果镜像网站有任何更新,镜像网站会实时同步。

  恶意网站镜像的危害

  1、网站的恶意镜像一般针对权重低的小站点,新站点。它会使搜索引擎认为您的网站不是原创

版本,而是镜像网站,因此排名和流量都给了镜像网站。

  2、 被镜像的网站会通过一些其他的技术手段,在内容中加入一些XX内容来引导访问者的访问,或者利用JS直接将网站跳转到其他网站,造成流量被劫持。

  网站被镜像的解决方法

  JS解决方案

  JS代码

  

//将代码中的网址,替换成自己的

if (window.location.host.search('feiniaomy.com') == -1) {

window.location.href = 'https://www.feiniaomy.com';

}

  上面的代码很容易被镜像网站的运营商发现,所以我们可以使用一些工具来混淆JS代码

  混淆的 JS 代码

  

if (window['\x6c\x6f\x63\x61\x74\x69\x6f\x6e']['\x68\x6f\x73\x74']['\x73\x65\x61\x72\x63\x68']('\x66\x65\x69\x6e\x69\x61\x6f\x6d\x79\x2e\x63\x6f\x6d') == -1) { window['\x6c\x6f\x63\x61\x74\x69\x6f\x6e']['\x68\x72\x65\x66'] = '\x68\x74\x74\x70\x73\x3a\x2f\x2f\x77\x77\x77\x2e\x66\x65\x69\x6e\x69\x61\x6f\x6d\x79\x2e\x63\x6f\x6d' }

  屏蔽镜像网站服务器的IP地址

  镜像网站看起来像一个完整的网站。实际上,用户每次访问镜像网站时,镜像网站仍然会抓取调用镜像网站的数据,因此我们可以通过屏蔽镜像网站服务器的IP来禁止抓取我们网站的数据。

  获取镜像网站的服务器IP

  1、,将以下代码保存为ip.php文件,放到网站根目录下

  2、使用镜像网站的URL访问这个文件,

  http://镜像网站的网址/ip.php

  3、 打开网站根目录下的“ip.txt”文件,可以得到镜像网站的ip地址。

  屏蔽镜像网站的服务器IP

  1、修改.htaccess文件即可实现apache服务器

  在.htaccess文件中加入如下代码即可,如果没有.htaccess文件,请自行创建。

  Order Deny, Allow

Deny from 127.0.0.1

  127.0.0.1:是要屏蔽的IP地址,多个IP地址可以用空格隔开

  2、nginx服务器可以修改nginx.conf禁止IP访问

  nginx安装目录,conf文件夹,找到nginx.conf文件,编辑

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线