网站程序自带的采集器采集文章(百度关闭原创保护后，原创内容不再得到保护，我只说几个)

优采云发布时间: 2021-10-11 06:25

　　一、选择具有反采集功能的程序，如Empirecms反采集功能，可以起到一定的反采集效果.

　　二、采集如果你想采集你的网站，你必须分析你的网页结构，不管采集人多么复杂awesome采集软件无法绕过这一步，因为采集的内容必须与采集的网站匹配。采集可以做的是批量内容，所以采集一般是一个采集列表页面。很少有人做采集某站某文章文章单独创建采集节点，我们要做的就是增加分析列表页的网页结构的难度通过采集，反右击，F12、ctrl+shift+i，手动点击开发工具代码如下：

//禁用右键（防止右键查看源代码）

window.oncontextmenu=function(){return false;}

//禁止任何键盘敲击事件（防止F12和shift+ctrl+i调起开发者工具）

window.onkeydown = window.onkeyup = window.onkeypress = function () {

window.event.returnValue = false;

return false;

}

//如果用户在工具栏调起开发者工具，那么判断浏览器的可视高度和可视宽度是否有改变，如有改变则关闭本页面

var h = window.innerHeight,w=window.innerWidth;

window.onresize = function () {

if (h!= window.innerHeight||w!=window.innerWidth){

window.close();

window.location = "about:blank";

}

　　无法阻止查看源。我们可以对html代码进行压缩，增加分析代码的难度。搭建模板站点时，注意不要压缩模板代码，否则前端内容出不来。栏目页面的静态url可以用cdn缓存，缓存后代码会被压缩。

　　三、及时禁止可疑IP。

　　采集ip 通常以 C 段的形式出现。在百度统计中，采集ip的访问量都是未知的，一页，间隔很短。我们可以每天查两次百度统计，找出这些ip。，中午一次，晚上一次，有人会说这个太麻烦了。您需要查看统计数据。实时访问者关注三个指标来源，入口页面和访问时间。检查一页数据只需几秒钟。如果是一一但是，就停止工作，只盯着数据。

　　如果发现可疑ip，将立即被禁止。禁止CDN的源站点是没有用的。如果使用CDN，最好同时禁止节点和源站点。对采集ip 的禁止应该尽可能的长，防止以后采集，关于如何屏蔽ip，可以看文章“两种屏蔽ip的方法”。

　　四、禁止请求UA为空或收录PHP。具体代码见文章“网站镜像前后我们应该怎么做”并添加这段代码。这段代码我没有测试过，具体效果未知。

　　五、在文章上下功夫，比如我的文章》详细rss订阅（如何在网站中添加rss订阅功能，如何订阅自己喜欢的网站@ >) "大家羡慕流量，但没有人采集也没有抄袭，搜一下就知道了。

　　以上五种方法都可以最大程度的防止采集，但是如果采集的人捡到你的页面或者有足够的耐心分析你的页面结构，那就不行了，但是我们可以在不同的js文件中为自己的网站 js代码添加不同的非本地域访问权限。虽然这些js代码都能找到，但我想大部分采集都已经放弃了。

0

2021-10-11

网站程序自带的采集器采集文章

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

网站程序自带的采集器采集文章(百度关闭原创保护后，原创内容不再得到保护，我只说几个)

0 个评论

发起人

AI时代内容工厂

网站程序自带的采集器采集文章(百度关闭原创保护后，原创内容不再得到保护，我只说几个)

0 个评论

发起人

相关问题