采集的文章内容不能直接发布(防止网站被采集的方法有哪些?-八维教育)

优采云 发布时间: 2022-01-23 19:08

  采集的文章内容不能直接发布(防止网站被采集的方法有哪些?-八维教育)

  现在许多公司和个人都在使用 织梦网站 程序来建立他们的网站。现在,不管是公司还是个人网站,大部分都是文章网站采集别人的网站上的数据也是文章@ > 的原创,但是有一个结构是复制的,采集,甚至是镜像的网站,直接导致我放弃了之前的网站,现在这个< @网站也是新的网站,同样是原创的文章,但是我遇到了这个情况。

  因为我也遇到过同样的情况,这里有一些方法可以防止网站变成采集。

  1、禁止右击代码,禁止复制,可以防止别人复制你的文章。

  网站如果内容被复制了,只能禁止复制,但是如果转载者愿意保留你的链接,他还是很愿意分享的,但是如果被转走,你的版权就会被删除,您的链接将被删除。让人非常不舒服。在被抄袭方面,只能防君子,不能防小人。

  但是,我不得不说,那些愿意复制你的 文章 的人不会离开你的链接。所以我们还是禁止别人抄袭,等你的文章达到秒收的情况,你就可以放开文章的抄袭了。

  页面禁止右键的代码,在栏目页面、文章页面、商品内容页面添加如下代码:

  

  这可以禁止右键单击,因此可以禁止复制。但是懂代码的人还是可以复制的。但可以防止其中的大部分。另外,也可以添加其他禁止复制的代码,综合使用,提高复制文章的难度,也减少被复制的几率。

  2、织梦防止采集可以添加动态ID,还有更好的办法。

  现在研究了一段时间防止网站变成采集的方法,发现防止织梦网站变成采集@的方法> 网上是给文章的方式,在代码的两端加上织梦的ID,然后多次添加,但是我发现这种ID的方式很简单,因为ID其实就是文章的ID,感觉很容易被破解。

  同时我发现文章的时候其实是有释放时间的,于是想到了用调用的时间代替ID多改。

  

  用文章的发布时间代替call ID,变化越多,采集的难度就越大,所以增加了采集的难度。

  你应该会发现,即使叫发布时间,数字也是不一样的,因为时间有年、月、日、时、分、秒六种样式,每一种都有两位数。所以如果你取其中两个,就不会显示不同的数字。另外,可以添加ID的形式,一共七种样式,组合会更多,比只调用ID样式更加困难和不规则。

  代码:{dede:field.id/}{dede:field.pubdate function="MyDate('YmdHis',@me)"/}

  说明:{dede:field.id/}这是织梦文章ID调用标签,后面的YmdHis是年月日时分秒,年除外,基本都是两位数所以可以选择组合更换呼叫ID标签,也可以综合使用。最大程度地防止被采集。

  一、确定某个IP在一定时间内访问本站的次数。如果明显超过正常人的浏览速度,IP会被拒绝访问。

  缺点:

  1、此方法只适用于动态页面,如:asp\jsp\php等...静态页面无法确定某个IP在一定时间内访问本站页面的次数;

  2、这种方法会严重影响搜索引擎蜘蛛收录,因为搜索引擎蜘蛛收录,浏览速度会更快,多线程。此方法还将拒绝站点中的搜索引擎蜘蛛 收录 文件;

  采集对策:只能放慢采集的速度,或者不带;

  建议:做一个搜索引擎蜘蛛的IP库,只允许搜索引擎蜘蛛快速浏览网站内容。采集搜索引擎蜘蛛的IP数据库并不容易。搜索引擎蜘蛛不一定只有一个固定 IP 地址;

  点评:这种方法对采集比较有效,但是会影响收录的搜索引擎。

  二、使用 javascript 加密内容页面

  缺点:这种方式适用于静态页面,但是会严重影响搜索引擎的收录情况,而且搜索引擎接收到的内容也是加密内容;

  采集对策:建议不要使用。如果绝对必要,还采集了解密密码的JS脚本;

  建议:目前没有好的改进建议;

  点评:建议期望来自搜索引擎流量的站长不要使用这种方法。

  三、将内容页面中的特定标签替换为“特定标签+隐藏版权文本”

  缺点:这种方法缺点不大,只会增加一点页面文件大小,但是很容易反转采集;

  采集对策:替换采集中含有隐藏版权文本内容的版权文本,或替换为自己的版权;

  建议:目前没有好的改进建议;

  点评:我觉得实用价值不大,即使是随机隐藏的文字。

  总结:上面用时间代替ID的方法比只用ID复杂,采集文章会比较难,当发现采集你的网站比较困难的时候,自然会选择其他目标。当然,这对大部分新手采集很有用,部分采集高手还是可以破解的,但真正的采集高手,我想我不会来采集你的网站。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线