网站程序自带的采集器采集文章速度太慢(图)

优采云 发布时间: 2021-03-27 21:01

  网站程序自带的采集器采集文章速度太慢(图)

  网站程序自带的采集器采集文章速度太慢,一般上了架的站点,被采集的网站程序都有这个问题。那么今天小编说说dedecms一键采集器之cms采集器设置方法,大家都可以参考,我用的是dedecms6.5版本cms采集器。

  1、打开浏览器,输入网址:-extract-javascript一定要保持和网站程序的网址一致

  2、然后点击选择,直接进入登录界面,我们注意cookie记录是从电脑本地网站上获取,登录成功后,

  3、选择所需要添加的采集规则,在此,不要只点击“添加”,

  4、开始设置规则,可以同时加载多个规则,方便编辑统计规则。左侧可以设置规则级别,可对规则进行优化,

  5、设置抓取规则,用户已经按设置了一个或多个采集规则,默认选择默认的采集规则,规则会提示已有过多规则无法过滤,

  6、点击上传文件,将采集到的html文件上传到服务器(/txt)中,请用编辑器打开并审核,加载成功后,

  7、抓取完成后,点击回车键,可查看效果。更多网站程序采集器的设置,

  收集的时候,除了抓到的内容要进行审核,还要提取出来不同站点的算法的可能,就像是一篇文章的一个变种,提取出来多种算法,防止大家采集了一篇文章,有多种相似的算法都一起采集,降低了违规率。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线