PbootCMS优采云采集器采集使用教程一采集设置
优采云 发布时间: 2020-08-17 08:08PbootCMS优采云采集器采集使用教程一采集设置
上一篇内容上面我们讲解了PbootCMS优采云采集器安装的教程,如有不明白的可以好好看下,话不多说我们继续。
第一步:登录我们优采云采集器:地址为:你的网址/(子目录或是栏目名称)/index.php?s=/Admin/Index/index
输入我们创建的用户名和密码登陆进去。我们的后台是一个响应式的,匹配所有的终端,不用害怕兼容性或则浏览不好的疗效。
点击:设置---进入采集设置(站点设置和短信设置这儿后期可以自行去研究,一般是用不到的)
这里都没有哪些须要注意的;多树就默认就好,选择好了就保存吧。
图片本地化设置:图片路径建议设置为我们网站默认的,地址也是一样,后期我们一旦不使用这个采集插件了可以直接删掉掉不会影响我们的图片路径。设置完成记得选择保存。
页面渲染和代理、翻译这儿讲一下:
页面渲染意思就是采集的时侯的页面和我们打开浏览是一样的,我们的这个采集规则是借助的爬虫原理,去采集的时侯是看不到样子的是从html上面去抓取的。这个渲染通常都是采集比较复杂或是困难的网站才须要用到,优采云采集器上面默认是谷歌浏览器。
代理:这个是IP,有些复杂的网站我们频繁去采集是会封禁IP的,这时候我们就可以选择使用这个代理IP,现在这个版本是可以批量添加的特别便捷。
翻译:默认是集成了有道,百度和腾讯翻译,这个可以随意选择,我们只须要去她们的官网注册一个开发着帐号把APPID和秘钥填写进来就好了,后期我们采集回来的内容就可以实现手动翻译并发布(这里都会用到我们的函数插件)。
以上的设置就没有了,接下来就是添加任务。
点击任务列表----添加任务:设置好之后点击保存。
以上呢就是我们PbootCMS优采云采集器采集使用教程采集任务设置,接下来我们步入采集规则设置请点击这儿:PbootCMS优采云采集器采集使用教程二采集规则发布设置