网站内容采集(一下zblog插件采集方式:第一种是需要写入规则的收费插件)
优采云 发布时间: 2022-01-15 18:19网站内容采集(一下zblog插件采集方式:第一种是需要写入规则的收费插件)
Zblog采集插件是为了帮助网站快速丰富网站内容;减少手动发布内容的繁琐;主要是给网站添加很多内容,方便快捷。网站发布文章的时候,如果把文章一一发布到网上,不仅浪费时间,而且效率低下。这时候为了提高更新网站的效率,出现了zblog采集插件,但是常规的zblog插件都需要写规则。今天博主就来说说zblog插件采集方法:第一个是付费插件,需要写规则,第二个是免费工具,不需要写规则!
Zblog采集规则编写简介
第 1 步:创建一个新的 文章采集 节点
登录后台,点击采集>>采集节点管理>>添加新节点>>选择普通文章>>确定
第二步:填写采集列表规则
1.节点名:随便
2.查看目标页面的编码:查看目标页面的编码
3.匹配网址:进入采集目标列表页面查看其列表规则!比如很多网站列表的首页和其他内页有很大的不同,所以我一般不会采集定位列表的首页!
最好从第二页开始(虽然可以找到第一页,但是很多网站根本没有第一页,这里就不讲怎么找到第一页了)
4. 区域末尾的 HTML:在 采集 目标列表页面上打开源代码!在 文章 的标题附近寻找一个 html 标记,该标记将是 采集,并且对于该页面和其他将要成为 采集 的页面来说是唯一的!
写好后点击保存信息,进入下一步!如果规则编写正确,那么这些将出现一个带有内容的 URL 获取规则测试
再按下一步!回车填写采集内容规则
第三步:采集内容规则
1.文章标题:在文章标题前后找两个标签,即可识别标题!
2.文章内容:寻找文章内容前后的两个标签来识别内容!我的 采集 的 网站 的 文章 内容之前和之后的唯一标签是
…