教程:织梦CMS后台图文采集规则
优采云 发布时间: 2020-08-31 05:31织梦cms背景图片和文字采集规则
首先要注意的是:
1. 代码的唯一性
2,采集完成,最好导入采集的内容
在采集后删除内容,然后进行下一个采集
登录到后台的方法/步骤,如下图所示:
(单击“采集”,然后选择“采集节点管理”. )
(单击-添加新节点)
(选择内容模型---- 1,如果是采集文章,则选择“普通文章”. 2.如果是图片,则选择“图片集”)
新采集节点: 第一步是设置基本信息和URL索引页面规则(注意: 1.自行命名节点2.目标页面代码: 采集站的代码必须相同3.列出URL获取规则-匹配的URL,通常是列表页面URL之一,请按照以下说明操作. )
(该区域开头的HTML: 此块是用于填充列表页面的起始代码. 代码的长度无关紧要,但是该代码必须是唯一的,即,该代码不会重复在整个源代码中,它只出现一次.
该区域末尾的HTML: 结尾代码也是如此,并且必须唯一.
)保存,下一步是确定
此步骤是[URL获取规则]
(已测试的列表URL: 1.这是上一步中填写的列表URL. 如果在上一步中没有问题,则将显示采集的文章标题列表. 2.如果没有,请返回上一步. 再次修改,如果正确,请转到下一步. )
在此步骤中,开始采集文章内容[Web内容获取规则]