文章内容匹配规则的结束部分(cb)(组图)
优采云 发布时间: 2021-05-09 02:25文章内容匹配规则的结束部分(cb)(组图)
”之后,通过比较文章内容页面及其源代码,不难发现第一位实际上是一个摘要,第二位是文章内容的开头。因此,您应该选择“
”是匹配规则的开头。
(b)找到文章“它也是添加了值“ transparent”的“ wmode”参数的内容的结尾部分。,如图29所示,
p---普通的文章不带分页(二)" />
图29- 文章内容的结尾
注意:因为结束部分的最后一个标签是“
”,并且此标记在文章的内容中多次出现。因此,不能将其用作采集规则的结束标记。考虑到它应与文章内容的开头相对应],则经过比较分析后得出Out,此处应选择“
”作为文章内容的结尾,如图30所示,
p---普通的文章不带分页(二)" />
图30- 文章内容匹配规则的结尾
(c)结合(a)和(b),我们可以看到文章内容的匹配规则应为“
[内容]
”,填写后,如图31所示,
p---普通的文章不带分页(二)" />
图31- 文章内容匹配规则
此处未使用过滤规则。过滤规则的介绍和使用将放在单独的章节中。
在这里,“添加采集节点:步骤2设置内容字段获取规则”,设置完成。填写后,如图3 2)所示,
p---普通的文章不带分页(二)" />
图32-设置后新添加的采集节点:第二步是设置内容字段获取规则
检查后,单击“保存配置并预览”。如果先前的设置正确,则单击后,将进入“添加采集节点:测试内容字段设置”页面,并查看相应的文章内容。如(图3 3)
p---普通的文章不带分页(二)" />
图33-新添加的采集节点:测试内容字段设置
确认正确后,单击“仅保存”,系统将提示“成功保存配置”,并返回“ 采集节点管理”界面;如果单击“保存并启动采集”,它将进入“ 采集指定的节点”界面。否则,请单击“返回上一步进行修改”。