文章内容匹配规则的结束部分(cb)(组图)

优采云 发布时间: 2021-05-09 02:25

  文章内容匹配规则的结束部分(cb)(组图)

  ”之后,通过比较文章内容页面及其源代码,不难发现第一位实际上是一个摘要,第二位是文章内容的开头。因此,您应该选择“

  ”是匹配规则的开头。

  (b)找到文章“它也是添加了值“ transparent”的“ wmode”参数的内容的结尾部分。,如图29所示,

  

p---普通的文章不带分页(二)" />

  图29- 文章内容的结尾

  注意:因为结束部分的最后一个标签是“

  ”,并且此标记在文章的内容中多次出现。因此,不能将其用作采集规则的结束标记。考虑到它应与文章内容的开头相对应],则经过比较分析后得出Out,此处应选择“

  ”作为文章内容的结尾,如图30所示,

  

p---普通的文章不带分页(二)" />

  图30- 文章内容匹配规则的结尾

  (c)结合(a)和(b),我们可以看到文章内容的匹配规则应为“

  [内容]

  ”,填写后,如图31所示,

  

p---普通的文章不带分页(二)" />

  图31- 文章内容匹配规则

  此处未使用过滤规则。过滤规则的介绍和使用将放在单独的章节中。

  在这里,“添加采集节点:步骤2设置内容字段获取规则”,设置完成。填写后,如图3 2)所示,

  

p---普通的文章不带分页(二)" />

  图32-设置后新添加的采集节点:第二步是设置内容字段获取规则

  检查后,单击“保存配置并预览”。如果先前的设置正确,则单击后,将进入“添加采集节点:测试内容字段设置”页面,并查看相应的文章内容。如(图3 3)

  

p---普通的文章不带分页(二)" />

  图33-新添加的采集节点:测试内容字段设置

  确认正确后,单击“仅保存”,系统将提示“成功保存配置”,并返回“ 采集节点管理”界面;如果单击“保存并启动采集”,它将进入“ 采集指定的节点”界面。否则,请单击“返回上一步进行修改”。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线