织梦采集规则(dede采集图文教程并附采集规则,史上最全!)

优采云 发布时间: 2020-07-24 08:04

  

  这部份就是设置列表开始和结束。我们右键单击查看源文件,找到列表开始的位置和结束的位置。

  列表开始位置:

  列表结束位置:

  填完以后我们点击保存而且测试,结果却不是我们想要的结果,为什么呢?因为dede采集模块会手动采集标签,而我们采集区域里有其他的链接。这时候我们就无计可施了吗?

  当然不是,这时候我们要对区域网址进行再度筛选,我们仔细看一下源代码,就不难发觉,文章的url都是静态的,所有的url都包含了html。所以我们在对网址进行再度筛选的框里填上必须包含html。在测试一下,大功告成!最后我们点击步入下一步设置。

  5、网页内容获取规则

  进入这一步以后虽然也没哪些难度了。前面的设置基本上不用动。dede采集模块会手动采集标题、关键词和页面描述。需要我们设置的是页面内容。我们以为例。还是右键单击查看源文件。同样的方面找到内容开始和结束的区域。

  内容开始部份:

  内容结束部份:

  然后在文章内容匹配规则:里填上

  [内容]

  就搞定了。什么?你还想除去文章内容中带的链接? 唉,这么做就不仗义了。不过这也是一个比较常用的方法我也介绍一下吧。

  去掉链接是有方法的哦。我们点击一侧的常用规则。弹出一个对话框,让你选择须要过滤的内容。如果你点击超链接会出现一下规则:{dede:trim replace=”}]*>.*{/dede:trim}。这样设置会把链接和带的文字都过滤掉,这样会导致文章内容不通顺。还用前面的事例:如果用{dede:trim replace=”}]*>.*{/dede:trim}这个规则,采集的内容会是:前几天写了一篇的文章,详细解释了一下哪些是百度推广帐户通顺度织梦采集规则教程,包括调整百度推广帐户通顺度的操作方法。所以我们要修改过滤规则织梦采集规则织梦采集规则,可以写成这样{dede:trim replace=”}]*>{/dede:trim}{dede:trim replace=”}{/dede:trim},这样就可以只把链接除去能够保留链接英文字。

  6、采集并发布

  后面的操作就比较简单了织梦采集规则教程,保存以后就开始采集,等采集完毕后把玩法功略完的内容导出到对应的栏目里就可以了。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线