不用采集规则就可以采集(如何采集获取文章列表的规则写法(图))
优采云 发布时间: 2022-04-18 19:38不用采集规则就可以采集(如何采集获取文章列表的规则写法(图))
图解DEDE cms采集 第一步,确定采集的网站(以DEDE官方站为采集站为例)第二步,确定站的代码为采集。打开原来是采集的网页后,查看源代码(IE:查看源代码),找到中间的charset,后面会显示网页的代码。截图为“gb2312” 第三步,采集列表获取规则写源URL写明明pageno就是分页页码,所以如果有多个页面列表采集,分页页码应该换成"[var: paging]",截图如下 php ?tid=10&pageno=[var:Pagination] 文章 URL 必须收录 URL,不能收录这两个。一般不用写,只有在采集的列表范围内有很多不必要的连接时才用他做过滤。如果只有一个列表页,直接在源 URL 中写 URL 即可。注意这里,最重要的是这里。下面是“采集获取文章要写的规则列表”,是采集打开的页面的源代码文件,在找到文章列表之前和这个页面没有其他相同的代码在Dedecms官网的列表页面文章之前和之后和最近的不一样的是>"和"class="pages"> ",分别写“开始HTML”和“结束HTML”,请参考截图第四步,采集文章标题、文章内容、文章作者、文章来源等规则书写,分页< @采集等。“开始HTML”和“结束HTML”参考第三步的“文章列表写入规则”。下面是如何文章@采集分页内容,见截图中圈出的地方。截图文档是否分页,选择“所有列出的分页列表”“开始HTML”和“结束HTML”。参考第三步的“获取文章”。列表写规则”这里原来有截图,由于论坛配置,现在显示在最上方。点击文章内容中的“分页内容字段”,你不能 采集 不选择它。“下载域中的多媒体资源” 即下载多媒体资源(视频、软件、图片等)到采集时的本地位置,也就是你的网站。以下是过滤规则。过滤规则需要用“正则表达式”来写,但是对于新手来说,这简直比天上要难,看不懂。:) 以上操作就完成了。保存点“Test”,就会出现与上面类似的图片。表示成功然后点击“采集”采集完成后导出到你的专栏就OK了。完成的 这是把多媒体资源(视频、软件、图片等)下载到采集时的本地位置,也就是你的网站。以下是过滤规则。过滤规则需要用“正则表达式”来写,但是对于新手来说,这简直比天上要难,看不懂。:) 以上操作就完成了。保存点“Test”,就会出现与上面类似的图片。表示成功然后点击“采集”采集完成后导出到你的专栏就OK了。完成的 这是把多媒体资源(视频、软件、图片等)下载到采集时的本地位置,也就是你的网站。以下是过滤规则。过滤规则需要用“正则表达式”来写,但是对于新手来说,这简直比天上要难,看不懂。:) 以上操作就完成了。保存点“Test”,就会出现与上面类似的图片。表示成功然后点击“采集”采集完成后导出到你的专栏就OK了。完成的 过滤规则需要用“正则表达式”来写,但是对于新手来说,这简直比天上要难,看不懂。:) 以上操作就完成了。保存点“Test”,就会出现与上面类似的图片。表示成功然后点击“采集”采集完成后导出到你的专栏就OK了。完成的 过滤规则需要用“正则表达式”来写,但是对于新手来说,这简直比天上要难,看不懂。:) 以上操作就完成了。保存点“Test”,就会出现与上面类似的图片。表示成功然后点击“采集”采集完成后导出到你的专栏就OK了。完成的