如何在网站上采集以及如何在wordpress上实现自动采集
优采云 发布时间: 2020-08-08 20:39
WordPress是使用PHP语言开发的网站构建程序平台. 现在,许多博客都使用WP. 许多网站生产培训都使用WP,尤其是在作为采集站工作时. WordPress非常强大. . 这是实现wp自动采集功能的方法.
安装网站集插件: WP-AutoPost(插件下载地址: )
单击“新任务”后,输入任务名称以创建新任务. 创建新任务后,您可以在任务列表中查看该任务,并且可以为该任务设置更多设置. (这部分不需要修改设置,唯一需要更改的是采集时间. )文章源设置. 在此标签下,我们需要设置文章来源的“文章列表URL”和特定文章的匹配规则. 让我们以“新浪网新闻”为例,文章列表URL是,因此在“手动指定文章列表URL?”中输入URL. 如下所示:
文章URL匹配规则. 文章URL匹配规则的设置非常简单,不需要复杂的设置. 提供两种匹配模式. 您可以使用URL通配符匹配或CSS选择器进行匹配. 通常,URL通配符匹配更简单,但有时CSS选择器更方便. 准确. ?使用URL通配符匹配. 通过单击列表URL上的文章,我们可以发现每篇文章的URL具有以下结构: 因此,用通配符替换URL中更改的数字或字母? (*)??,例如: (*)/(*).shtml. 重复的URL可以使用301重定向. 使用CSS选择器进行匹配. 使用CSS选择器进行匹配,我们只需要设置商品URL的CSS选择器即可,可以通过查看列表URL的源代码并在列表URL下找到商品超链接的代码轻松地进行设置,如图所示下方:
如您所见,文章的超链接A标签位于类为“ contList”的标签内,因此只需将文章URL的CSS选择器设置为??. contList a ?,如下所示:
设置完成后,如果您不知道设置是否正确,则可以单击上图中的测试按钮. 如果设置正确,则会列出列表URL下的所有文章名称和相应的网址,如下所示:
其他设置不需要修改. 以上采集方法适用于WordPress多站点功能.