解决方案:wordpress如何才能实现自动采集?WP-AutoPost插件帮你解决
优采云 发布时间: 2020-08-31 00:24wordpress如何实现自动采集? WP-AutoPost插件将帮助您解决问题
对于新闻来源,百度的算法已更改并再次更改. 显然,对原创的要求越来越高,但仍有很多朋友想做采集站. 福利最小的成员在转到相关代码之前也在线观看了实现采集站的功能,但是限制很多,效果也大大降低了. 今天,让我们谈谈可以实现自动采集的wordpress插件. 非常强大. 这个插件是WP-AutoPost.
一些朋友可能听说过. 许多站点建设培训都使用wp,尤其是在进行采集站点时,WordPress可能非常强大. 这是实现wp的自动采集功能的方法.
此外,Internet上的许多地方都说wp-autopost插件很好,采集非常方便,支持定向采集,支持通配符匹配,或者CSS选择器可以准确采集任何内容,支持采集文本的内容页面的内容类似于dedecms的采集,非常适合新手.
下载并安装WP-AutoPost插件
福利的最年轻成员也从互联网上找到了免费版本. 测试后仍然可用. 如果下载了它,则可以在文章页面的底部下载它.
让我们先谈一下基本用法:
1. 单击“新任务”后,输入任务名称以创建新任务. 创建新任务后,您可以在任务列表中查看该任务,并且可以为该任务设置更多设置. (无需修改此部分中的设置,唯一需要更改的是采集时间. )
文章来源设置. 在此标签下,我们需要设置文章来源的文章列表URL和特定的文章匹配规则. 让我们以采集“新浪网新闻”为例,文章列表URL是这样,因此在“手动指定文章列表URL”中输入URL,如下所示:
2. 文章URL匹配规则. 文章URL匹配规则的设置非常简单. 无需复杂的设置. 提供两种匹配模式. 您可以使用URL通配符匹配或CSS选择器进行匹配. 通常,URL通配符匹配更简单,但有时会使用CSS选择器. 更精确.
3. 使用URL通配符匹配. 通过单击列表URL上的文章,我们可以发现每个文章的URL具有以下结构: 因此,用通配符(*)替换URL中的数字或字母,例如: (*)/(*). shtml
4. 使用CSS选择器进行匹配. 使用CSS选择器进行匹配,我们只需要设置文章URL的CSS选择器即可,可以通过查看列表URL的源代码并在列表URL下找到文章超链接的代码轻松地进行设置,如图所示下方:
5. 可以看到,文章的超链接A标签位于类为“ contList”的标签内,因此,文章URL的CSS选择器仅需要设置为.contList a,如下所示:
6. 设置完成后,如果您不确定设置是否正确,可以单击上图中的测试按钮. 如果设置正确,将列出列表URL下的所有文章名称和相应的网址,如下所示:
其他设置无需修改
注意WP-AutoPost插件的免费版本
在测试过程中,我发现免费版的wp-autopost插件采集将带有指向wp-autopost官方网站的链接,这非常不舒服!发现wp-autopost-function.php文件已加密. 由于已加密,因此该链接100%隐藏在该文件中. 破解它.
当前发送的wp-autopost插件压缩包收录两个文件夹. wp-autopost是原创插件wp-autopost-po是wp-autopost的破解版. 另外,希望大家都支持正版. 如果您需要正版插件,最好去官方网站购买!这是插件界面的屏幕截图,如下所示:
WP-AutoPost插件使用说明
我将在此处添加一些有关在Internet上使用此插件的说明.
1,安装WP-AutoPost
您可以通过从WP-AutoPost.ORG帐户下载ZIP文件来手动安装WP-AutoPost.
如果要手动安装WP-AutoPost,请按照以下步骤操作:
登录到您的WP-AutoPost.ORG帐户.
转到“帐户”部分.
下载所需的WP-AutoPost插件(ZIP文件).
将下载的ZIP文件上传到您网站的“ wp-contents / plugins”目录.
解压缩ZIP文件. 这将创建一个目录.
登录到您的网站,转到“插件”,然后启用它.
2,创建任务和基本设置
创建任务
单击“新任务”后,输入任务名称以创建新任务. 创建新任务后,您可以在任务列表中查看该任务,并可以为该任务设置更多设置.
基本设置
点击“设置”后,您可以在“基本设置标签”下设置以下设置:
任务名称: 修改任务名称
类别目录: 任务采集文章发布到的类别目录
作者: 任务采集文章发表的作者必须是wordpress的注册用户
更新间隔: 检查采集任务下是否有新文章可以更新的间隔
字符集: 采集目标网站的字符集编码,默认为UTF8,如果目标网页的字符集编码不是UTF8,则抓取的网页会出现乱码,设置正确的字符集即可解决问题(如何正确设置字符集)
下载远程图片: 如果任务收录采集文章中的图片,则可以选择是否将远程图片下载到本地服务器. 如果您选择下载远程图片,则可以进行以下更多设置:
将下载的图片保存到wordpress媒体库中
将图像保存到Flickr
将图像保存到Qiniu云存储中
自动将下载的第一张图片设置为特*敏*感*词*片
下载的图片会自动加水印,并可以添加文本水印或图像水印
选择设置图片地址的属性(如果收录源图片地址的属性不是src,则可以在此处设置)
下载远程附件: 如果在此任务下采集文章中还有其他类型的附件,则可以选择是否将这些附件文件下载到本地服务器. 选择下载后,您可以进行以下更多设置:
将下载的附件信息保存到wordpress媒体库