汇总:抓取网页数据工具优采云采集器插件说明
优采云 发布时间: 2020-09-07 11:35获取网页数据工具优采云 采集器插件说明
当使用优采云 采集器来获取网页数据时,也会使用插件。 优采云 采集器将数据从采集传递到外部程序,我们将其称为插件,然后插件处理数据,然后将数据返回到采集器。
优采云 采集器 V9支持使用PHP和C#两种语言编写插件,而V9支持插件的源代码编辑。 优采云 采集器 Web数据爬网工具优采云 采集器的插件可以应用于采集结果,HTTP请求和文件下载的处理。在插件设置过程中,您可以从下拉框中从插件管理器中选择一个现有插件,以实现特定的应用程序。
以下使用58个手机号码识别插件和百度翻译插件来解释用法。
58个插件演示:
([1)首先,我们需要将插件58验证码V 9. dll放入采集器的Plugins目录中
([2)然后在“其他设置-插件-采集结果处理插件”中选择此插件。
(3)最后,我们需要创建一个名为“手机号码”的标签,从采集到58个手机号码的图片地址,以便在运行时,采集器将自动调用插件-in转义图片以数字文本形式输出。
翻译插件演示:
([1)首先我们需要将百度翻译插件.dll放入采集器的Plugins目录中
([2)然后在“其他设置-插件-采集结果处理插件”中选择此插件。
(3)最后,我们需要创建一个名为“ translation tag”的标签,并以固定字符串的形式写待翻译字段的名称。
创建一个名为“反向翻译”的标签,并以固定字符串的形式编写翻译语言,例如中文到英文,代码:zh> en(zh表示中文,en表示英文,例如用)。完成此操作后,优采云 采集器 V9将在运行时自动调用该插件进行翻译。
借助插件,我们可以使用优采云 采集器完成更复杂的任务。在采集器中,除了使用现有插件外,我们还可以编写所需的插件来使用。技术人员可以联系官方定制插件。
更多教程:
文章 采集器 采集规则和发布模块的对接
如何获取网页数据工具的内容