智能模式简介及其使用方法
优采云 发布时间: 2020-08-07 02:23“新手智能模式入门”
本文用于演示使用智能模式采集列表和建立网站的基本步骤. 这是学习优采云采集软件的便捷方式.
本文中的示例URL为:
定位: 在智能模式下,您只需要输入URL,单击“搜索”,优采云便会自动采集网页数据并以表格形式显示. 您可以修改字段信息的名称,删除,翻页,导出数据等操作.
使用的先决条件: 智能模式暂时适用于以表格或列表形式显示网页中数据的网页,例如电子商务网站产品列表中的产品信息以及某些生活服务网站. 举例的网站,例如: Dianping,Anjuke Rental House,P2P Online Loan,Sogou Movie Rank等.
推荐用法: 对于表格和列表形式的网页,使用智能模式可以帮助您节省制定规则的时间,快速获取所需信息,并进行简单的修改以导出到EXCEL并直接使用. 单击以使用.
如果智能模式不能满足您的需求,请参阅指导模式进行自定义采集. 自定义采集可以准确满足您的大多数采集需求.
智能模式采集步骤:
步骤1: 首先打开优采云采集器→将URL复制到输入框中→单击放大镜图标以进入智能采集模式:
第2步: 在搜索框下检查结果1-3,然后找到符合您需要的结果:
采集器将采集各种数据模板以满足您不同的采集需求,并找到适合您的模板以继续.
步骤3: 如果无法判断当前页面信息是否满足要求,可以单击加载下一页,优采云采集器将自动翻页并采集下一页的内容.
检查结果是样本数据. 在此步骤中不必采集所有数据. 如果无法判断当前数据是否满足需求,请加载下一页以获得更多数据进行判断.
注意: 首先判断是否需要加载下一页,然后在下一步中修改页眉. 如果先修改标头然后再加载它,则修改后的标头将返回其未修改状态.
第4步: 修改标题,修改所需的字段名称并删除不必要的字段:
表中可以执行的操作是: 删除,修改列名,延长和缩短列宽. 修改列名后,下一步是导出或启动集合时它仍然有效,无需再次修改.
第5步: 开始采集或导出到Excel. 如果采集的数据量很大,建议使用云采集功能.
智能模式导出格式为Excel导出. 如果需要以其他格式导出,请使用自定义获取模式.
本地采集占用当前计算机资源进行采集. 如果有采集时间要求,或者当前计算机无法长时间采集,则可以使用云采集功能. 云采集是在没有当前计算机支持的情况下在网络上采集的. 可以关闭计算机并进行设置. 多个云节点共享任务,10个节点相当于10台计算机来分配任务以帮助您采集数据,将时间减少到原来的十分之一;采集的数据可以存储在云中三个月,并且可以随时导出.
此外,智能模式还可以输入关键字来搜索数据. 例如,如果您搜索“天气”并单击查询,则可以跳至Sutoto Rule市场. 相关数据或规则可以直接在号码上找到. 用户可以下载数据或规则,并且可以在优采云中运行规则以获取所需的数据.