神器!小白也能用的免费网路爬虫软件
优采云 发布时间: 2020-08-29 23:02神器!小白也能用的免费网路爬虫软件
……
是不是特别有趣?
更厉害的是!官网提供了大量的实战教程(文字版+视频版),也可以进行教程的搜索,对于小白选手来说,真是很棒了!
优采云采集器 ()
下面,我们就以抓取马蜂窝上所有日本自由行的信息为例,实际操作一下:
1、下载软件安装注册登入后,复制马蜂窝日本自由行旅行功略的网页。
2、新建智能模式采集任务
也可以在软件上直接新建采集任务,也可以通过导出规则来创建任务。
3、设置提取数据字段
智能模式下,输入网址后软件即可手动辨识出页面上的数据并生成采集结果,每一类数据对应一个采集字段,可以右击更改数组名称、增减数组、处理数据等。
比如须要采集攻略的功略标题、攻略链接、阅读量、体验人数以及封面图等信息,设置疗效如下
4、提取详情页数据
列表页上有日本自由行功略的部份信息,我们须要功略的具体内容,右击功略链接使用“深入采集”功能,跳转到详情页进行采集。
在详情页面可以看见功略的详尽内容、评论数等信息,还可以见到特别多的图片,如果一 一设置数组,会特别多,而且整篇的图片位置不同,所以可以添加一个特殊数组,“页面PDF”。
5、设置采集任务
点击“设置”按钮,可以进行运行设置和防屏蔽设置,这里我们勾选“跳过继续采集”,设置“5”秒恳求等待时间,勾选“不加载网页图片”,防屏蔽设置默认设置,点击保存。
6、开始采集
点击“保存并启动”按钮,弹出一些中级设置,直接点击“启动”运行工具。
7、提取数据
任务启动以后开始手动采集数据,可以直观的看见程序运行过程和采集结果,采集结束以后有提醒。
8、导出数据
数据采集完成后,可以查看和导入数据,软件支持多种导入方法和导入文件的格式(EXCEL、CSV、HTML和TXT),选择自己须要方法和文件类型,点击“确认导入”。
好了,上面是一个简单的反例。看完以后,是不是发觉,原来爬虫爬取数据也可以如此简单!有兴趣的小伙伴快去试试吧。
这里就不放下载地址了,感兴趣的可以去官网下载,非常贴心的提供了三个版本。