集搜客网页抓取软件(图标有个关注收藏夹的基本都是这种的,在单选框那,才能成功)
优采云 发布时间: 2022-04-01 03:14集搜客网页抓取软件(图标有个关注收藏夹的基本都是这种的,在单选框那,才能成功)
画风是这样的,只要图标有采集,基本都是采集夹
记住:要搞清楚类型,在单选框中,选择要抓取的类型,才能成功
3、详细抓拍
就是输入具体的细节和图片地址。我不会谈论这个。我以前下载过我的,我知道如何使用它。以下 *start 版本没有被删除,可以阅读。
4、索引
索引用于分页爬取。比如你下载了前50页,数据中断了,只保留50页的数据。重新抓取太费时间了。索引可以直接添加到索引中。从 50 页开始抓取。根据分类页数填写详细信息。
5、excel 合并
本软件使用本服务器专用下载,会一一生成excel文档,然后直接将excel文档导入下载器下载。
一张excel一页,全部爬取完成后会生成一个汇总文档。
所以如果中间被打断了,只取50个,后面的取数都是从50开始的。前50页的数据会从所有聚合数据中丢失。
这时候就可以使用这个功能直接合并excel了。
切记:合并时最好将生成的数据文档全部清理干净,否则可能会出现重复数据
6、下载器
下载器的功能就不多说了,说一下具体用法
1.直接填写下载文件需要存放的路径
2.导入抓取的excel文档
3.点击下载
其余功能可自行研究
如果有资源下载失败,可以点击重复下载,不会覆盖之前下载的资源