火车采集器最新破解版(附教程)下载v9.12.20191226
优采云 发布时间: 2020-04-26 11:00
《火车采集器(LocoySpider)》是一个功能十分强悍的网路数据剖析、挖掘、下载工具;通过灵活的使用方法,帮助用户下载文字、图片、文件等等资源,能够带来极其丰富的资源下载形式,受到广大使用者的好评,如果你须要,欢迎下载体验使用哦!
程序支持远程下载图片文件,支持网站登陆后的信息获取,支持侦测文件真实地址,支持代理火车头采集教程,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许*敏*感*词*特性。
火车采集器支持从任何类型的网站采集获取您所须要的信息,如各类新闻类网站、论坛、电子商务网站、求职急聘网站等。
同时具有强悍的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等中级采集功能。
强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。
1、通用性强
无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所须要的内容。
2、稳定、高效
五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。
3、扩展性强、适用范围广
自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程插口处理数据,让数据都能为你所用。
1.新建分组
新建一个任务分组,选择所属分组,确定分组名称和备注。
2.新建任务
确定所属分组,新建一个任务,填写任务名称并保存。
3.Web发布配置
Web发布配置定义了怎样登录一个网站以及向该网站提交数据。
主要涉及到登陆信息的获取,网站编码设定,栏目列表的获取,以及使用数据测试发布疗效。
4.Web发布模块
可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,以及上传文件,构造发布数据等中级功能。
5.数据库发布配置
数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。
6.数据库发布模块
用于编辑数据库的发布模块,方便我们将数据发布到配置好的数据库中。
火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql句子
(需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。
7.计划任务
设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,
(Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可根据设置执行。
8.插件管理
插件是可以拿来扩充列车采集器功能的程序
火车采集器V9支持PHP源码、C#源码、C#泛型三种类型的插件,
可用于扩充http请求、内容处理和文件下载的功能,并可以分别进行测试。
9.http二级代理
网络中的服务器,可以使网路用户去取得所须要的网路信息。
代理的功能有可以突破自身ip的访问限制访问美国站点,访问一些单位或团体内部资源,
突破联通的ip封锁和隐藏真实的ip等。
火车采集器V9支持http代理、socket4和socket5代理。
10.http模拟恳求
可以设置怎么发起一个http请求,包括设置恳求信息火车头采集教程,返回头信息。并具有手动递交的功能。
1、规则自定义-通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2、多任务,多线程-可以同时进行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得-任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等就会及时的反映在软件界面中。
4、数据保存-数据边采集边手动保存到关系数据库中,并且数据结构才能手动适应,软件可以依据采集规则手动创建数据库,以及其中的表和数组,也可以通过导库形式灵活的将数据保存到顾客已有的数据库结构中。
5、断点续采-信息搜集任务可以在停止后从断点开始继续采集,从此你用不再害怕你的采集任务意外中断了。
6、网站登录-支持网站Cookie,支持网站可视化登陆,即使登陆时须要验证码的网站也能采集。
7、计划任务-通过这个功能可以使你的采集任务定时、定量或则始终循环执行。