网站通用信息采集器V10正式版
优采云 发布时间: 2020-08-06 13:26
网站信息采集器是一种易于使用的信息采集工具. 该软件会自动获取网站上的信息,并获取所有信息并将其发布到您的网站. 网站信息采集器具有多级页面采集和自动添加采集. 信息,多页新闻自动抓取等功能,无需手动,自动网站更新.
网站信息采集器功能
1. 自动信息采集和添加
网站爬网的目的主要是添加到您的网站,该软件可以实现采集和添加的自动完成. 其他网站刚刚更新的信息将在五分钟内自动发送到您的网站.
2. 还捕获了需要登录的网站
对于需要登录才能查看信息内容的网站,优采云采集器网站可以轻松登录并采集,即使有验证码,也可以通过登录来采集所需信息.
3. 可以下载任何类型的文件
如果您需要采集图片之类的二进制文件,则只需设置网站优采云采集器,就可以在本地保存任何类型的文件.
4. 多级页面采集
可以同时采集多级页面的内容. 如果一条信息分布在许多不同的页面上,则优采云采集器网站还可以自动识别该信息
不要在多级页面上实现采集
5. 自动识别Javascript和其他特殊URL
许多网页链接到javascript: openwin('1234')等特殊URL,而不是通常的开头,该软件还可以自动识别和捕获内容
6. 自动获取每个类别的网址
例如,供需信息通常具有很多类别. 通过简单设置软件,即可自动捕获这些类别URL,并对捕获的信息进行自动分类
7. 多页新闻自动爬网,广告过滤
某些新闻中有下一页,该软件还可以捕获所有页面. 并且可以同时保存捕获的新闻中的图片和文字,并可以过滤掉广告
8. 自动破解防盗链
许多下载网站都有防盗链. 直接输入URL不会捕获内容,但是该软件可以自动破解防盗链,以确保您可以捕获所需内容.
此外,已添加了模拟手动提交的功能. 租赁站点的asp + access空间也可以远程发布. 实际上,它还可以模拟所有网页提交操作. 您可以批量注册成员并模拟群组消息.
更新日志
1. 全新的分层设置,可以为每个层设置特殊选项,摆脱以前的默认3层限制
2. 一次爬取任何多级分类. 过去,有必要先捕获每个类别的URL,然后再捕获每个类别
3. 图片下载,自定义文件名,以前无法重命名
4. 新闻内容页面合并设置更简单,更通用,更强大
5. 模拟的点击更通用,更简单. 先前的模拟点击需要特殊设置,并且使用起来很复杂
6. 可以根据内容判断重复项,而根据过去的URL判断重复项.
7. 采集完成后,允许执行自定义vbs脚本endget.vbs,并允许在发行后执行endpub.vbs. 在vbs中,您可以自己编写数据处理功能
8. 导出的数据可以包括文本,排除文本,文本截取,日期加月份,数字比较大小过滤器,在字符前后添加字符.