网站通用信息采集器V10正式版

优采云 发布时间: 2020-08-06 13:26

  

  网站信息采集器是一种易于使用的信息采集工具. 该软件会自动获取网站上的信息,并获取所有信息并将其发布到您的网站. 网站信息采集器具有多级页面采集和自动添加采集. 信息,多页新闻自动抓取等功能,无需手动,自动网站更新.

  网站信息采集器功能

  1. 自动信息采集和添加

  网站爬网的目的主要是添加到您的网站,该软件可以实现采集和添加的自动完成. 其他网站刚刚更新的信息将在五分钟内自动发送到您的网站.

  2. 还捕获了需要登录的网站

  对于需要登录才能查看信息内容的网站,优采云采集器网站可以轻松登录并采集,即使有验证码,也可以通过登录来采集所需信息.

  3. 可以下载任何类型的文件

  如果您需要采集图片之类的二进制文件,则只需设置网站优采云采集器,就可以在本地保存任何类型的文件.

  4. 多级页面采集

  可以同时采集多级页面的内容. 如果一条信息分布在许多不同的页面上,则优采云采集器网站还可以自动识别该信息

  不要在多级页面上实现采集

  5. 自动识别Javascript和其他特殊URL

  许多网页链接到javascript: openwin('1234')等特殊URL,而不是通常的开头,该软件还可以自动识别和捕获内容

  6. 自动获取每个类别的网址

  例如,供需信息通常具有很多类别. 通过简单设置软件,即可自动捕获这些类别URL,并对捕获的信息进行自动分类

  7. 多页新闻自动爬网,广告过滤

  某些新闻中有下一页,该软件还可以捕获所有页面. 并且可以同时保存捕获的新闻中的图片和文字,并可以过滤掉广告

  8. 自动破解防盗链

  许多下载网站都有防盗链. 直接输入URL不会捕获内容,但是该软件可以自动破解防盗链,以确保您可以捕获所需内容.

  此外,已添加了模拟手动提交的功能. 租赁站点的asp + access空间也可以远程发布. 实际上,它还可以模拟所有网页提交操作. 您可以批量注册成员并模拟群组消息.

  更新日志

  1. 全新的分层设置,可以为每个层设置特殊选项,摆脱以前的默认3层限制

  2. 一次爬取任何多级分类. 过去,有必要先捕获每个类别的URL,然后再捕获每个类别

  3. 图片下载,自定义文件名,以前无法重命名

  4. 新闻内容页面合并设置更简单,更通用,更强大

  5. 模拟的点击更通用,更简单. 先前的模拟点击需要特殊设置,并且使用起来很复杂

  6. 可以根据内容判断重复项,而根据过去的URL判断重复项.

  7. 采集完成后,允许执行自定义vbs脚本endget.vbs,并允许在发行后执行endpub.vbs. 在vbs中,您可以自己编写数据处理功能

  8. 导出的数据可以包括文本,排除文本,文本截取,日期加月份,数字比较大小过滤器,在字符前后添加字符.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线