c 抓取网页数据(网页数据结构化抓取工具(:Powercap网页化))
优采云 发布时间: 2022-01-13 01:10c 抓取网页数据(网页数据结构化抓取工具(:Powercap网页化))
软件名称:Powercap Web数据结构化爬虫绿色版
软件版本:1.6
软件大小:5.6mb
授权方式:试用版
工作类型:国产软件
应用平台:Win2000/XP/2003/Win7/Vista
软件语言:简体中文
开发者网站:
开发者邮箱:
下载链接:
软件界面图:
软件介绍:
PowerCap是一个专业的网络信息采集解决方案,可以采集任何类型的网站采集信息,如新闻网站、电子商务网站、论坛、求职网站等支持登录采集、多页采集、多页合并、增量采集、点击导航、POST采集、脚本支持,内置文字提取算法,自动采集图片、flash等附件。可以发布到任何ODBC数据库、Excel、Access,并通过网页在线发布。
最新的 1.6 版本目前支持以下功能:
* 采集 自动登录或手动登录后的页面
* 支持 Javascript 脚本生成的页面
* 定时自动抓取
* 文本提取算法自动去除页面中的广告
* 增量采集
* 多页合并功能
* 自动提取分布在多个页面上的信息
* 自动提取图片、flash等附件
* 点击导航
* 向导式定义抽取规则,抽取方式丰富(前后标志、正则表达式、智能字段、内置字段等)
* 发布采集
* 采集页面保存为单个文件
* 使用插件处理 采集 页面
* 支持VBScript、JavaScript处理采集结果
* 输出到文本文件、Excel、Access、任何支持 ODBC 的数据库,网页在线发布
* 全局替换抓取的内容
* 意外退出保护,服务器无人值守抢夺
与以前的抓取软件相比的优势:
* 采集防盗链技术网站:目前很多网站为了防止采集都采用了防盗链技术,PowerCap有效支持防盗链采集 技术
* JavaScript输出网站:传统的采集技术对于使用大量脚本输出页面内容的页面无能为力。我们在 PowerCap 中独特的脚本支持技术可以处理这种 网站
* 脚本跳转:对于使用脚本进行页面导航的网站,PowerCap可以完美支持
* POST采集:传统软件只能在第一级起始URL使用POST采集,而Powercap可以在任何一级POST采集
* 限速采集:可以限制网站的爬行速度,防止被一些网站挡住
官方网站: