c 抓取网页数据(网页数据结构化抓取工具(:Powercap网页化))

优采云 发布时间: 2022-01-13 01:10

  c 抓取网页数据(网页数据结构化抓取工具(:Powercap网页化))

  软件名称:Powercap Web数据结构化爬虫绿色版

  软件版本:1.6

  软件大小:5.6mb

  授权方式:试用版

  工作类型:国产软件

  应用平台:Win2000/XP/2003/Win7/Vista

  软件语言:简体中文

  开发者网站:

  开发者邮箱:

  下载链接:

  软件界面图:

  软件介绍:

  PowerCap是一个专业的网络信息采集解决方案,可以采集任何类型的网站采集信息,如新闻网站、电子商务网站、论坛、求职网站等支持登录采集、多页采集、多页合并、增量采集、点击导航、POST采集、脚本支持,内置文字提取算法,自动采集图片、flash等附件。可以发布到任何ODBC数据库、Excel、Access,并通过网页在线发布。

  最新的 1.6 版本目前支持以下功能:

  * 采集 自动登录或手动登录后的页面

  * 支持 Javascript 脚本生成的页面

  * 定时自动抓取

  * 文本提取算法自动去除页面中的广告

  * 增量采集

  * 多页合并功能

  * 自动提取分布在多个页面上的信息

  * 自动提取图片、flash等附件

  * 点击导航

  * 向导式定义抽取规则,抽取方式丰富(前后标志、正则表达式、智能字段、内置字段等)

  * 发布采集

  * 采集页面保存为单个文件

  * 使用插件处理 采集 页面

  * 支持VBScript、JavaScript处理采集结果

  * 输出到文本文件、Excel、Access、任何支持 ODBC 的数据库,网页在线发布

  * 全局替换抓取的内容

  * 意外退出保护,服务器无人值守抢夺

  与以前的抓取软件相比的优势:

  * 采集防盗链技术网站:目前很多网站为了防止采集都采用了防盗链技术,PowerCap有效支持防盗链采集 技术

  * JavaScript输出网站:传统的采集技术对于使用大量脚本输出页面内容的页面无能为力。我们在 PowerCap 中独特的脚本支持技术可以处理这种 网站

  * 脚本跳转:对于使用脚本进行页面导航的网站,PowerCap可以完美支持

  * POST采集:传统软件只能在第一级起始URL使用POST采集,而Powercap可以在任何一级POST采集

  * 限速采集:可以限制网站的爬行速度,防止被一些网站挡住

  官方网站:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线