网页信息抓取软件(网页信息收集器的功能特色及特色下载体验!! )
优采云 发布时间: 2021-10-30 11:00网页信息抓取软件(网页信息收集器的功能特色及特色下载体验!!
)
网页信息采集器是一款绿色、小巧、实用的网页信息采集软件。互联网上资源信息海量,各行各业的信息无所不在。网页信息采集器可以方便的采集到某个网站的信息内容。比如某个论坛所有注册会员的E-MAIL列表,某个行业的商家名录网站,某个下载的所有软件列表网站等等。操作简单方便,普通用户更容易掌握,有需要的用户不妨下载体验!
特征
1、执行任务
根据建立的任务信息保存和提取网页,或通过“双击”任务启动此功能
2、创建、复制、修改、删除任务
创建、复制、修改和删除任务信息
3、默认选项
设置默认工作路径(默认为当前程序目录下的WorkDir文件夹)
设置提取测试的默认数量(默认为10)
设置默认文本分隔符(默认为 *)
4、创建和编辑任务信息
任务名称:在默认工作文件夹下生成一个以此命名的文件夹。
登录地址:部分网站需要登录查看网页内容的,填写登录页面地址。执行任务时,软件会打开这个登录页面让你登录这个网站
序数格式类型网页,非序数格式类型网页:
这里的序数格式和非序数格式主要是指提取的地址是否只是一个数字变化。例如,类似于:
① 和属于序数格式
② sum 是非序数格式
列表地址:类型为“无序格式类型net”时,列表第一页的链接地址
提取地址:由实际保存的网页地址的公共部分+*组成。
例如,提取:
① 解压地址为*.html 和谐的话
②和声提取地址为*./*.html
翻页地址:为列表页“下一页”的链接地址,更改部分用*代替。
Pages start:开始抓取的页数
End of pages:停止抓取的页数
当前页码:已提取的页数
保存页数:保存页数
任务详细说明: 任务详细说明