ASP信息采集程序图解教程
优采云 发布时间: 2020-08-21 01:24ASP信息采集程序图解教程
官方网址:
运行环境:B/S,Win9X/Win2000/WinXP/Win2003,浏览器
【界面截图】
document.body.clientWidth-300) {this.height=(document.body.clientWidth-300)*this.height/this.width;this.width=document.body.clientWidth-300}" border=0 galleryImg="no">
【软件简介】
ASP神偷(AspStealer)可以把远程网站上的数据(如新闻、博客文章、客户资料等)一次性、无限制记录数、全手动保存到自己网站的数据库的程序。
与其他的ASP歹徒程序相比,ASP神偷(AspStealer)具有如下优点:
1.ASP劫匪来自其他网站,它随着该网站的更新而更新,如果目标网站无法访问、数据有误或则改变页面结构,您的网站也难以读取到相关数据,有时还须要更改ASP歹徒相应的程序;ASP神偷是采用一次性、无限制记录数、全手动保存到自己网站数据库的方法采集数据的,不会遭到目标网站的任何影响。
2.ASP歹徒属于远程调用,访问远程速率较慢;ASP神偷属于同一网站数据库调用,您的网站有多快,访问速率就有多快。
【采集范例】
ASP神偷 Beta1.0 支持采集如 类型(文件名.asp?ClassID=数值)的网址。
以采集(私房博客)的文章为例,步骤如下:
1.打开文章列表页,
2.发现文章链接页网址的规律性,如 view.asp?ClassID=数值 ,正常这种数值都是三位数或四位数的;也有网站是采用多位随机数做为ID,如view.asp?ClassID=21(ClassID=年月日+五位随机数),或21.htm(年月日+五位随机数.htm),ASP神偷 Beta1.0 暂不支持后两种类型的网址;
3.使用ASP神偷 Beta1.0 的默认设置,直接点击『预览』,即可采集从ClassID=177开始至ClassID=187的十篇文章的标题;
4.此例从ClassID=177开始至ClassID=187,采集十篇文章的内容;
5.在ASP神偷 Beta1.0 的 『网址』填入 『』,『从』填入『177』,『到』填入『187』;
6.用浏览器打开 页面,点击『菜单栏』->『查看』->『源文件』,记事本将打开该页面的html源文件;
7.找出在页面html源文件内正文内容前的一段标识符,该标识符最好是惟一的整句代码,可用Ctrl+F在记事本内查询您找到的这段标识符,验证该标识符的唯一性,以保证采集数据的有效性(如下图);
document.body.clientWidth-300) {this.height=(document.body.clientWidth-300)*this.height/this.width;this.width=document.body.clientWidth-300}" border=0 galleryImg="no">
8.将惟一前标识符拷入ASP神偷 Beta1.0 的『前标示』 栏目,『右移』填入『0』;
9.用同样的方式,找出正文内容后的那段标识符,拷入的『后标示』 栏目,『左移』填入『0』;
10.注意:前标识符和后标识符必须是整篇文章共同拥有的,不能富含某篇或某几篇文章独有的html代码,否则采集的信息可能会出错,最终的采集设置(如下图);
document.body.clientWidth-300) {this.height=(document.body.clientWidth-300)*this.height/this.width;this.width=document.body.clientWidth-300}" border=0 galleryImg="no">
11.点击『预览』,即可采集到您要的内容了。
备注:ASP神偷 Beta1.0 目前限制预览前20条记录,且暂不开通『导入数据库』功能;使用者勿将该程序用于非法用途,否则后果自负!使用过程中碰到任何的困局、意见、建议或则找不出前后标识符的用户,欢迎在 『发表评论』,我们将会在第一时间为您提供帮助!
更多的ASP信息采集程序图解教程请到峰会查看: