snoopy php网页抓取工具( 老是/php/Snoopy.gz本地下载类类特征)
优采云 发布时间: 2021-10-04 18:04snoopy php网页抓取工具(
老是/php/Snoopy.gz本地下载类类特征)
snoopy PHP 版网页客户端提供本地下载
更新时间:2008-04-15 21:29:47 作者:
Snoopy是一个很好的仿网络客户端的php类,但是本地下载很少,国外下载又麻烦又慢,所以弄了这个网站给大家下载
magpierss中用的是史努比,让我有点兴趣研究这个东东。在SF上,我找到了这个源代码。其实是一个类,不过别笑,功能很强大。
我翻译了官方介绍(汗...最近一直当翻译)
Snoopy是一个php类,用来模仿网页浏览器的功能,可以完成获取网页内容和发送表单的任务。
以下是它的一些特点:
1、 方便抓取网页内容
2、 方便抓取网页文字(去掉HTML代码)
3、方便抓取网页链接
4、支持代理主机
5、支持基本用户/密码认证方式
6、支持自定义用户代理、referer、cookies 和 header 内容
7、支持浏览器转向,可以控制转向深度
8、 可以将网页中的链接扩展为高质量的url(默认)
9、方便提交数据和获取返回值
10、支持跟踪HTML框架(v0.92新增)
11、 支持重定向时传递cookies
下面是一个简单的例子,比如我们抓取我博客的文字
^_^,还不错,比如抢链接
哎,效果不错,都是我们需要的网址,没有/blog/read.php/85.htm之类的。
还要提交数据供以后测试。. .
元马/php/Snoopy-1.2.3.tar.gz本地下载