php用正则表达抓取网页中文章( 老是/php/Snoopy.gz本地下载类类特征)
优采云 发布时间: 2022-01-18 14:18php用正则表达抓取网页中文章(
老是/php/Snoopy.gz本地下载类类特征)
史努比PHP版网络客户端提供本地下载
更新时间:2008-04-15 21:29:47 作者:
snoopy是一个很好的模仿网络客户端的php类,但是本地下载的很少,国外下载又麻烦又慢,所以弄了这个网站给大家下载
史努比在magpierss中使用,这让我有点兴趣研究这个dong dong。在 SF 上,我找到了这个源代码。它其实是一个类,但不要笑,功能很强大。
官方介绍,我翻译了(汗……最近一直在做翻译)
snoopy 是一个模仿网络浏览器功能的 php 类,它可以完成获取网页内容和发送表单的任务。
以下是它的一些特点:
1、轻松抓取网页内容
2、轻松抓取网页文本(去掉HTML代码)
3、方便抓取网页的链接
4、支持代理主机
5、支持基本用户/密码认证方式
6、支持自定义用户代理、referer、cookies和header内容
7、支持浏览器转向和控制转向深度
8、 可以将网页中的链接扩展成高质量的url(默认)
9、方便提交数据并获取返回值
10、支持跟踪HTML框架(v0.92增加)
11、支持重定向时传递cookies
下面是一个简单的例子,比如我们抓取我博客的文字
^_^,还不错,比如抢链接
哎,效果不错,还有我们需要的url,没有/blog/read.php/85.htm这样的东西。
还要为以后测试的人提交数据。. .
元马/php/Snoopy-1.2.3.tar.gz本地下载