php用正则表达抓取网页中文章( 老是/php/Snoopy.gz本地下载类类特征)

优采云 发布时间: 2022-01-18 14:18

  php用正则表达抓取网页中文章(

老是/php/Snoopy.gz本地下载类类特征)

  史努比PHP版网络客户端提供本地下载

  更新时间:2008-04-15 21:29:47 作者:

  snoopy是一个很好的模仿网络客户端的php类,但是本地下载的很少,国外下载又麻烦又慢,所以弄了这个网站给大家下载

  史努比在magpierss中使用,这让我有点兴趣研究这个dong dong。在 SF 上,我找到了这个源代码。它其实是一个类,但不要笑,功能很强大。

  官方介绍,我翻译了(汗……最近一直在做翻译)

  snoopy 是一个模仿网络浏览器功能的 php 类,它可以完成获取网页内容和发送表单的任务。

  以下是它的一些特点:

  1、轻松抓取网页内容

  2、轻松抓取网页文本(去掉HTML代码)

  3、方便抓取网页的链接

  4、支持代理主机

  5、支持基本用户/密码认证方式

  6、支持自定义用户代理、referer、cookies和header内容

  7、支持浏览器转向和控制转向深度

  8、 可以将网页中的链接扩展成高质量的url(默认)

  9、方便提交数据并获取返回值

  10、支持跟踪HTML框架(v0.92增加)

  11、支持重定向时传递cookies

  下面是一个简单的例子,比如我们抓取我博客的文字

  ^_^,还不错,比如抢链接

  哎,效果不错,还有我们需要的url,没有/blog/read.php/85.htm这样的东西。

  还要为以后测试的人提交数据。. .

  元马/php/Snoopy-1.2.3.tar.gz本地下载

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线