php网页抓取图片(,如下:file_get_contents函数(,.) )

优采云 发布时间: 2022-03-14 00:09

  php网页抓取图片(,如下:file_get_contents函数(,.)

)

  本文章主要介绍PHP中使用file_get_contents抓取网页中文乱码问题的解决方法,可以通过curl配置gzip选项来解决,有一定的参考价值,需要的朋友可以参考

  p>

  本文的例子介绍了如何使用PHP中的file_get_contents来抓取网页的中文乱码问题。分享给大家,供大家参考。具体方法如下:

  file_get_contents 函数原本是一个很好的php原生和远程文件操作函数。它让我们可以毫不费力地直接下载远程数据,但是当我用它来阅读网页时,我会遇到一些问题。页面乱码,这里给大家总结一下具体的解决办法。

  根据网上朋友的说法,原因可能是服务器开启了GZIP压缩。下面是用firebug查看我的网站的头信息。开启gzip,请求头信息的原创头信息如下:

  复制代码代码如下:

  接受 text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

  接受编码 gzip,放气

  接受-语言 zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3

  连接保持活动

  Cookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.132685041傻瓜式887.3.utmcsr=google|utmccn=(有机)|utmcmd=有机|utmctr=%E4%BB%BB%E4% BD%95%E9%A1%B9%E7% 9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE% 80%E5%8D%95%20现场%3A; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401

  主机

  用户代理 Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0

  从头信息可以看出Content-Encoding项是Gzip。

  解决方法比较简单,就是用curl代替file_get_contents来获取,然后在curl配置参数中加一个,代码如下:

  复制代码代码如下:

  curl_setopt($ch, CURLOPT_ENCODING, "gzip");

  今天用file_get_contents抓图的时候,一开始没发现这个问题,费了好大劲才找到。

  使用内置的 zlib 库。如果服务器已经安装了zlib库,可以通过以下代码轻松解决乱码问题。代码如下:

  复制代码代码如下:

  $data = file_get_contents("compress.zlib://".$url);

  希望本文对您的 PHP 编程有所帮助。

  ,

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线