php网页抓取图片(,如下:file_get_contents函数(,.) )
优采云 发布时间: 2022-03-14 00:09php网页抓取图片(,如下:file_get_contents函数(,.)
)
本文章主要介绍PHP中使用file_get_contents抓取网页中文乱码问题的解决方法,可以通过curl配置gzip选项来解决,有一定的参考价值,需要的朋友可以参考
p>
本文的例子介绍了如何使用PHP中的file_get_contents来抓取网页的中文乱码问题。分享给大家,供大家参考。具体方法如下:
file_get_contents 函数原本是一个很好的php原生和远程文件操作函数。它让我们可以毫不费力地直接下载远程数据,但是当我用它来阅读网页时,我会遇到一些问题。页面乱码,这里给大家总结一下具体的解决办法。
根据网上朋友的说法,原因可能是服务器开启了GZIP压缩。下面是用firebug查看我的网站的头信息。开启gzip,请求头信息的原创头信息如下:
复制代码代码如下:
接受 text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
接受编码 gzip,放气
接受-语言 zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
连接保持活动
Cookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.132685041傻瓜式887.3.utmcsr=google|utmccn=(有机)|utmcmd=有机|utmctr=%E4%BB%BB%E4% BD%95%E9%A1%B9%E7% 9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE% 80%E5%8D%95%20现场%3A; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401
主机
用户代理 Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0
从头信息可以看出Content-Encoding项是Gzip。
解决方法比较简单,就是用curl代替file_get_contents来获取,然后在curl配置参数中加一个,代码如下:
复制代码代码如下:
curl_setopt($ch, CURLOPT_ENCODING, "gzip");
今天用file_get_contents抓图的时候,一开始没发现这个问题,费了好大劲才找到。
使用内置的 zlib 库。如果服务器已经安装了zlib库,可以通过以下代码轻松解决乱码问题。代码如下:
复制代码代码如下:
$data = file_get_contents("compress.zlib://".$url);
希望本文对您的 PHP 编程有所帮助。
,