php curl抓取网页指定内容( PHP最后更新:2021年6月17日:1051. )

优采云 发布时间: 2021-10-18 10:15

  php curl抓取网页指定内容(

PHP最后更新:2021年6月17日:1051.

)

  php curl 网页内容出现乱码、不可用的解决方法

  分类:PHP

  上次更新:2021 年 6 月 17 日

  点击次数:105

  1.如果使用curl请求网页,多方网页使用gzip压缩,获取的内容可能会出现乱码。

  解决方案

  $url = 'http://www.du52.com';

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22");

curl_setopt($ch, CURLOPT_ENCODING ,'gzip'); //加入gzip解析

$output = curl_exec($ch);

$info = curl_getinfo($ch);

curl_close($ch);

var_dump($info);

var_dump($output);

  2.如果请求的网页被重定向,通过header('Location:'),那么请求的网页数据可能为空,即无法获取内容。

  解决方案

  $url = 'http://www.mkv8.com';

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22");

curl_setopt($ch, CURLOPT_FOLLOWLOCATION ,1); //加入重定向处理

$output = curl_exec($ch);

$info = curl_getinfo($ch);

curl_close($ch);

var_dump($info);

var_dump($output);

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线