php如何抓取网页数据( php抓取网页数据第一种file_get_contents抓取file() )
优采云 发布时间: 2021-12-23 19:14php如何抓取网页数据(
php抓取网页数据第一种file_get_contents抓取file()
)
php抓取网页数据
header("Content-type: text/html; charset=utf-8");
//$url = "https://www.cnblogs.com/chenliyang/p/6554647.html";
//$html = file_get_contents($url);
////如果出现中文乱码使用下面代码
////$getcontent = iconv("gb2312", "utf-8",$html);
//echo "".$html.""; //获取整个内容
第一个 file_get_contents 捕获
file_get_contents() 将整个文件读入一个字符串。
此函数是将文件内容读入字符串的首选方法。如果服务器操作系统支持,也会使用内存映射技术来提升性能。
$url = 'http://www.baidu.com'; //这儿填页面地址
$info=file_get_contents($url);
//preg_match('|(.*?)|i',$info,$m);
$m1=preg_match('|(.*?)|',$info,$m);
//var_dump($m1);
echo $m[1]; //获取标题
echo '
';
第二种卷曲抓取,
$url = "http://www.baidu.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);
$m1=preg_match('|(.*?)|',$html,$ms);
//echo "".$html.""; //获取整个内容
//curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
echo $ms[1]; //获取标题
echo '
';