php如何抓取网页内容( 这里有新鲜出炉的PHP设计模式,程序狗速度看过来! )
优采云 发布时间: 2022-03-02 06:15php如何抓取网页内容(
这里有新鲜出炉的PHP设计模式,程序狗速度看过来!
)
php爬取网页内容的详细示例
这里有新鲜出炉的PHP设计模式,程序狗的速度来了!
PHP开源脚本语言
PHP(外文名:Hypertext Preprocessor,中文名:“超文本预处理器”)是一种通用的开源脚本语言。文法吸收了C语言、Java和Perl的特点。入门门槛低,易学,应用广泛。它主要适用于Web开发领域。PHP的文件扩展名是php。
这篇文章主要介绍php抓取网页内容示例详解的相关信息。这里提供两种实现方式,希望对大家有所帮助,有需要的朋友可以参考以下
php爬取网页内容的详细示例
方法一:
使用file_get_contents方法来实现
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";$html = file_get_contents($url);//如果出现中文乱码使用下面代码//$getcontent = iconv("gb2312", "utf-8",$html);echo "".$html."";
代码很简单,一看就懂,不用解释。
方法二:
使用 curl 实现
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);$html = curl_exec($ch);curl_close($ch); echo "".$html."";
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
添加这段代码意味着如果请求被重定向,则可以访问最终的请求页面,否则请求的结果将显示如下:
Object movedObject MovedThis object may be found here</a>.