网页内容抓取 php(php-thinkphp框架抓取网站内容保存到本地的实例详解)

优采云 发布时间: 2021-10-07 14:23

  网页内容抓取 php(php-thinkphp框架抓取网站内容保存到本地的实例详解)

  本篇文章主要介绍了php-thinkphp框架捕获网站的内容并保存到本地实例的详细信息。有需要的朋友可以参考。

  批量下载网站上的图片

  php代码部分:

  public function download()<br />{<br /> $http = new \Org\Net\Http();<br /> $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";<br /> $localUrl = "upload/bookcover/";<br /> $reg = "|showImg/('(.+)'/);|";<br /> $i = 1;<br /> do {<br /> $filename = substr("000" . $i, -3) . ".htm";<br /> $ch = curl_init();<br /> curl_setopt($ch, CURLOPT_URL, $url_pref . $filename);<br /> curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);<br /> curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);<br /> curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);<br /> $html = curl_exec($ch);<br /> curl_close($ch);<br /> $result = preg_match_all($reg, $html, $out, PREG_PATTERN_ORDER);<br /> if ($result == 1) {<br /> $picUrl = $out[1][0];<br /> $picFilename = substr("000" . $i, -3) . ".jpg";<br /> $http->curlDownload($picUrl, $localUrl . $picFilename);<br /> }<br /> $i = $i + 1;<br /> } while ($result == 1);<br /> echo "下载完成";<br />}

  代码写了一个循环,从第一页开始,直到在网页中找不到图片

  抓取网页内容后,将网页中的图片与正则表达式匹配并存储在本地服务器上

  

  以上就是本文php-thinkphp框架抓取网站内容并保存到本地的全部内容。如有疑问,请留言或到本站社区讨论讨论。感谢您的阅读。我希望能帮助到大家。谢谢您的意见。本站的支持!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线