php 循环抓取网页内容(程序开发中自动打开某个页面要怎么操作?技术频道)

优采云 发布时间: 2022-04-08 15:45

  php 循环抓取网页内容(程序开发中自动打开某个页面要怎么操作?技术频道)

  如何在程序开发中自动打开一个页面?其实这需要抓取文本,然后保存到本地。爱站技术频道的编辑总结了ThinkPHP获取到的网站内容,并保存到本地实例中。不要把精彩的内容留给你立即呈现。

  thinkphp抓取网站的内容并保存到本地的一个例子

  我需要编写这样的示例并从电子教科书网站下载电子书。

  电子教科书网站的电子书就是把书的每一页都当成一张图片,然后一本书有很多张图片。我需要批量下载图片。

  这是代码部分:

  

public function download() {

$http = new \Org\Net\Http();

$url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";

$localUrl = "Public/bookcover/";

$reg="|showImg\('(.+)'\);|";

$i=1;

do {

$filename = substr("000".$i,-3).".htm";

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url_pref.$filename);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

$html = curl_exec($ch);

curl_close($ch);

$result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER);

if($result==1) {

$picUrl = $out[1][0];

$picFilename = substr("000".$i,-3).".jpg";

$http->curlDownload($picUrl, $localUrl.$picFilename);

}

$i = $i+1;

} while ($result==1);

echo "下载完成";

}

  这里我以人民教育版七年级地理上册为例

  网页从001.htm开始,然后数字不断增加

  每个网页都有一张图片,就是对应教材的内容,以图片的形式展示教材的内容

  我的代码在做一个循环,从第一页开始,直到在网页中找不到图片

  抓取网页内容后,将网页中的图片抓取到本地服务器

  抓取后的实际效果:

  

  本文为ThinkPHP获取网站内容并保存到本地实例的爱站技术频道小编分享的内容。每个人都必须仔细研究它才能知道如何操作。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线