php 抓取网页生成图片(2019独角兽企业重金招聘Python工程师标准(gt;gt))
优采云 发布时间: 2021-11-04 11:10php 抓取网页生成图片(2019独角兽企业重金招聘Python工程师标准(gt;gt))
2019独角兽企业重磅招聘Python工程师标准>>>
本程序实现了网页源代码抓取、图片链接获取、分析、同图链接合并功能等功能,实现图片抓取功能。利用PHP强大的网络内容处理功能,抓取指定网站上的所有图片,并保存到当前目录。以下是代码:
/';
$ret = preg_match_all($reg_tag, $site_content, $match_result);
fclose($site_fd);
return $match_result[1];
}
/* 对图片链接进行修正 */
function revise_site($site_list, $base_site){
foreach($site_list as $site_item) {
if (preg_match('/^http/', $site_item)) {
$return_list[] = $site_item;
}else{
$return_list[] = $base_site."/".$site_item;
}
}
return $return_list;
}
/*得到图片名字,并将其保存在指定位置*/
function get_pic_file($pic_url_array, $pos){
$reg_tag = '/.*\/(.*?)$/';
$count = 0;
foreach($pic_url_array as $pic_item){
$ret = preg_match_all($reg_tag,$pic_item,$t_pic_name);
$pic_name = $pos.$t_pic_name[1][0];
$pic_url = $pic_item;
print("Downloading ".$pic_url." ");
$img_read_fd = fopen($pic_url,"r");
$img_write_fd = fopen($pic_name,"w");
$img_content = "";
while(!feof($img_read_fd)){
$img_content .= fread($img_read_fd,1024);
}
fwrite($img_write_fd,$img_content);
fclose($img_read_fd);
fclose($img_write_fd);
print("[OK] ");
}
return 0;
}
function main(){
/* 待抓取图片的网页地址 */
$site_name = "http://image.cn.yahoo.com";
$img_url = get_img_url($site_name);
$img_url_revised = revise_site($img_url, $site_name);
$img_url_unique = array_unique($img_url_revised); //unique array
get_pic_file($img_url_unique,"./");
}
main();
?>
转载于: