php curl抓取网页指定内容(网站制作居于LINUX+PHP+MYSQL框架,循环取出需要的内容)

优采云 发布时间: 2021-11-20 05:16

  php curl抓取网页指定内容(网站制作居于LINUX+PHP+MYSQL框架,循环取出需要的内容)

  (.*?)

  (.*?)

  #是';

  preg_match_all($regular,$html_data,$connect);//进行正则匹配得到你想要的

  //循环出需要的内容数组

  foreach($connect as $k =>$var){

  if($k==2 || $k==3|| $k==5|| $k==7){

  $b = array_merge(array_filter($connect[$k]));

  $array[]=$b;

  }

  }

  获取到数据数组后,可以根据需要添加数据

  内容详情需要爬取获取新闻内容页面的链接,也需要使用curl获取信息

  需要注意的是,正则表达式中的html需要和页面的格式一致。可以到原来的网站,右键查看源码,查看格式,复制html即可抓包。如果仍然无法捕获 内容可能格式不正确。有些地方可能会有更少或更多的空间。这时候直接在标签之间(.*?)。也可以一点一点的进行匹配,看看是哪个部分不匹配。

  方微网络为客户提供网站开发定制服务,网站生产生活在LINUX+PHP+MYSQL框架下,欢迎客户咨询我们的建站*敏*感*词*

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线