php用正则表达抓取网页中文章(突袭网网站的支持!-->)

优采云 发布时间: 2021-12-28 08:00

  php用正则表达抓取网页中文章(突袭网网站的支持!-->)

  s">PHP正则表达式抓取标签特定属性值的方法

  作者:宇轩网字体:【增减】类型:转载时间:2016-07-14我要评论

  本文主要介绍用PHP正则表达式抓取标签特定属性值的方法的相关信息。非常好,有参考价值。有需要的朋友可以参考>

  学了几天php正则,抓了一些网站数据,发现写正则又每次都重新抓很麻烦,所以想写一个通用的接口,抓具体属性值的具体标签,直接上传代码。

  

//$html-被查找的字符串 $tag-被查找的标签 $attr-被查找的属性名 $value-被查找的属性值

function get_tag_data($html,$tag,$attr,$value){

$regex = "/(.*?)/is";

echo $regex."

";

preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);

return $matches[1];

}

//返回值为数组 查找到的标签内的内容

  这是一个例子

  

header("Content-type: text/html; charset=utf-8");

$temp = '

首页

日志

LOFTER

相册

博友

关于我

';

$result = get_tag_data($temp,"a","class","fc01");

var_dump($result);

  输出结果是

  

array(6) { [0]=> string(6) "首页" [1]=> string(6) "日志" [2]=> string(6) "LOFTER" [3]=> string(6) "相册" [4]=> string(6) "博友" [5]=> string(9) "关于我" }

  你可以看到源代码

  

array(6) {

[0]=>

string(6) "首页"

[1]=>

string(6) "日志"

[2]=>

string(6) "LOFTER"

[3]=>

string(6) "相册"

[4]=>

string(6) "博友"

[5]=>

string(9) "关于我"

}

  第一次写博客的时候很紧张。我希望它对大家有用。也希望大家能指出代码中的问题。我不做很多测试~~

  以上就是小编给大家介绍的用PHP正则表达式抓取标签的具体属性值的方法。我希望它会对你有所帮助。如果您有任何问题,请给我留言。小编会及时回复您。. 非常感谢您对raid网站的支持!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线