php用正则表达抓取网页中文章(突袭网网站的支持!-->)
优采云 发布时间: 2021-12-28 08:00php用正则表达抓取网页中文章(突袭网网站的支持!-->)
s">PHP正则表达式抓取标签特定属性值的方法
作者:宇轩网字体:【增减】类型:转载时间:2016-07-14我要评论
本文主要介绍用PHP正则表达式抓取标签特定属性值的方法的相关信息。非常好,有参考价值。有需要的朋友可以参考>
学了几天php正则,抓了一些网站数据,发现写正则又每次都重新抓很麻烦,所以想写一个通用的接口,抓具体属性值的具体标签,直接上传代码。
//$html-被查找的字符串 $tag-被查找的标签 $attr-被查找的属性名 $value-被查找的属性值
function get_tag_data($html,$tag,$attr,$value){
$regex = "/(.*?)/is";
echo $regex."
";
preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);
return $matches[1];
}
//返回值为数组 查找到的标签内的内容
这是一个例子
header("Content-type: text/html; charset=utf-8");
$temp = '
';
$result = get_tag_data($temp,"a","class","fc01");
var_dump($result);
输出结果是
array(6) { [0]=> string(6) "首页" [1]=> string(6) "日志" [2]=> string(6) "LOFTER" [3]=> string(6) "相册" [4]=> string(6) "博友" [5]=> string(9) "关于我" }
你可以看到源代码
array(6) {
[0]=>
string(6) "首页"
[1]=>
string(6) "日志"
[2]=>
string(6) "LOFTER"
[3]=>
string(6) "相册"
[4]=>
string(6) "博友"
[5]=>
string(9) "关于我"
}
第一次写博客的时候很紧张。我希望它对大家有用。也希望大家能指出代码中的问题。我不做很多测试~~
以上就是小编给大家介绍的用PHP正则表达式抓取标签的具体属性值的方法。我希望它会对你有所帮助。如果您有任何问题,请给我留言。小编会及时回复您。. 非常感谢您对raid网站的支持!