php抓取网页标签( PHP实现网页内容html标签补全和过滤的方法实例解析)

优采云 发布时间: 2021-09-26 12:07

  php抓取网页标签(

PHP实现网页内容html标签补全和过滤的方法实例解析)

  用PHP完成和过滤网页内容HTML标记的方法摘要[2种方法]

  更新时间:2017年4月27日10:58:53作者:网站

  本文章主要介绍了PHP中HTML标记完成和web内容过滤的方法,并以实例的形式分析了PHP常见的标记检查、完成、关闭、过滤等相关操作技巧。有需要的朋友可以参考

  本文介绍了在PHP中完成HTML标记和过滤网页内容的方法。与您分享,供您参考,如下所示:

  如果网页内容的HTML标记未完全显示,某些表标记不完整,导致页面混乱,或者收录内容之外的本地HTML页面,我们可以编写一个函数方法来完成HTML标记并过滤掉无用的HTML标记

  PHP使HTML标记完整并自动关闭。过滤函数方法1:

  代码:

  

function closetags($html) {

preg_match_all('##iU', $html, $result);

$closedtags = $result[1];

$len_opened = count($openedtags);

if (count($closedtags) == $len_opened) {

return $html;

}

$openedtags = array_reverse($openedtags);

for ($i=0; $i < $len_opened; $i++) {

if (!in_array($openedtags[$i], $closedtags)) {

$html .= '';

}else {

unset($closedtags[array_search($openedtags[$i], $closedtags)]);

}

}

return $html;

}

  Closetags()解析:

  array_u;Reverse():此函数反转原创数组中的元素,创建新数组并返回。如果第二个参数指定为true,则元素的键名保持不变,否则键名将丢失

  array_usearch():array_usearch(value,array,strict),与类似array()中的相同,在数组中查找键值。如果找到该值,则返回匹配元素的键名。如果未找到,则返回false。如果第三个参数strict指定为true,则仅当数据类型和值一致时,才会返回相应元素的键名

  PHP使HTML标记完整并自动关闭。过滤函数方法2:

  

function checkhtml($html) {

$html = stripslashes($html);

preg_match_all("/\ $val) {

$string[$key] = shtmlspecialchars($val);

}

} else {

$string = preg_replace('/&((#(\d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{2,5});)/', '&\\1',

str_replace(array('&', '"', ''), array('&', '"', ''), $string));

}

return $string;

}

  Checkhtml($HTML)解析:

  Stripsplashes():函数删除addslashes()函数添加的反斜杠。此函数用于清理从数据库或HTML表单检索的数据

  有关PHP的更多信息,感兴趣的读者可以查看本网站上的主题:PHP数据结构和算法教程、PHP编程算法摘要、PHP排序算法摘要、PHP常见遍历算法和技能摘要、PHP数学运算技能摘要、PHP数组运算技能、,PHP字符串用法总结,以及PHP中常见数据库操作技巧总结

  我希望这篇文章能对你的PHP编程有所帮助

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线