php抓取网页标签( PHP实现网页内容html标签补全和过滤的方法实例解析)
优采云 发布时间: 2021-09-26 12:07php抓取网页标签(
PHP实现网页内容html标签补全和过滤的方法实例解析)
用PHP完成和过滤网页内容HTML标记的方法摘要[2种方法]
更新时间:2017年4月27日10:58:53作者:网站
本文章主要介绍了PHP中HTML标记完成和web内容过滤的方法,并以实例的形式分析了PHP常见的标记检查、完成、关闭、过滤等相关操作技巧。有需要的朋友可以参考
本文介绍了在PHP中完成HTML标记和过滤网页内容的方法。与您分享,供您参考,如下所示:
如果网页内容的HTML标记未完全显示,某些表标记不完整,导致页面混乱,或者收录内容之外的本地HTML页面,我们可以编写一个函数方法来完成HTML标记并过滤掉无用的HTML标记
PHP使HTML标记完整并自动关闭。过滤函数方法1:
代码:
function closetags($html) {
preg_match_all('##iU', $html, $result);
$closedtags = $result[1];
$len_opened = count($openedtags);
if (count($closedtags) == $len_opened) {
return $html;
}
$openedtags = array_reverse($openedtags);
for ($i=0; $i < $len_opened; $i++) {
if (!in_array($openedtags[$i], $closedtags)) {
$html .= '';
}else {
unset($closedtags[array_search($openedtags[$i], $closedtags)]);
}
}
return $html;
}
Closetags()解析:
array_u;Reverse():此函数反转原创数组中的元素,创建新数组并返回。如果第二个参数指定为true,则元素的键名保持不变,否则键名将丢失
array_usearch():array_usearch(value,array,strict),与类似array()中的相同,在数组中查找键值。如果找到该值,则返回匹配元素的键名。如果未找到,则返回false。如果第三个参数strict指定为true,则仅当数据类型和值一致时,才会返回相应元素的键名
PHP使HTML标记完整并自动关闭。过滤函数方法2:
function checkhtml($html) {
$html = stripslashes($html);
preg_match_all("/\ $val) {
$string[$key] = shtmlspecialchars($val);
}
} else {
$string = preg_replace('/&((#(\d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{2,5});)/', '&\\1',
str_replace(array('&', '"', ''), array('&', '"', ''), $string));
}
return $string;
}
Checkhtml($HTML)解析:
Stripsplashes():函数删除addslashes()函数添加的反斜杠。此函数用于清理从数据库或HTML表单检索的数据
有关PHP的更多信息,感兴趣的读者可以查看本网站上的主题:PHP数据结构和算法教程、PHP编程算法摘要、PHP排序算法摘要、PHP常见遍历算法和技能摘要、PHP数学运算技能摘要、PHP数组运算技能、,PHP字符串用法总结,以及PHP中常见数据库操作技巧总结
我希望这篇文章能对你的PHP编程有所帮助