php用正则表达抓取网页中文章(正则表达式就是用于描述这些规则的工具(,),,)

优采云 发布时间: 2022-02-02 20:14

  php用正则表达抓取网页中文章(正则表达式就是用于描述这些规则的工具(,),,)

  我们经常遇到要获取字符串指定部分的内容。让我们使用正则匹配来获取下一页的 url。代码如下:

  $str='ht///>第一页上一页下一页';preg_match_all('/]*href=([^>]*)>下一页/是',$str,$matches); print_r($matches[1]);//方法二,代码如下: preg_match('/next page/u', $s, $arr);

  究竟什么是正则表达式?

  在编写处理字符串的程序或网页时,经常需要找到符合一些复杂规则的字符串。正则表达式是描述这些规则的工具,换句话说,正则表达式是记录文本规则的代码。

  很有可能你用过windows/dos下用于文件搜索的通配符(wildcards),也就是*和?,如果要查找一个目录下的所有word文档,就会搜索*.doc,这里, * 将被解释为任意字符串。与通配符类似,正则表达式也是文本匹配的工具,只是它们可以比通配符更准确地描述你的需求——当然,代价是更复杂——例如你可以编写一个正则表达式来查找所有以0,后跟 2-3 个数字,然后是连字符“-”,最后是 7 位或 8 位数字的字符串(如 or 0376-7654321).

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线