php用正则表达抓取网页中文章( 正则表达式的20个校验密码路径及扩展名验证下文件路径 )

优采云 发布时间: 2022-02-20 16:27

  php用正则表达抓取网页中文章(

正则表达式的20个校验密码路径及扩展名验证下文件路径

)

  

  正则表达式是一种强大而高效的文本处理工具。通常,复杂的业务逻辑可以通过准确的表达非常简单快速地实现。

  因此,正则表达式通常是成熟开发者的标准,有助于实现开发效率的大幅提升。

  当需要实现校验字段、字符串等时,通常可以通过正则表达式来实现:

  

  以下是工匠经常使用的20个正则表达式。

  1 检查密码强度

  密码的强度必须是大小写字母和数字的组合,没有特殊字符,长度在 8-10 之间。

  

  2 检查中文

  字符串只能是中文。

  

  3 由数字、26个英文字母或下划线组成的字符串

  

  4 验证电子邮件地址

  与密码一样,以下是电子邮件地址合规性的常规检查声明。

  

  5 检查×××号

  以下是×××号的定期检查。15 或 18 位。

  

  6 检查日期

  “yyyy-mm-dd”格式的日期检查,考虑到闰年。

  

  7 检查金额

  金额核对,精确到小数点后2位。

  

  8 验证手机号码

  以下是国内13、15、18开头的手机号码正则表达式。(前两个号码可根据目前国内采集号码展开)

  

  9 确定IE的版本

  IE目前还没有完全替代,很多页面还需要版本兼容。以下是 IE 版本检查的表达式。

  

  10 检查 IP-v4 地址

  IP4 常规声明。

  

  11 检查 IP-v6 地址

  IP6 常规声明。

  

  12 检查 URL 的前缀

  在应用开发中,经常需要区分请求是HTTPS还是HTTP。通过下面的表达式,可以提取一个url前缀,然后进行逻辑判断。

  

  13 提取 URL 链接

  以下表达式过滤掉一段文本中的 URL。

  

  14 文件路径和扩展名验证

  验证Windows下的文件路径和扩展名(下例中为.txt文件)

  

  15个提取颜色十六进制代码

  有时需要提取网页中的颜色代码,可以使用下面的表达式。

  

  16 提取网页图像

  如果要提取网页中的所有图像信息,可以使用以下表达式。

  

  17 提取页面超链接

  提取html中的超链接。

  

  18 查找 CSS 属性

  通过以下表达式,您可以搜索匹配的 CSS 属性。

  

  19 提取注释

  如果您需要删除 HMTL 中的注释,可以使用以下表达式。

  

  20 个匹配的 HTML 标签

  HTML 中的标签属性可以通过以下表达式进行匹配。

  

  与正则表达式相关的语法

  下面是我发现的一个非常好的正则表达式备忘单,可以用来快速找到相关的语法。

  

  学习正则表达式

  在网上看到了一本很不错的正则表达式快速学习指南,有兴趣继续学习的同学可以参考。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线