跟jQuery那样简单方便操作Html文档的Java工具类,今天我必须要告知你!
优采云 发布时间: 2022-05-21 18:18跟jQuery那样简单方便操作Html文档的Java工具类,今天我必须要告知你!
神器介绍
今天我要介绍一款操作Html文档非常好用的Java插件,强烈安利!因为实在太好用了!
“
Jsoup 是一款纯Java实现,可以非常方便读取和操作Html文档的一款插件。她的API跟jQuery非常相似。我都甚至怀疑创造者是否是jQuery的忠实粉丝。
”读完本文,你能做哪些“坏事”?我选择她的原因
其解析器能够尽最大可能从你提供的HTML文档来创建一个干净完整的解析结果,不管你提供的HTML的格式是否完整。这样就可以完美解决一些不规范的html文档读取的时候,容易报错,太影响开发进度了,并且,影响了程序的健壮性。动不动就报Html格式不规范的错误,想想都怕了。
例如:
代码实操加载html文档
大家可以随便拿个网页来操作一下,我就随手了我自己微信公众号的一篇原创文章作为我的例子去讲解了。为了简化讲解流程,本文就不讲爬虫技术这部分内容了,跳过使用爬虫技术获取网页。
本文简单一点,直接人手保存一个网页Html代替爬虫自动抓取网页动作了。
把html文件加载到Jsoup中
FileReader fileReader = new FileReader("D:\\temp\\demo\\wxPage.html");<br /> String result = fileReader.readString();<br /> Document doc = Jsoup.parse(result);//其实,就一行代码<br />
获取header里面的 meta 标签 <p>Elements metaList = doc.getElementsByTag("meta");<br /> <br /> int metaListSize = metaList.size();<br /> System.out.println("metaList size:"+metaListSize);<br /> for(int i =0 ;i