php抓取网页表格信息(微信小程序解析网页内容详解及实例的相关资料)
优采云 发布时间: 2022-03-21 18:37php抓取网页表格信息(微信小程序解析网页内容详解及实例的相关资料)
本篇文章主要介绍微信小程序解析网页内容的细节和例子。在这里,我们使用爬虫来爬取复杂的网页。如果遇到一些问题,可以在这里整理并解决。需要的朋友可以参考下
微信小程序解析网页内容详解
最近在写爬虫,需要为微信小程序解析网页。文字和图片解析都好说,小程序也有相应的文字和图片标签可以呈现。更复杂的,比如表格,难度更大,无论是服务端解析还是小程序渲染,都非常费力,很难涵盖所有情况。所以我认为将表格对应的HTML代码转换为图像会是一种解决方法。
这里我们使用node-webshot模块,它以轻量级的方式封装了PhantomJS,可以方便的将网页保存为截图。
首先安装 Node.js 和 PhantomJS,然后新建一个 js 文件并加载 node-webshot 模块: const webshot = require('webshot');
定义选项: const options = {
// 浏览器窗口
屏幕尺寸: {
宽度:755,
身高:25
},
// 要截图的页面的文档区域
镜头尺寸:{
高度:'全部'
},
//页面类型
网站类型:'html'
};
这里,浏览器窗口的宽度要根据网页的情况合理设置,高度可以设置一个较小的值,然后页面文档区域的高度必须设置为all,宽度默认到窗口宽度,以便表格可以设置为最小值。全尺寸截图。
接下来定义html字符串:let html="target富文本html代码,eg:
";
注意里面的HTML代码必须去掉换行符,用单引号代替双引号。
最后,截图: webshot(html, 'demo.png', options, (err) => {
如果(错误)
console.log(`Webshot 错误:${err.message}`);
});
这样就实现了HTML代码到本地图片的转换,然后可以上传到七牛云等。无论是服务器的分析还是小程序的呈现,都没有难度……
以上就是本文的全部内容。希望对大家的学习有所帮助。更多相关内容请关注PHP中文网!