网页表格抓取(如何快速获取网页中的表格,并且可以实现自动刷新数据)
优采云 发布时间: 2021-09-10 04:09网页表格抓取(如何快速获取网页中的表格,并且可以实现自动刷新数据)
大家好,今天给大家分享一下如何快速获取网页中的表格,并且可以自动刷新数据,他的操作也很简单,不多说,直接开始
我们想在网页中获取2020年GDP预测排名的数据,如下图
一、获取数据
首先我们需要新建一个工作簿,打开它,然后点击数据函数组,点击新建查询,然后从其他源中选择,从网站中选择
此时会弹出一个对话框,直接复制要提取数据的URL,然后点击确定。点击确定后,excel会自动连接并计算数据
计算完成后,会进入powerquery的导航界面。导航器左侧的表格图标是excel检测到的表格数据,当我们点击对应的表格名称时,右侧的数据会显示对应的表格,我们可以点击表格找到我们需要的数据想要获取,这里第一个就是我们想要获取的数据,我们直接点击第一个表格然后点击转换数据
二、处理数据
当您点击转换数据时,您将进入powerquery的数据处理界面,我们可以在此对数据进行相应的处理。比如这里我们要按地区计算每个大洲的GDP总量,以*敏*感*词*为单位
首先我们在start中点击选择分组基准,然后在分组基准中选择区域,然后在新的列名中命名一个名称,我设置计算方式为sum,然后选择所在的列定位到RMB,点击确定。是的
接下来我们点击close and upload to将数据加载到excel中,如下图
如果不想在powerquery中编辑,可以在导航器界面直接点击加载,数据会直接加载到excel中,我们也可以直接在excel中编辑数据,
powerquery处理的数据是可以刷新的,但是不能直接在excel中点击load and processing来刷新数据。刷新数据,我们只需要在数据功能组中点击刷新即可刷新数据