网页抓取数据百度百科(Excel抓取并查询网络数据可以使用“获取和转换”+“查找引用函数”的功能组合来实现)

优采云 发布时间: 2022-01-24 11:00

  网页抓取数据百度百科(Excel抓取并查询网络数据可以使用“获取和转换”+“查找引用函数”的功能组合来实现)

  Excel抓取和查询网络数据可以通过“获取和转换”+“查找参考功能”的功能组合来实现。

  示例:下图是百度百科“奥运”网页中的表格。我们以此为例,将表格抓取到Excel中,我们可以通过输入会话数来查询对应的主办城市。

  

  Step1:使用“获取和转换”功能将网络数据捕获到Excel中

  单击数据选项卡、新查询、来自其他来源、来自 Web。

  

  弹出如下窗口,手动将百度百科“奥运”的网址复制粘贴到网址栏,点击确定。

  

  Excel 连接到网页需要一定的时间。稍等片刻,会弹出如下窗口。左侧列表中的每个表代表网页中的一个表。一一点击预览后,发现Table3就是我们需要的数据。

  

  单击下方“加载”旁边的下拉箭头,然后选择“加载到”。

  

  在弹出窗口中,选择“选择如何在工作簿中查看此数据”下的“表”,然后单击“加载”。

  

  如图所示,Web 表单中的数据已经被抓取到 Excel 中。

  

  点击“表格工具”、“设计”,将“表格名称”改为Olympic Games。

  

  Step2:使用“查找和引用”功能实现数据查询

  创建一个查询区域,包括“会话数”和“主办城市”,在会话编号中选择一个会话并在下图中输入“第08个会话”,进入主办城市下的vlookup功能,可以得到第08届奥运会的主办城市是巴黎,当届数发生变化时,对应的主办城市也会发生变化。

  公式:=VLOOKUP([会话次数],Olympics[#All],4,0)

  

  注意:如果网页中的数据变化频繁,可以设置链接网页的数据定期刷新:

  ①将鼠标放在导入数据区,切换到【设计】选项卡,点击【刷新】下拉箭头→【链接属性】

  

  ②在弹出的【链接属性】对话框中,设置【刷新频率】,例如设置为10分钟刷新一次。这样每10分钟就会刷新一次数据,保证获取到的数据始终是最新的。

  

  《江津Excel》是头条签约作者,关注我,如果你点击任意三篇文章文章,没有你想要的知识,我就是流氓!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线