excel vba抓取网页数据( PowerQuery的6种常用连接方式,从工作簿从文本/CSV)
优采云 发布时间: 2021-12-25 07:03excel vba抓取网页数据(
PowerQuery的6种常用连接方式,从工作簿从文本/CSV)
Power Query有5大类40种连接方式,可以连接到文件、数据库、在线服务等各种数据源。今天我们介绍6种常用的连接方式:
从文件夹中的文本/CSV 工作簿
从网络空白的表区查询
要从工作簿建立连接:
Power Query 的基本概念之一是数据源隔离。无论连接到哪个数据源,连接后的所有操作都不会影响数据源。但是,如果在 Excel 数据源工作簿中建立连接,则不会修改数据源,但保存该数据源的 Excel 文件时,仍然有更改。数据源表转换为超级表,文件收录更多Power Query查询。
所以,要保持数据源文件不变,最好的办法就是从工作簿建立连接,这样就可以直接提取数据,不用打开Excel文件,不用对Excel文件做任何改动。
步骤很简单:
从文本/CSV 建立连接:
有时数据源是文本文件(后缀为 TXT 或 CSV),或者您可以直接使用 Power Query 建立连接。步骤同上,只需选择文件建立连接即可。
要从文件夹建立连接:
当 Power Query 从文件夹建立连接时,它可以自动合并相同格式的文件。多文件合并过去是用 VBA 实现的。使用 Power Query,多文件合并变得更加容易。
按此按钮,文件将自动合并。
前三种方法是从文件中获取数据建立查询,后三种方法不同
从表区:
在 Power Query 中创建查询的最简单方法是从表区域创建查询。只需一步,选择数据区并按下按钮。
这种连接方式通常用于单个文件中的数据处理,不建立文件链接,直接在文件中进行数据处理。也是初学者最愿意使用的方法,简单直接。
来自网络:
Power Query 提供网络数据捕获功能。这个有点高。通常,网络爬虫是只有Python等编程语言才能实现的功能。当然,Power Query 的网络爬虫在效率和功能上无法与网络爬虫相比,但基本的静态网络爬虫是没有问题的。
复制并粘贴网络地址并选择列表。
创建一个空白查询:
Power Query 的后端是 M 语言。Power Query 提供了丰富的 M 函数,但有时您仍然需要自定义函数来处理特定问题。这时候就需要使用空查询了。创建空查询后,打开高级编辑器。您可以根据 M 语言的语法规范编写自定义函数。
Power Query 提供了丰富的数据接口。您可以根据自己的需要进行选择。具体的数据库和在线连接操作并不复杂。只要您有权限并按照向导填写所需信息,就可以建立连接。