从网页抓取数据( 从中提取数据的PowerBIDesktop收集页面上的示例用)
优采云 发布时间: 2022-04-12 07:08从网页抓取数据(
从中提取数据的PowerBIDesktop收集页面上的示例用)
通过提供示例获取网页数据
谢谢。
本文内容
从网页中提取数据允许用户轻松地从网页中提取数据并将该数据导入 Power BI Desktop。通常,提取有序表比较容易,但是网页上的数据不在有序表中。即使数据是结构化且一致的,从此类页面获取数据也可能很困难。
有一个解决方案。使用“按示例从 Web 获取数据”功能,您可以通过在连接器对话框中提供一个或多个示例,实质上显示要从中提取数据的 Power BI Desktop。Power BI Desktop 在与示例匹配的页面上采集其他数据。使用此解决方案,可以从网页中提取所有类型的数据,包括在表格中找到的数据和其他非表格数据。
图表中的价格仅为示例。
通过示例使用 Fetch data from the web
从“开始”功能区菜单中选择“获取数据”。在出现的对话框中,从左侧窗格的类别中选择其他,然后选择 Web。选择连接以继续。
在来自 Web 中,输入要从中提取数据的网页的 URL。在本文中,我们将使用 Microsoft Store 网页并演示此连接器的工作原理。
如果您想按照说明进行操作,可以使用本文中使用的 Microsoft Store URL:
https://www.microsoft.com/store/top-paid/games/xbox?category=classics
当您选择 OK 时,您将被带到 Navigator 对话框,该对话框显示来自网页的任何自动检测到的表。在下面显示的情况下,没有找到表。选择“添加带有示例的表格”以提供示例。
“使用示例添加表格”提供了一个交互式窗口,您可以在其中预览网页内容。输入要提取的数据的样本值。
在此示例中,我们将提取页面上每个游戏的“名称”和“价格”。我们可以通过从每一列的页面中指定一些示例来做到这一点。输入示例时,Power Query 使用智能数据提取算法来提取与示例条目的模式匹配的数据。
注意
推荐值仅包括长度小于或等于 128 个字符的值。
当您对从网页中提取的数据感到满意时,选择“确定”进入 Power Query 编辑器。您可以应用更多转换或重塑数据,例如将此数据与源中的其他数据合并。
在这里,您可以在创建 Power BI Desktop 报表时创建视觉对象或使用 Web 数据。
下一步
你可以使用 Power BI Desktop 连接到各种数据。有关数据源的更多信息,请参阅以下资源: