网页数据抓取怎么写(函数爬取城市指定城市名称下的代码呈现出对应内容)

优采云 发布时间: 2021-11-28 00:16

  网页数据抓取怎么写(函数爬取城市指定城市名称下的代码呈现出对应内容)

  我一直认为,要想学好,就必须练好,所以请跟我一起学习的朋友,看完本页后,请自己写出相应的代码,并呈现相应的内容。

  今日练习:使用自定义函数爬取指定城市名称下的天气数据。

  爬取网址:全国空气质量指数查询-PM2.5实时地图,空气污染排名-空气之音

  效果如图:

  

  输入城市拼音,抓取城市对应的天气数据

  

  ---------------------------------------文章末尾给出了答案- ------ -------------------------------

  学习完今天的内容,希望你能完成上面的爬取操作。

  为了让大家不仅能操作,还能了解内部逻辑,所以在做爬虫操作之前,需要先学习PQ中的M函数。

  第 1 部分:M 功能

  1.查找M函数

  在编辑器中输入 =#shared。可以获取powerBi支持的所有M功能,可以查看它们的使用规则等。

  

  点击函数可以查看函数的定义和用法,非常方便。

  

  2.写M函数

  主要写逻辑和基本结构形式。

  M功能是PQ中独有的,共有950多种,用于记录操作过程。方便省去繁琐的过程。

  M 函数:=sum(A1:B2)

  = 开头,sum() 表达式,A1 参数,:运算符

  注意:M 函数区分大小写,每个单词的首字母大写,其余小写。

  定义:难度高于函数,但不是编程。

  编程:单元不断叠加,命令集合为批处理,批处理为自定义函数。多个功能组合成为一个类,多个类组合成为一个模块,多个模块组合成为一个程序,多个程序成为一个系统

  

  

  

  

  

  

  

  

  PQ爬取网页数据第二部分

  由于PQ类似于网页的分层嵌套方式,PQ可以作为网站来爬取数据,但是由于PQ工具有限,PQ只适合爬取以下两类页面的数据。

  方法:使用的M函数是=Web.Page()

  原理:截取网页的json文件信息进行分析

  1)静态数据源,固定网址,显示固定内容,可以抓取网页上可见的表格数据。如:空气指数

  2)动态数据源,在同一个URL下,通过不同的搜索条件可以获得不同的内容,需要是json文件传输方式。如:智联招聘或链家等。

  ------------------------------------------------ 答案揭晓------ -- --------------------------------------

  脚步:

  1)观察结构

  URL的前半部分是一样的,但是不同的城市不一样,所以可以通过文本函数拼接来获取数据。

  

  2)powerBI桌面中的操作如下:

  Web.Page(Web.Contents("/air/"&cityname)){0}[数据]

  

  

  如果还有不知道powerBI如何操作的朋友,请看下面的文章。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线