excel抓取网页动态数据(苦于没有数据支撑???数据??)
优采云 发布时间: 2022-02-18 15:15excel抓取网页动态数据(苦于没有数据支撑???数据??)
作为新时代的产物,如果你还不了解爬虫,你可能已经出局了。
爬虫(也称为网络蜘蛛或网络机器人)是一种程序或脚本,它根据一定的规则自动爬取万维网上的信息。
soga,但产品为什么要懂爬虫呢?爬虫抓取数据。所以:
如果您想做出决定但没有数据支持怎么办?
如果你想拆指标却又没有数据支撑?
如果您正在分析竞争产品但没有数据支持?
如果您想...但没有数据支持?
在营销中包括搜索引擎优化和潜在客户;竞争产品分析中的竞争产品动态和相关反馈;个人生活中的专家点评,公司岗位也有使用爬虫的地方。
所以,爬行动物,走吧。
接下来,我们5分钟抢B站弹幕:
首先,想要做好工作,首先要磨砺自己的工具,先安装Chrome浏览器,然后调用控制台(Win快捷键Fn+F12)
温馨提示,通过将网页和控制台变成如图所示的上下分屏,体验会更好。
上下分屏.png
接下来我们在B站注册,随机打开一个链接,
假设我们听一首歌,
然后,如图,右键Network-》xml-》,在新页面中打开。
获取链接steps.png
如图,那么我们就可以得到所有的弹幕,然后复制链接。
所有弹幕.png
打开Excel2013,Data-From网站-粘贴地址-Go-Check-Import:
Excel 操作1.png
在这方面,我们捕捉到了华丽的数据。
但是,数据有点乱,我们就处理一下吧。
初步数据.png
这里我们使用Excel的列功能,选择逗号作为分隔符,
专栏.png
最终效果如图,
最终效果.png
如果你想问这些字段是什么意思,咳咳,说几句话,
K列,116.342代表时间(秒);
L栏,1代表弹幕类型(1-选框,4-下,5-悬停);
M列和N列代表字体和颜色;
数据是宝贵的资产,亟待挖掘。