chrome 插件 抓取网页qq聊天记录(WebScraper如何快速爬取几个不太大不太大的网页?|)
优采云 发布时间: 2021-10-11 17:21chrome 插件 抓取网页qq聊天记录(WebScraper如何快速爬取几个不太大不太大的网页?|)
网络爬虫
在写项目的时候,我们总是需要测试数据,但是这个时候我们不想写代码。如何在没有太多数据的情况下快速抓取几个网页?
需求还是很多的,于是就有了一个基于Chrome的爬虫插件Web Scraper,可以快速帮助我们快速抓取一些数据量不大的网页。今天,我将介绍它的用途。
先让大家看看效果。数据爬下来后,也可以导出为excel表格格式。以后教你
这是我导出到excel的数据
话不多说,先用
1、下载
本软件是基于Chrome的插件,下载后添加为扩展
加入之后我们就可以使用了
2、使用
我们按F12或者Ctrl+Shift+i进入控制台,然后找到我们的Web Scraper,里面有一些我之前爬过的数据模型
然后我们点击创建新的站点地图,添加你要抓取数据的地址,你可以取任何你想要的名字
创建后,添加一个选择器 添加新的选择器。你也可以自己拿id。这是第一个id,Type要选择Element,这样才能爬出多个元素,然后点击Select选择要爬取的数据,红色的是选中,然后勾选Multiple,点击save
所以我们创建了一个一级选择器
然后我们点进去,创建一个选择器来选择我们要爬取的内容。比如我这次需要抓取标题,那么我选择点击选择标题,Type选择Text,然后保存
然后我们就可以开始爬取数据了
然后选择时间。网速慢的时间可以设置的长一些,否则可能无法抓取数据。
然后数据出来了
然后我们以excel表格的形式导出
点击立即下载,表格将被下载,然后您可以保存它!