敏感词带你，抓取小视频（批量下载）—— 实战篇

优采云发布时间: 2022-06-20 13:48

　　*敏*感*词*带你，抓取小视频（批量下载）—— 实战篇

　　前言

　　现在有很多很多的小视频，遇到自己喜欢的，一个一个保存有些麻烦，那有没有更加简单的方法呢？跟着我，一起来看看我是如何批量下载小视频的呢，我们以六间房为例，下载全部小视频。

　　01

　　首先，你要安装pycharm软件，具体操作可以参考这篇文章：，爬虫主要工具可以参考这篇文章：

　　今天介绍如何在pycharm中安装我们需要的模块。

　　首先打开pycharm，接着点击File，在点击Settings

　　依次点击Project: (这里是你创建的名字)，在点下面的ProjectInterpreter，点击 + 号进行添加模块

　　打开后，在空格里添加你要下载的模块，点击Install Package进行下载，下载过程会很慢，这时候我们添加国内镜像源

　　清华：https://pypi.tuna.tsinghua.edu.cn/simple

　　在这个界面点击 Manage Repositories，输入清华国内镜像源，即可。

　　02

　　爬虫思路分析，进入我们要分析的网页，按下F12，我们发现，这是瀑布流数据，随着鼠标的滑轮向下滚动，小视频则会加载更多

　　这时候我们需要构造请求头，我们发现请求头数据在下图，具体指出

　　03

　　接下来就是编写代码了

　　爬虫思路

　　1.分析目标网页，确定爬取的url路径，headers参数

　　2. 发送请求 -- requests 模拟浏览器发送请求，获取响应数据

　　3. 解析数据 -- json模块：把字符串转化成python可交互的数据类

　　4.保存数据 -- 保存在目标文件夹中

　　1. 导入模块，添加请求头

　　import requestsbase_url = "https://v.6.cn/minivideo/getlist.php?act=recommend&page=1&pagesize=25"headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}

　　2.发送请求，获取数据

　　3. 解析数据

　　data_list = data["content"]["list"]for data1 in data_list: video_title = data1["title"] + ".mp4" # 这是视频标题 video_url = data1["playurl"] # 这是我们想要的视频地址 # 请求视频地址，因为是二进制所以用content video_data = requests.get(video_url, headers=headers).content

　　4. 保存数据

　　 # 保存的数据必须在for循环的里面 with open(r'你想要保存的目录' + video_title, mode="ab") as f: print("正在下载视频：" + video_title) f.write(video_data) print("下载完成：" + video_title)

　　5.过程图

　　6.查看视频

　　小结

　　本文主要内容是，如何在pycharm中安装及使用requests模块，介绍了网站的分析，提前部署请求头，模拟浏览器，针对反爬虫提前做了准备。

　　创作不易，欢迎关注

　　往期精彩，欢迎浏览

0

2022-06-20

chrome网页视频抓取

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

敏感词带你，抓取小视频（批量下载）—— 实战篇

0 个评论

发起人

AI时代内容工厂

*敏*感*词*带你，抓取小视频（批量下载）—— 实战篇

0 个评论

发起人

相关问题

敏感词带你，抓取小视频（批量下载）—— 实战篇