网页视频抓取脚本( 脚本之家代码简单易懂网站视频内容介绍(图))

优采云 发布时间: 2021-12-29 07:17

  网页视频抓取脚本(

脚本之家代码简单易懂网站视频内容介绍(图))

  Python爬虫爬取一个网站视频的示例代码

  更新时间:2021年2月20日09:58:23 作者:badbadboy

  本文主要介绍python爬虫爬取某网站视频的示例代码。代码简单易懂。对大家的学习或工作有一定的参考价值。有需要的朋友可以参考。

  将获取到的下载视频的url存放在一个数组中(也可以写成文件),调用迅雷接口自动下载。(请先下载迅雷,在迅雷设置中心下载管理中设置为一键下载)

  实现代码如下:

<p>

from bs4 import BeautifulSoup

import requests

import os,re,time

import urllib3

from win32com.client import Dispatch

class DownloadVideo:

def __init__(self):

self.r = requests.session()

self.url=self.get_url()

self.download_urla=[]

self.download_urlb=[]

self.url_set=["%s/shipin/list-短视频.html"%self.url]

#获取最新网址

def get_url(self):

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

a=self.r.get('https://www.k58.com',verify=False)

b=a.url

return b

#几页内容的网址

def url_set1(self,n):

if n==2:

url="%s/shipin/list-短视频-2.html"%self.url

self.url_set.append(url)

elif n>=3:

m=n+1

for i in range(2,m):

url="%s/shipin/list-短视频-%d.html"%(self.url,i)

self.url_set.append(url)

else:

pass

#分别加载每一个页内容的网址

def download_url1(self):

for j in self.url_set:

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

r=self.r.get(j,verify=False)

sp1=r.content

soup = BeautifulSoup(sp1, "html.parser")

sp2 = soup.find_all(class_="shown")

for i in sp2:

url1=re.findall('

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线