网页视频抓取脚本( 分析网页视频存储形式以及加密格式() )

优采云 发布时间: 2021-12-17 14:15

  网页视频抓取脚本(

分析网页视频存储形式以及加密格式()

)

  高级爬虫-视频采集(视频加密分割案例) 中国职业培训在线网

  .

  1.分析网络视频存储和加密格式

  一般我们在做视频采集的视频大多是:https:指向一个视频文件,但是在大多数网站中,目前主流的视频加密格式大都是分成上百个小片段。播放并不断加载新剪辑。中国职业培训在线视频网视频示例:

  .

  要通过 F12 按钮查看 Web 缓存,请选择顶部的网络和 xhr:

  

  注:目前主要的视频分割技术使用.m3u8文件来记录视频片段总数。后缀为 .m3u8 的文件收录所有视频剪辑的文件名。大多数视频剪辑文件都是.ts文件,所以我们目前的开发者在工具中找到对应的.m3u8文件

  如下:

  

  点击查看文件内容:

  

  可以观察到所有的视频剪辑文件都在这里,从00001.ts-00240.ts

  接下来我们需要重建这些视频剪辑的 url:

  以此类推到 00240.ts

  

  接下来,开始构建请求视频的所有片段并将它们合并成一个新的mp4文件的代码:

<p>import requests

import requests

import os

import time

def run(i,html,referer):

#做了一个字符串替换避免出现001或者0011等异常情况:正确——>00001.ts 00011.ts 00111.ts

if int(i)=10 and int(i)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线