网页视频抓取软件 格式工厂(【】加密视频源URL()抓视频)

优采云 发布时间: 2021-11-29 02:02

  网页视频抓取软件 格式工厂(【】加密视频源URL()抓视频)

  现在很多视频网站都使用blob对视频源地址进行加密,使得之前通过网络抓视频源地址下载视频的方法不再适用

  简单理解一下blob加密视频源,就是将一个视频文件拆分成多个ts文件,分段加载。其实网络上还是可以找到视频文件的,只是原来是一个文件,现在是无数个ts文件。

  以优酷为例。优酷的视频是blob加密的,可以抓取ts文件列表。

  本次录制以优酷的一段视频为例。视频播放地址:

  所需工具:猫爪浏览器插件

  

  长这样。Chrome浏览器或者Chrome内核浏览器(比如360极速,我用的是360极速)都可以安装。

  开始捕捉视频

  1、墨照安装后,打开要下载的视频地址,墨照会开始分析当前页面的资源;

  

  2、 找到ts文件集合的地址列表。一般列表资源后面有一个放大镜,点击放大镜可以看到ts资源列表;

  

  

  3、 下载列表中的所有ts文件,全部,全部,全部,全部,建议打开迅雷到一个文件夹;

  

  4、获取一个文件夹里面有很多ts文件,有些网站 ts文件组是按顺序命名的,但是有些网站 ts文件组是乱序的;

  

  5、对于乱命名的ts文件组,所有ts文件都需要依次重命名。建议以阿拉伯数字顺序命名,以便于综合。Mozhao的解析页面地址列表是ts文件的正确顺序。对于乱序的ts命名,可以对照墨照的解析页面列表。重命名大量文件需要大量工作。纯手工肯定是不可能的。笔者使用的半手工方式非常方便。我觉得你把乱序的ts文件组重命名比较好。欢迎留言;

  5.1、 首先准备一个重命名的Python脚本。

  import os

os.rename('F:\\download\\HBNLcXeV.ts','F:\\download\\0001.ts')

  复制尽可能多的行 ts os.rename('F:\\download\\HBNLcXeV.ts','F:\\download\\0001.ts')

  5.2、 按照猫解析页面ts文件的顺序整理Python脚本。格式参考下图;笔者推荐使用 Sublime Text 编辑 Python 重命名脚本,并支持多行同时修改和粘贴。可以使用 ZenCoding 语法快速序列化数字(参考 ZenCoding);

  

  5.3、 准备好重命名脚本后,执行脚本,就可以得到所有按顺序命名的ts文件组,然后就可以开始合并文件组了。

  

  6、 使用cmd命令合并ts文件组,命令:copy/b F:\1816\*.ts F:\newfile.ts 执行后,F盘1816文件夹下的所有ts文件会按照顺序合并文件名 这是一个名为 newfile.ts 的文件。

  

  注:参考资料

  7、ts文件转码,推荐格式化工厂

  

  转换为主流的视频文件格式,如avi、mp4等,可以直接用ts文件播放,但不流畅。当然,如果你认为ts文件可以直接使用,也可以忽略转码。

  作者的记录很详细,中间有优化的部分,欢迎大家留言评论。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线