网页视频抓取软件 格式工厂(【】加密视频源URL()抓视频)
优采云 发布时间: 2021-11-29 02:02网页视频抓取软件 格式工厂(【】加密视频源URL()抓视频)
现在很多视频网站都使用blob对视频源地址进行加密,使得之前通过网络抓视频源地址下载视频的方法不再适用
简单理解一下blob加密视频源,就是将一个视频文件拆分成多个ts文件,分段加载。其实网络上还是可以找到视频文件的,只是原来是一个文件,现在是无数个ts文件。
以优酷为例。优酷的视频是blob加密的,可以抓取ts文件列表。
本次录制以优酷的一段视频为例。视频播放地址:
所需工具:猫爪浏览器插件
长这样。Chrome浏览器或者Chrome内核浏览器(比如360极速,我用的是360极速)都可以安装。
开始捕捉视频
1、墨照安装后,打开要下载的视频地址,墨照会开始分析当前页面的资源;
2、 找到ts文件集合的地址列表。一般列表资源后面有一个放大镜,点击放大镜可以看到ts资源列表;
3、 下载列表中的所有ts文件,全部,全部,全部,全部,建议打开迅雷到一个文件夹;
4、获取一个文件夹里面有很多ts文件,有些网站 ts文件组是按顺序命名的,但是有些网站 ts文件组是乱序的;
5、对于乱命名的ts文件组,所有ts文件都需要依次重命名。建议以阿拉伯数字顺序命名,以便于综合。Mozhao的解析页面地址列表是ts文件的正确顺序。对于乱序的ts命名,可以对照墨照的解析页面列表。重命名大量文件需要大量工作。纯手工肯定是不可能的。笔者使用的半手工方式非常方便。我觉得你把乱序的ts文件组重命名比较好。欢迎留言;
5.1、 首先准备一个重命名的Python脚本。
import os
os.rename('F:\\download\\HBNLcXeV.ts','F:\\download\\0001.ts')
复制尽可能多的行 ts os.rename('F:\\download\\HBNLcXeV.ts','F:\\download\\0001.ts')
5.2、 按照猫解析页面ts文件的顺序整理Python脚本。格式参考下图;笔者推荐使用 Sublime Text 编辑 Python 重命名脚本,并支持多行同时修改和粘贴。可以使用 ZenCoding 语法快速序列化数字(参考 ZenCoding);
5.3、 准备好重命名脚本后,执行脚本,就可以得到所有按顺序命名的ts文件组,然后就可以开始合并文件组了。
6、 使用cmd命令合并ts文件组,命令:copy/b F:\1816\*.ts F:\newfile.ts 执行后,F盘1816文件夹下的所有ts文件会按照顺序合并文件名 这是一个名为 newfile.ts 的文件。
注:参考资料
7、ts文件转码,推荐格式化工厂
转换为主流的视频文件格式,如avi、mp4等,可以直接用ts文件播放,但不流畅。当然,如果你认为ts文件可以直接使用,也可以忽略转码。
作者的记录很详细,中间有优化的部分,欢迎大家留言评论。