抓取网页音频( Web服务器可以获得有关内容类型的特定信息类型吗?)
优采云 发布时间: 2022-01-18 20:13抓取网页音频(
Web服务器可以获得有关内容类型的特定信息类型吗?)
r = requests.get(url, allow_redirects=True)
现在,我们可以获取有关 Web 服务器可以提供的内容的信息类型。
for headers in r.headers: print(headers)
您可以观察输出,如下所示 -
Date
Server
Upgrade
Connection
Last-Modified
Accept-Ranges
Content-Length
Keep-Alive
Content-Type
借助以下代码行,我们可以获得有关内容类型的特定信息,例如 content-type-
print (r.headers.get('content-type'))
您可以观察输出,如下所示 -
image/jpeg
借助以下代码行,我们可以获得有关内容类型的具体信息,例如 EType-
print (r.headers.get('ETag'))
您可以观察输出,如下所示 -
None
遵循以下命令 -
print (r.headers.get('content-length'))
您可以观察输出,如下所示 -
12636
借助以下代码行,我们可以获得有关内容类型的特定信息,例如 Server-
print (r.headers.get('Server'))
您可以观察输出,如下所示 -
Apache
为图像生成缩略图
缩略图是非常小的描述或表示。用户可能只想保存大图像的缩略图,或同时保存图像和缩略图。在本节中,我们将创建在上一节“从网页获取媒体内容”中下载的名为 ThinkBig.png 的图像的缩略图。
对于这个 Python 脚本,我们需要安装名为 Pillow 的 Python 库,它是 Python 图像库的一个分支,具有处理图像的有用函数。它可以在以下命令的帮助下安装 -
pip install pillow
以下 Python 脚本将创建图像的缩略图,并通过在缩略图文件前加上 Th_ 将缩略图文件保存到当前目录。
import glob
from PIL import Image
for infile in glob.glob("ThinkBig.png"):
img = Image.open(infile)
img.thumbnail((128, 128), Image.ANTIALIAS)
if infile[0:2] != "Th_":
img.save("Th_" + infile, "png")
上面的代码很容易理解,可以查看当前目录下的缩略图文件。
网站截图
网页抓取中一个非常常见的任务是截取 网站 的屏幕截图。为此,我们将使用 selenium 和 webdriver。以下 Python 脚本将从 网站 截取屏幕截图并将其保存到当前目录。
From selenium import webdriver
path = r'C:\\Users\\gaurav\\Desktop\\Chromedriver'
browser = webdriver.Chrome(executable_path = path)
browser.get('https://tutorialspoint.com/')
screenshot = browser.save_screenshot('screenshot.png')
browser.quit
您可以观察输出,如下所示 -
运行脚本后,可以查看当前目录下的 screenshot.png 文件。
视频缩略图的生成
假设我们从 网站 下载了一个视频,并希望为其生成一个缩略图,以便我们可以根据其缩略图单击特定视频。为了生成视频缩略图,我们需要一个名为 ffmpeg 的简单工具,可以从中下载。下载后,我们需要根据操作系统的规格进行安装。
以下 Python 脚本将生成视频的缩略图并将其保存到我们的本地目录 -
import subprocess
video_MP4_file = “C:\Users\gaurav\desktop\solar.mp4
thumbnail_image_file = 'thumbnail_solar_video.jpg'
subprocess.call(['ffmpeg', '-i', video_MP4_file, '-ss', '00:00:20.000', '-
vframes', '1', thumbnail_image_file, "-y"])
运行上述脚本后,我们将在本地目录中保存一个名为 thumbnail_solar_video.jpg 的缩略图。
将 MP4 视频复制到 MP3
假设您已经从 网站 下载了一些视频文件,但您只需要该文件中的音频即可使用,这可以在 Python 中借助名为 moviepy 的 Python 库来完成,该库可以通过 The以下命令安装 -
pip install moviepy
现在,借助以下脚本成功安装moviepy后,我们可以将MP4转换为MP3。
import moviepy.editor as mp
clip = mp.VideoFileClip(r"C:\Users\gaurav\Desktop\1234.mp4")
clip.audio.write_audiofile("movie_audio.mp3")
您可以观察输出,如下所示 -
<p>[MoviePy] Writing audio in movie_audio.mp3
100%|¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦| 674/674 [00:01