利用Python制作网页文本提取小工具

优采云 发布时间: 2022-05-09 04:31

  利用Python制作网页文本提取小工具

  有些时候我们需要复制网页中文字的时候会发现没办法复制,我就开始寻思能不能做一个小工具直接获取网页文本信息,说干就干,首先对程序进行构思,然后再去写代码实现,首先我们需要一个界面我使用的PySimpleGUI这个库,然后需要一个输入框和一个输出结果框,一个退出按钮和执行按钮界面如下所示:

  

  第一个输入框中放入网页元素,利用lxml库实现网页文字提取,第二个文本框为输出的文本结果,具体实现代码如下:

  # - * - coding: utf-8 -*-from lxml import etreeimport PySimpleGUI as sg<br /><br />def get_html(html): """解析网页文本""" HTML = etree.HTML(html) text = HTML.xpath('//text()') t = ''.join(text) print(t)<br /><br /># 定义窗口的内容layout = [ [sg.Text('复制页面元素到下方', text_color='pink', justification='center', size=(150, 1))], [sg.Text(text='输入:'), sg.Multiline(key='-', size=(150, 10))], [sg.Text(text='结果:'), sg.Output(key='-', size=(150, 25))], # Multiline 多行文本 Output 输出框 [sg.Text(size=(120, 1)), sg.Button('退出'), sg.Button('获取')]]<br /><br /># 创建窗口window = sg.Window('获取页面文本工具', layout, ) # 窗口定义while 1: event, values = window.read() if event == '退出': break if event == '获取': text = values['-'] # 根据key值对数据进行更新 window['-'].update(get_html(text)) else: breakwindow.close()  # 关闭窗口

  演示:

  

  还可以将此程序打包成exe提供给其他人使用。感觉这个东西用处不大呀,一天天瞎搞,溜了溜了~

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线