微信文章采集软件(解决微信公众号文章打印pdf图片无法显示的问题,不懂的话直接搜大佬的参考方案)

优采云 发布时间: 2022-01-17 02:00

  微信文章采集软件(解决微信公众号文章打印pdf图片无法显示的问题,不懂的话直接搜大佬的参考方案)

  python第三方库pdfkit非常好用。基本上,它可以用来打印pdf文件。作为学渣收干货,吃灰,简直是绝配。这渣渣还写了一大堆爬了一大堆干货打印成pdf文章,有微信公众号文章,前段时间继续折腾公众号< @文章 打印pdf,发现有图就比对,断粮!

  SO,所以有这么一篇文章文章,解决微信公众号文章打印pdf图片时无法显示的问题,不明白的直接搜索参考图大哥,试试百灵!!

  让我们回顾一下下面的解决方案!

  以本渣的公众号文章链接为例:

  

  爬取打印pdf效果:

  

  

  关键要点

  解决pdfkit直接将url转pdf时图片无法显示的问题,参考博客园xuzifan提供的思路,使用微信搜狗中的get_article_content函数,将url中的代码提取出来,转换成html字符串,然后将html字符串转换成pdf,完美解决。

  pip install wechatsogou --upgrade

  wechatsogou是基于搜狗微信搜索的微信公众号爬虫界面。没错,还是调用接口!!

  使用Python爬取微信公众号文章并保存为PDF文件(解决图片不显示的问题)

  不过这个渣渣测试了代码,一直发验证码,但是还是不行!

  这是最近的另一个代码参考,一个大哥的源码:

  供自己参考!

  附上完整的源代码参考:

  #采集微信公众号文章内容转pdf文件

#by 微信:huguo00289

# -*- coding: UTF-8 -*-

import wechatsogou

import pdfkit

#pdfkit本地路径

config = pdfkit.configuration(

    wkhtmltopdf=r'D:\wkhtmltox-0.12.5-1.mxe-cross-win64\wkhtmltox\bin\wkhtmltopdf.exe')

# 初始化API

ws_api = wechatsogou.WechatSogouAPI(captcha_break_time=3)

def dypdf(h1, data):

    # 处理后的html

    datas = f'''

        

        

        

            

            {h1}

        

        

        {h1}

        {data}

        

        

        '''

    print("开始打印内容!")

    pdfkit.from_string(datas, f'{h1}.pdf', configuration=config)

    print("打印保存成功!")

def wx(h1,url):

    # 该方法根据文章url对html进行处理,使图片显示

    content_info = ws_api.get_article_content(url)

    # 得到html代码(代码不完整,需要加入head、body等标签)

    html_code = content_info['content_html']

    dypdf(h1, html_code)

if __name__=='__main__':

    url="https://mp.weixin.qq.com/s?src=11&timestamp=1621327798&ver=3075&signature=jmB-1M7nuTd-tKOj-8WmSLcmLK7fWIfIeWsZvtIKw5AkYd4U0R5cOz*QSjaVDfg38UkPtUqfxL2Lut0jrWNuTAtQMiyWd*tJHqLlPnWH-ewQ46cpjjp-Pyke0ab57WdM&new=1"

    h1="【微信采集助手】Python Tkinter 微信公众号文章批量采集工具"

    wx(h1,url)

  调用接口什么的都比较简单,做个调音师还是很厉害的!

  美好的过去

  01

  02

  03

  04

  05

  ·······结尾·······

  大家好,我是二叔

  进城的革命老区农民工,

  非早期非专业的互联网站长,

  喜欢python,写,读,英文

  不受欢迎的程序,自媒体,seo。. .

  公众号不赚钱,只做一个网友。

  读者交流群已成立,找我并备注“交流”,即可加入我们~

  听说“看”的人更好看~

  关注二叔~把python的内容分享给大家,写读读~

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线