最新微信公众号采集方案详尽介绍
优采云 发布时间: 2020-08-18 17:51最新微信公众号采集方案详尽介绍
目前比较有效的几种微信公众号的采集方式:
1、通过web端素材管理插口的方法
2、通过appium从手机端
3、通过逆向工程暴力获取
4、通过第三方服务插口
5、搜狗微信公众号插口(已凉)
个人及小团体对公众号内容获取数目不多的情况下通常还会采用前两种相对简单方便成本低的方法去获取内容,不差钱的团队肯定就买第三方服务了,靠提供微信公众号采集接口的服务赢利的肯定就是逆向工程了.我介绍第一种比较简单适宜小规模采集的方案
1、首先我们须要注册个属于自己的公众号平台微信公众号注册地址
2、注册成功后步入点击如图所示的素材管理
3、点击素材管理后点击如图所示的新建图文消息
4、点击新建图文消息后点击如图所示的超链接
5、点解超链接后点击如图所示的选择其他公众号
6、这时候就可以输入我们想要获取公众号内容的名子去搜索查询
7、我们通过抓包查看剖析下
通过抓包也不难剖析出恳求参数的话就是我截图那样,稍后代码上将会呈现下来,然后通过恳求response返回的内容也可以看见诸如title、link、概要、更新时间等等的内容这儿我们主要取title和url,我要说明一下我们通过这些方法获取的link是临时链接并不是手机端打开那样的永久链接并且也无妨我们只要通过访问临时链接把内容下载出来就可以了这个临时链接的有效时长虽然也是太长时间的,如果我们想转换成永久链接我们可以通过手机端打开得到的就是永久链接地址了
大体概述下代码流程
1、调用登陆函数login_wechat通过webdrive扫码登陆微信公众号,这里不采用手动输入帐号密码的方法登陆是因为虽然输入帐号密码还是须要扫码确认
2、登录成功获取cookie信息保存本地cookie.txt文件
3、调用采集函数get_content获取cookie.txt的cookie值并提取token
4、拼接好我们须要的恳求参数后恳求素材管理中插口中我们待采集公众号信息
5、通过恳求插口获取文章的title、link并实现翻页功能
6、拿到我们待采集文章的link后恳求link地址下载文章内容
7、将title、link、内容对应保存csv文件