文章采集api(Java开发不会Android囧),二来插件模拟点击网页版 )
优采云 发布时间: 2021-08-28 04:08文章采集api(Java开发不会Android囧),二来插件模拟点击网页版
)
学过微信文章reading和点赞数的同学都知道怎么获取这两个数,关键是获取一个有效的微信key。这个键的有效时间是2小时左右,而且对访问频率也有限制,访问频率可以通过密码控制,速度不会每10秒被封锁一次。接下来,我们来谈谈如何完全自动获取有效密钥。
想必大部分同学都会去手机上钥匙吧。一是不知道怎么做(Java开发不懂Android囧),二是打算直接在PC端实现这个爬虫过程。于是开始研究微信Web客户端。其实这个key很容易获取,转发一个公众号文章到web客户端,从客户端打开就可以看到链接里的key了。
我意识到的想法是:
使用chrome浏览器插件在网页版客户端模拟点击公众号微信文章,获取本链接中key和uin两个参数。通过websocket传递给本机的Java(抓取到时候通过websocket向chrome发送消息,然后返回key和uin)
chrome的插件已经写好了。具体使用步骤是打开你的服务器(启动你的websocket服务器),点击微信图标,插件图标(这一步是连接websocket客户端到服务器)。确保文件转发助手里有公众号文章(任意一个),然后程序就可以调用了。
Java 获取的密钥
现在整个爬取过程都写完了,可以使用了(我的爬取量很小,请研究其他方法。)。我觉得整个爬虫过程中还有一个很重要的点就是获取微信文章的列表(抓到搜狗被屏蔽了...)。因为我有公众号的账号密码,一开始我只是直接从公众号的素材管理里抓取了,但是那是不允许的,一个是上面的时间编辑时间不是发布时间。第二个是文章的mid和sn这两个参数从中抓取的点赞数都是0,阅读数都是2.所以我猜在发布之前,发布之后,有是两组mid和sn。感谢大神,云烟分享了微信查询历史界面(他在手机上抢了包)。反正是http,所以直接用。这边走。就是这样。
调用微信查询历史数据接口获取发布地址文章。每个公众号的biz参数是固定的,可以从链接中获取。只有key和uin才能获得过去一周文章某个公众号。接口地址:
获取文章列表,取出biz、mid、sn、idx等参数,加上key和uin,然后就可以调整界面()获取点赞数和阅读数了。需要说明的是,UA的UA使用的是手机。