微信公众号文章采集的一些基本概念
优采云 发布时间: 2020-08-06 09:21本文已在我的智虎账户上发表: 微信公众号文章采集的一些基本概念
背景
人们经常问我一些与微信文章采集有关的常识性问题. 对于新手来说,确实没有很好地理解一些概念性问题. 但这常常令人讨厌,所以我写了一篇单独的文章来总结一些内容.
有关某些官方帐户文章/阅读界面采集要求的信息,请参考此书,或者您可以直接访问我的网站进行免费测试.
与公共帐户文章发布有关的概念
单次发布
单发行是指官方帐户同时发布的单篇或多篇文章(文章数为1至8).
在日本发布的帖子数
通常来说,一个正式帐户每天只能发布一次,但是某些政府/自媒体正式帐户可以多次发布.
官方帐户中的历史文章列表
官方帐户的历史文章列表按发布时间排序,最新发布在顶部. 一般来说,该界面每次都会返回最近的10个出版物,即10-80篇文章.
微信文章相关领域介绍
文章链接
公共帐户文章链接可以分为临时链接和永久链接,而永久链接可以分为短链接和长链接.
临时链接来自搜狗微信,有效期为6个小时.
永久链接是从微信应用程序获取的,并且不会失效(短链接可能会长时间失效).
# 临时链接(搜狗微信)
https://mp.weixin.qq.com/s?src=11×tamp=1591759801&ver=2391&signature=LRDTtpHjzm9w087lNZ-mUdy1TkEfrUoLsecGGO5WILQnxR3QymaGD-mCxiysWAmwUwMrGRBvX19uLtMNnFtm4-uT2s5zgMMehmULiO8tnZs=&new=1
# 永久链接-长链接
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650742155&idx=1&sn=137825a13a4c31fffb6b2347c0304366
# 永久链接-短链接
https://mp.weixin.qq.com/s/zxznxZNWuAUVJW6W7MrPJQ
对于文章采集,最好直接采集永久链接,否则,您需要将临时链接转换为永久链接(如果只需要采集文章的内容,可以在采集之前及时采集它)临时链接过期).
biz字段
biz是官方帐户的唯一ID,biz本身是base64编码的字符串,例如: MjM5MjAxNDM4MA ==
可以在文章的网页源代码中找到
biz(如下所示). 如果是长链接,则链接中__biz参数的值为biz.
值得注意的是,如果迁移了官方帐户,则biz也将更改.
别名
alias是官方帐户的外部ID,通常称为accountId,例如,官方帐户的别名-People's Daily是rmrbwx.
值得注意的是,如果官方帐户的作者未积极设置它,则别名为空,而用户名通常用作默认ID.
昵称
官方帐户名/昵称,例如[人民日报].
用户名
每个正式帐户都具有正式帐户的原创ID,以gh_开头,例如: gh_363b924965e9.
作者
发表文章的作者. 如果未设置,则为空.
中
已发布文章的序列号ID. 同一批次发表的文章具有相同的中点. 这个值正在增加.
idx
文章发表的位置. 在同一批次的文章中,idx的值从1增加,其中1表示标题(第一篇文章),依此类推.
文章发表时间
请注意,搜狗微信和微信应用中文章的发布时间略有不同,并且可能并不完全相同.
为了100%保证文章发表的顺序,请用中点来判断.
摘要
以上是我认为在采集微信文章之前需要了解的基本概念,以免事后省去一些重构麻烦〜