微信公众号文章采集的一些基本概念

优采云 发布时间: 2020-08-06 09:21

  本文已在我的智虎账户上发表: 微信公众号文章采集的一些基本概念

  背景

  人们经常问我一些与微信文章采集有关的常识性问题. 对于新手来说,确实没有很好地理解一些概念性问题. 但这常常令人讨厌,所以我写了一篇单独的文章来总结一些内容.

  有关某些官方帐户文章/阅读界面采集要求的信息,请参考此书,或者您可以直接访问我的网站进行免费测试.

  与公共帐户文章发布有关的概念

  单次发布

  单发行是指官方帐户同时发布的单篇或多篇文章(文章数为1至8).

  在日本发布的帖子数

  通常来说,一个正式帐户每天只能发布一次,但是某些政府/自媒体正式帐户可以多次发布.

  官方帐户中的历史文章列表

  官方帐户的历史文章列表按发布时间排序,最新发布在顶部. 一般来说,该界面每次都会返回最近的10个出版物,即10-80篇文章.

  微信文章相关领域介绍

  文章链接

  公共帐户文章链接可以分为临时链接和永久链接,而永久链接可以分为短链接和长链接.

  临时链接来自搜狗微信,有效期为6个小时.

  永久链接是从微信应用程序获取的,并且不会失效(短链接可能会长时间失效).

  

# 临时链接(搜狗微信)

https://mp.weixin.qq.com/s?src=11&timestamp=1591759801&ver=2391&signature=LRDTtpHjzm9w087lNZ-mUdy1TkEfrUoLsecGGO5WILQnxR3QymaGD-mCxiysWAmwUwMrGRBvX19uLtMNnFtm4-uT2s5zgMMehmULiO8tnZs=&new=1

# 永久链接-长链接

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650742155&idx=1&sn=137825a13a4c31fffb6b2347c0304366

# 永久链接-短链接

https://mp.weixin.qq.com/s/zxznxZNWuAUVJW6W7MrPJQ

  对于文章采集,最好直接采集永久链接,否则,您需要将临时链接转换为永久链接(如果只需要采集文章的内容,可以在采集之前及时采集它)临时链接过期).

  biz字段

  biz是官方帐户的唯一ID,biz本身是base64编码的字符串,例如: MjM5MjAxNDM4MA ==

  可以在文章的网页源代码中找到

  biz(如下所示). 如果是长链接,则链接中__biz参数的值为biz.

  

  值得注意的是,如果迁移了官方帐户,则biz也将更改.

  别名

  alias是官方帐户的外部ID,通常称为accountId,例如,官方帐户的别名-People's Daily是rmrbwx.

  值得注意的是,如果官方帐户的作者未积极设置它,则别名为空,而用户名通常用作默认ID.

  昵称

  官方帐户名/昵称,例如[人民日报].

  用户名

  每个正式帐户都具有正式帐户的原创ID,以gh_开头,例如: gh_363b924965e9.

  作者

  发表文章的作者. 如果未设置,则为空.

  中

  已发布文章的序列号ID. 同一批次发表的文章具有相同的中点. 这个值正在增加.

  idx

  文章发表的位置. 在同一批次的文章中,idx的值从1增加,其中1表示标题(第一篇文章),依此类推.

  文章发表时间

  请注意,搜狗微信和微信应用中文章的发布时间略有不同,并且可能并不完全相同.

  为了100%保证文章发表的顺序,请用中点来判断.

  摘要

  以上是我认为在采集微信文章之前需要了解的基本概念,以免事后省去一些重构麻烦〜

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线