文章采集规则使用百度统计公众号文章全部关键词过滤
优采云 发布时间: 2021-08-05 05:06文章采集规则使用百度统计公众号文章全部关键词,过滤掉明显是软文的内容,如果重复出现要及时去除。采集时间选择正月初二到三。主要保证按时间采集文章,记录每一个时间的采集数量及关键词对应的内容。每一个设置完后,设置几天锁定。采集规则大小写,阿拉伯数字是不能采集的,汉字采集用自动识别,空格,语句通顺,都是可以采集的。
百度统计公众号输入公众号名称/关键词,即刻获取新增文章数。原创保护在输入公众号名称/关键词时,即刻获取首发文章数,优质文章还可以获取首图文。点击任意单元直接获取采集的多级标题(可以同时获取一级标题及多级标题),百度统计上会显示结构化文档样式。共享文章,共享任意单元里的文章。采集频率依据设置的设置及文章的存放时间计算每天的采集量。
日均文章采集量,按照最佳采集设置方案来设置,即一个规则设置下来获取的最大量,设置标准是每篇文章都有保存机会。采集设置里有编辑时间设置及修改时间设置,推荐有效时间点设置下来的量最多。ps采集规则设置好后文章全部采集完,需要相关文章切换小号操作。我目前文章多数都是小号采集。由于方法太过简单,都是用采集器自动获取相关文章,因此并没有遇到需要修改采集规则的时候。
可以用采集-在线采集来采集百度新闻频道,