采集文章(如何在列表中建立标签采集数据(图))
优采云 发布时间: 2021-12-24 01:04采集文章(如何在列表中建立标签采集数据(图))
使用优采云采集器到采集文章时,一般按照采集列表URL-文章 URL-content的顺序来操作,并且核心部分是采集文章的内容,这一步会在采集到文章之后进行,特殊情况下,比如我们的采集期间国开问答,部分重要问答数据在列表页:
图中关注数、回答数、标签信息都在列表页。问答详情页采集没有相关数据,那么如何将这三个信息采集放入文章?
今天,鱼豆教你如何在列表中创建标签采集数据。以优采云采集器7.6为例,第一步:采集URL规则-多级URL 采集规则-URL获取选项-手动填写链接地址规则——在脚本规则中写这个:
"[Parameter]" title="(*)" class="title">(*)class="time">[label:time]class="num">[label:number of answers]/[label:number意见]
如图:
注意只能有采集代码,不能有下载文件。因为这个标签数据是在URL列表中获取的,所以在测试规则的时候是不能编辑的,也就是不能进行一些过滤和替换操作。设置完成后,文章Content采集界面会自动在列表页面列出我们设置的标签:
激活权限后,即可免费下载全站所有数千TB网络资源,点击>>>查看所有资源,涵盖音乐、电影、有声读物、电子书、*敏*感*词*、*敏*感*词*、课程等。 ,无限次,永久免费,点击>>>了解更多!