分享:网易自媒体文章采集
优采云 发布时间: 2020-12-13 12:15网易自媒体文章采集
本文介绍了使用优采云采集网易帐户文章的方法。
采集 URL:
NetEase帐户(以前称为NetEase订阅)是在NetEase Media完成“两端”的集成和升级之后新创建的自媒体内容分发和品牌推广平台。本文以网易账户的首页列表为例,您也可以将采集 URL 采集更改为其他列表。
采集内容:文章标题,出版时间,文章文本。
使用功能点:
l列表循环
lDetails 采集
第1步:创建网易帐户文章采集任务
1)进入主界面,选择“自定义采集”
2)复制采集的URL并将其粘贴到网站输入框中,单击“保存URL”
第2步:创建循环,然后单击以加载更多
1)打开网页后,打开右上角的“过程”按钮,并从左侧的过程显示界面以一个步骤的循环进行拖动,如下所示
2)然后拖动到页面底部,并看到“加载更多”按钮,因为如果要查看更多内容,则需要循环单击“加载更多”,因此我们需要设置一个单击的循环步骤“装载更多” 。注意:采集更多内容需要加载更多内容。本文文章仅用于演示,因此选择执行并单击“加载更多” 20次,您可以根据实际需要进行添加或减少。
第3步:创建循环点击列表采集详细信息
1)单击文章列表的第一个和第二个标题,然后选择“循环单击每个元素”按钮。这样会创建一个循环单击列表命令,并且可以在采集器中看到当前列表页面的内容。
2)然后,我们可以提取所需的文本数据。下图提取了标题,时间和正文的文本内容。其他信息可以自由删除和编辑。然后,您可以点击保存以启动本地采集。
3)单击以启动采集,采集器开始提取数据。
4)采集完成后可以导出。