批量采集自动提取保存网页内容这个是本教程中所使用的
优采云 发布时间: 2021-07-08 05:24批量采集自动提取保存网页内容这个是本教程中所使用的
批量采集自动提取和保存网页内容。这是本教程使用的网页:本教程是教大家如何使用网页自动操作通用工具中的刷新工具来刷新和提取网页内容。从(网页)批量获取姓名、电话、职业等信息,并将结果保存到文件中。下面是教程的开始。先看软件的一般界面: 然后需要先添加网址,点击“添加”按钮,输入需要刷新提取信息的网址,然后点击“自动获取”按钮。如下图所示: 下一步,我们设置刷新间隔。刷新间隔可以在网页自动刷新监控操作中设置。在这里,我将其设置为每 10 秒刷新一次。如果去掉勾选的刷新限制,则不会被限制。在本教程中,每次刷新都需要保存更改的网页信息,所以在“其他监控”中,需要设置“无条件启动监控报警”。 (查看各自需求的设置) 然后设置需要保存的网页信息。在“监控设置”中添加“报警提示动态内容”---即可自动获取。如下图: 点击自动获取后,会打开之前添加的网址。页面加载完成后,选择需要获取的信息-右键-获取元素-自动提取元素标识-添加元素。操作如下:这里使用value作为元素属性名称。这里需要注意的是,有些网页需要延迟打开才能开始监控,否则会失效。所以这里设置了“*敏*感*词*前的延迟等待时间为3秒”。 (此处同时监控多个网页内容) 此版本的网页自动操作通用工具可以保存三种格式,分别是csv文件、txt文件和每个动态元素分别保存为一个文件,在“报警温馨提示》》可以设置类型。以下是监控网页后保存的各种文件格式。第一个是将每个元素分别保存在一个单独的txt文件中;第二个是将所有元素合并到一个txt文件中保存:第三个就是将所有元素保存为csv文件:本教程结束,欢迎大家搜索:木头软件。