在优采云中如何设置?Ajax超时设置为几秒合适
优采云 发布时间: 2021-08-19 02:17
在优采云中如何设置?Ajax超时设置为几秒合适
④ 点击搜狗微信[文章link]
⑤ 点击【百度点击】按钮
答案:1 是; 2 是; 3是; 4 不是; 5 是。
三、是ajax点击,优采云怎么设置?
1、优采云自己判断网页是ajax
判断是Ajax点击后,会自动检查【Ajax加载数据】并设置一定的【Ajax超时】时间。
如下图,百度地图上的搜索按钮使用了Ajax技术。 优采云自动选择【Ajax Load Data】,设置【Ajax Timeout】为3秒。
什么是[Ajax 超时]?点击后的等待时间,过了这个时间,进行下一步。
【Ajax 超时】多少秒合适?超过【点击后加载新数据所需时间】,请注意点击网页本身后加载新数据所需时间。
如果优采云自动设置的【Ajax超时时间】太短,导致无法采集到数据,可以相应延长【Ajax超时时间】,建议5-10秒,可以根据情况调整网页。
如果是ajax点击,但优采云中没有设置【Ajax加载数据】会怎样?
对于【点击】【翻页】等会引起页面变化的步骤,优采云根据网页是否已经加载来决定是否进行下一步:加载完成,进行下一步如果未完成,请等待完成并继续下一步。
非Ajax网页,点击后会有网页重新加载的过程。加载完成后,优采云就知道网页已经加载完毕,可以进行下一步了。
ajax网页,点击后网页不会重新加载,没有变化,优采云无法判断网页是否加载,默认点击后等待120秒。但实际上,点击 Ajax 后,本地数据会在几秒钟内出现。默认情况下,等待 120 秒会极大地影响采集 的速度。
2、是Ajax网页,但优采云没有自动判断
对应的步骤我们需要手动设置Ajax:勾选【Ajax加载数据】,设置一定的【Ajax超时】时间。
目前,自动判断非常准确。这种情况很少见,也没有演示。
四、不是ajax点击,可以设置【ajax超时】吗?
有些网页没有被ajax点击,点击后重新加载。 采集的数据已经出现在页面上,但是地址栏还没有加载。 优采云 会等待加载完成再进行下一步,这会减慢采集 的速度。
对于这种情况,可以设置【Ajax timeout】强制停止网页加载。但需要注意的是,【Ajax timeout】时间必须比采集数据的实际加载时间稍长。比如采集的数据实际在5秒内加载完成,设置【Ajax超时】为7秒。即使7秒后网址栏还在加载,优采云也会强制停止加载并进行下一步,从而提高采集的速度。