python抓取网页数据( Python,风车的网页垃圾文档似乎有点稀疏请给我一些建议)
优采云 发布时间: 2022-03-19 00:00python抓取网页数据(
Python,风车的网页垃圾文档似乎有点稀疏请给我一些建议)
使用 Python Windmill 进行网页抓取(如何准确地等待页面完全加载)
python网络抓取
使用 Python Windmill 进行 Web 抓取(如何准确地等待页面完全加载) forPageLoad 无法检查页面是否完全呈现在需要使用现有 DOM 重新加载页面的场景中,我使用 waits.forElement检测 DOM,以便脚本“确定”页面已加载。这有时会在页面加载之前检测到 DOM。在firefox中使用windmill测试客户端加载页面似乎需要很长时间。如果使用常规的 Firefox 浏览器加载相同的页面,可能需要 2 秒,但在测试客户端上可能需要 1 分钟。拖了这么久正常吗最后想知道风车的网页有没有更好的替代方案
我一直在玩风车来尝试一些网络抓取,但 API 正在等待。 forPageLoad 无法检查页面是否完全呈现
在需要使用现有 DOM 重新加载页面的场景中,我使用 waits.forElement 来检测 DOM,以便脚本“确定”页面是否已加载。这有时会在页面加载之前检测到 DOM
在 Firefox 中使用风车测试客户端加载页面似乎需要很长时间。如果使用常规的 Firefox 浏览器加载相同的页面,可能需要 2 秒,但在测试客户端上可能需要 1 分钟。需要这么长时间正常吗?
最后我想知道是否有更好的替代风车的网络垃圾邮件?文档似乎有点稀疏
请给我一些建议。谢谢:P
client.waits.sleep(milliseconds=u'2000')
2 秒绝对停顿
将在后续行中等待,直到页面加载或 20 秒后,以先到达者为准。将其视为有时间限制的断言。如果页面在 20 秒内加载,则通过,否则失败
希望对你有帮助
TD
如何为带有 AJAX 请求的页面定义“页面加载”?第三点:清除常规firefox浏览器中的缓存并尝试加载页面。需要多少时间?可以作为替代使用,但它使用文档方法。我清除了缓存,它的加载速度仍然没有测试客户端那么慢。对我来说,一旦加载了 DOM 并且填充了组合框或其他内容,页面就会加载。我不确定带有 AJAX 请求的页面是什么意思。