python抓取网页数据( Python,风车的网页垃圾文档似乎有点稀疏请给我一些建议)

优采云 发布时间: 2022-03-19 00:00

  python抓取网页数据(

Python,风车的网页垃圾文档似乎有点稀疏请给我一些建议)

  使用 Python Windmill 进行网页抓取(如何准确地等待页面完全加载)

  python网络抓取

  使用 Python Windmill 进行 Web 抓取(如何准确地等待页面完全加载) forPageLoad 无法检查页面是否完全呈现在需要使用现有 DOM 重新加载页面的场景中,我使用 waits.forElement检测 DOM,以便脚本“确定”页面已加载。这有时会在页面加载之前检测到 DOM。在firefox中使用windmill测试客户端加载页面似乎需要很长时间。如果使用常规的 Firefox 浏览器加载相同的页面,可能需要 2 秒,但在测试客户端上可能需要 1 分钟。拖了这么久正常吗最后想知道风车的网页有没有更好的替代方案

  我一直在玩风车来尝试一些网络抓取,但 API 正在等待。 forPageLoad 无法检查页面是否完全呈现

  在需要使用现有 DOM 重新加载页面的场景中,我使用 waits.forElement 来检测 DOM,以便脚本“确定”页面是否已加载。这有时会在页面加载之前检测到 DOM

  在 Firefox 中使用风车测试客户端加载页面似乎需要很长时间。如果使用常规的 Firefox 浏览器加载相同的页面,可能需要 2 秒,但在测试客户端上可能需要 1 分钟。需要这么长时间正常吗?

  最后我想知道是否有更好的替代风车的网络垃圾邮件?文档似乎有点稀疏

  请给我一些建议。谢谢:P

   client.waits.sleep(milliseconds=u'2000')

  2 秒绝对停顿

  将在后续行中等待,直到页面加载或 20 秒后,以先到达者为准。将其视为有时间限制的断言。如果页面在 20 秒内加载,则通过,否则失败

  希望对你有帮助

  TD

  如何为带有 AJAX 请求的页面定义“页面加载”?第三点:清除常规firefox浏览器中的缓存并尝试加载页面。需要多少时间?可以作为替代使用,但它使用文档方法。我清除了缓存,它的加载速度仍然没有测试客户端那么慢。对我来说,一旦加载了 DOM 并且填充了组合框或其他内容,页面就会加载。我不确定带有 AJAX 请求的页面是什么意思。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线