网页flash文本抓取器(Twill和mechanize不支持Javascript(1)上运行,appengine只支持纯Python代码)

优采云 发布时间: 2022-02-03 02:16

  网页flash文本抓取器(Twill和mechanize不支持Javascript(1)上运行,appengine只支持纯Python代码)

  Twill 和 mechanize 不支持 Javascript,Qt 和 Selenium 不支持在 App Engine 上运行 ((1)),appengine 只支持纯 Python 代码。不知道有没有纯 Python Javascript 解释器,就是这样在 App Engine 上你只需要部署一个支持 JS 的爬虫 :-(.

  也许 Java 中的某些东西至少可以让您部署到应用程序引擎(Java 版本)?Java 和 Python 中的 App Engine 应用程序版本可以使用相同的数据存储,因此您可以将应用程序的部分内容保留在 Python 中。. . 只是不需要了解 Javascript。不幸的是,我对 Java/AE 环境知之甚少,无法推荐尝试任何特定的包。

  (1):为了澄清这一点,似乎有一个误解让我被否决了:如果你在另一台计算机上运行 Selenium 或其他爬虫,你当然可以定位 网站 (不管如何您的目标 网站 已部署,它使用什么编程语言等,只要它是您可以访问的 网站,[真正的 网站: flash&c,可能不同]] . 我读到的问题是,OP 正在寻找让刮板作为应用程序引擎应用程序的一部分运行的方法——这是有问题的部分,而不是你(或其他人 ;-) 运行网站被抓取的地方!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线