文章采集调用(R语言爬虫格式的json格式,寻找新的方法!)

优采云 发布时间: 2022-04-12 19:35

  文章采集调用(R语言爬虫格式的json格式,寻找新的方法!)

  ==========背景===================

  最近一直在用R语言爬,但是有些网站是动态json格式的。每次都找到重定向的 URL 很麻烦。因此,我正在寻找一种新方法,构建一个浏览器,在浏览器中查找 URL。于是出现了以下问题:

  ==========执行步骤分割线============

  1、cmd enable java -jar selenium-server-standalone-2.53.0.jar //启动selenium

  2、R 控制台

  > library("Rwebdriver", lib.loc="C:/Program Files/R/R-3.2.3/library")

  加载所需的包:RCurl

  加载所需的包:bitops

  加载所需包:RJSONIO

  > library("XML", lib.loc="\\\\CNDOUW0000/Users/CNLeeWi/R/win-library/3.2")

  > start_session(root = "" ,browser = "firefox")

  函数错误(类型、msg、asError = TRUE):

  无法连接到 localhost 端口 80:连接被拒绝

  ==========相关信息链接==================

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线