文章采集调用(R语言爬虫格式的json格式,寻找新的方法!)
优采云 发布时间: 2022-04-12 19:35文章采集调用(R语言爬虫格式的json格式,寻找新的方法!)
==========背景===================
最近一直在用R语言爬,但是有些网站是动态json格式的。每次都找到重定向的 URL 很麻烦。因此,我正在寻找一种新方法,构建一个浏览器,在浏览器中查找 URL。于是出现了以下问题:
==========执行步骤分割线============
1、cmd enable java -jar selenium-server-standalone-2.53.0.jar //启动selenium
2、R 控制台
> library("Rwebdriver", lib.loc="C:/Program Files/R/R-3.2.3/library")
加载所需的包:RCurl
加载所需的包:bitops
加载所需包:RJSONIO
> library("XML", lib.loc="\\\\CNDOUW0000/Users/CNLeeWi/R/win-library/3.2")
> start_session(root = "" ,browser = "firefox")
函数错误(类型、msg、asError = TRUE):
无法连接到 localhost 端口 80:连接被拒绝
==========相关信息链接==================