网页抓取数据(问财财经搜索:同花顺旗下的服务,)

优采云 发布时间: 2021-10-18 16:00

  网页抓取数据(问财财经搜索:同花顺旗下的服务,)

  原创参考:

  文财财经搜索是通华顺的服务之一。主要提供上市公司公告、研究报告、实时新闻的检索和参考资料。与其他股票软件相比,一个强大的功能是可以根据您指定的条件使用自然语言进行过滤。然而,现有的大多数市场信息软件并没有很好地支持它。

  

  但是,文采有一个缺陷,它只能获取一天的股票相关信息。如果我们要抓取一段时间的历史股票信息,就必须在网络上批量抓取。

  其实我们可以自己做一个爬虫软件定义时间、日期和搜索关键词,批量下载一定日期范围内的数据。

  我们以抓取每天收盘价大于均线股票数量的股票为例,使用r实现抓取:

  比如需要获取10月12日的数据,在文采输入如下关键词

  

  查看搜索结果链接,可以看到链接中关键词的显示规则

  

  因此,在r中,我们可以通过做一段时间的伪链接,不断地向服务器发送搜索请求,从而实现对一段日期数据的批量抓取

  url=paste(";preParams=&ts=1&f=1&qs=result_rewrite&selfsectsn=&querytype=&searchfilter=&tid=stockpick&w=",as.character(as.Date(i, origin = "1970-01-01")) ,input< @2)

  然后,我们查看某天的网页源代码,可以找到*敏*感*词*对应的xml源代码

  

  因此,您可以通过编写 html_value 函数来获取此 xmlValue

  路径

  html_value

  网页

  网页

  页面树

  价值

  ##一世

  # 值 1

  # 值 2

  # 值 3

  # 值 4

  value1=字符(0)

  for(i in 1:length(value))value1[i]

  返回(值1)

  }

  然后封装成一个函数,可以随意下载一段时间内几个关键词对应的*敏*感*词*。

  

  最后,可以将抓取到的数据批量输出到excel文件中,方便后续分析。

  

  原文请访问官网

  

  【高端数据】第三方数据服务商提供全面的统计分析和数据挖掘咨询服务,为客户定制个性化的数据解决方案和行业报告。

  

  中国专业的统计分析和数据挖掘咨询服务商:Topend Data(业务合作请联系官网客服)

  帅哥们关注了拓电数据组^..^~

  QQ交流群:186388004

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线