网页抓取数据(问财财经搜索:同花顺旗下的服务,)
优采云 发布时间: 2021-10-18 16:00网页抓取数据(问财财经搜索:同花顺旗下的服务,)
原创参考:
文财财经搜索是通华顺的服务之一。主要提供上市公司公告、研究报告、实时新闻的检索和参考资料。与其他股票软件相比,一个强大的功能是可以根据您指定的条件使用自然语言进行过滤。然而,现有的大多数市场信息软件并没有很好地支持它。
但是,文采有一个缺陷,它只能获取一天的股票相关信息。如果我们要抓取一段时间的历史股票信息,就必须在网络上批量抓取。
其实我们可以自己做一个爬虫软件定义时间、日期和搜索关键词,批量下载一定日期范围内的数据。
我们以抓取每天收盘价大于均线股票数量的股票为例,使用r实现抓取:
比如需要获取10月12日的数据,在文采输入如下关键词
查看搜索结果链接,可以看到链接中关键词的显示规则
因此,在r中,我们可以通过做一段时间的伪链接,不断地向服务器发送搜索请求,从而实现对一段日期数据的批量抓取
url=paste(";preParams=&ts=1&f=1&qs=result_rewrite&selfsectsn=&querytype=&searchfilter=&tid=stockpick&w=",as.character(as.Date(i, origin = "1970-01-01")) ,input< @2)
然后,我们查看某天的网页源代码,可以找到*敏*感*词*对应的xml源代码
因此,您可以通过编写 html_value 函数来获取此 xmlValue
路径
html_value
网页
网页
页面树
价值
##一世
# 值 1
# 值 2
# 值 3
# 值 4
value1=字符(0)
for(i in 1:length(value))value1[i]
返回(值1)
}
然后封装成一个函数,可以随意下载一段时间内几个关键词对应的*敏*感*词*。
最后,可以将抓取到的数据批量输出到excel文件中,方便后续分析。
原文请访问官网
【高端数据】第三方数据服务商提供全面的统计分析和数据挖掘咨询服务,为客户定制个性化的数据解决方案和行业报告。
中国专业的统计分析和数据挖掘咨询服务商:Topend Data(业务合作请联系官网客服)
帅哥们关注了拓电数据组^..^~
QQ交流群:186388004