excel抓取网页动态数据(彩票数据获取并写入excel表格数据来源自己看吧~用外链通不过 )
优采云 发布时间: 2021-12-29 22:17excel抓取网页动态数据(彩票数据获取并写入excel表格数据来源自己看吧~用外链通不过
)
快下班了,正要买彩票,所以写了2个脚本,一个下载最新开奖数据,一个统计开奖号码,分享给大家!
获取彩票数据写入excel表格
自己看资料来源~ 外链是打不通的。. .
使用的库:xlwt、requests、lxml
有几点需要注意:
1、建立列表。因为保存excel文件时用到了列表,所以新建了一个函数,取网页上的5个数据:时间、周期、抽奖123,然后将每个页面嵌套写入列表中。类似的结构是[[time, period Number, lottery 1, 2, 3], [time, period, lottery 1, 2, 3]......],在循环页面,获取所有数据!注意列表的形式和列表的结果,这在你写表的时候很重要!
2、写入数据。xlwt写入文件的方法是ws.write(line, column, data),将文件逐行写入,因此新建一个变量行(代码第36行),每次增加1行写。
其他方面很简单,没有反爬,只是为了获取数据,方便分析!
最终excel表中的数据
是这样的:
最后大概有4840行数据,足够我们分析了!
数据处理
可以用xlrd库~xlwt库和xlrd库好像一个是写数据的,一个是读数据的。. .
我写了一个抢手的热门号码,也就是最频繁的号码。如果您有更好的想法或玩法,可以自己实现!
先读取数据,然后得到2.3.每行的4列,每列写一个list(现在后悔了,不应该写这么多数据进去),然后合并将3个列表合为一个总列表,所以我们有4个列表,取出每个列表中出现频率最高的数字,代码如下:
出现频率最高的第一个数字是 [3]
出现频率最高的第二个数字是[6]
频率最高的第三个数字是[8]
单数出现频率最高[3]
因为赶时间下班。. 我使用了所有列表推导式,我没有使用 Pandas 或可视化库来制作很酷的图表。当我制定一个完美的预测计划时,我正在做[Manual Cry],但按照目前的趋势,没有希望。向上。. .
最后我想说的是,从开始研究分析各种数据到现在买彩票的习惯,我从来没有中过大奖(超过200个算大奖)!果然,童话都是骗人的……还是学python更好玩!