python网页数据抓取(如何使用Python爬取*敏*感*词*和实现数据接口?|网易财经)
优采云 发布时间: 2021-11-16 23:04python网页数据抓取(如何使用Python爬取*敏*感*词*和实现数据接口?|网易财经)
本文文章主要介绍如何使用Python爬取*敏*感*词*并实现数据接口。
1.定期获取和解析数据
2.将数据存储到MongoDB
3.缓存数据到Redis
4.配置Nginx和数据接口
源码下载地址:
1.定期获取和解析数据
这次我们爬取的对象是网易财经的股票板块。我们先来分析一下链接。根据链接的格式,我们拼接了股票代码,年份和季度:
url = "http://quotes.money.163.com/trade/lsjysj_" + key + ".html?year=" + year + "&season=" + season
拼接好链接后,使用requests库获取页面内容:
requests.get(url)
self.parse_pager(content.content, item["code"])
考虑到网络请求可能会失败,我们设置了请求失败时的多次重请求(最多8次)。如果多次请求后请求仍然失败,则将请求的相关内容存储在error_logs中:
<p># 请求失败后重新请求(最多8次)
max_try = 8
for tries in range(max_try):
try:
content = requests.get(url)
self.parse_pager(content.content, item["code"])
break
except Exception:
if tries