python网页数据抓取(如何使用Python爬取*敏*感*词*和实现数据接口?|网易财经)

优采云 发布时间: 2021-11-16 23:04

  python网页数据抓取(如何使用Python爬取*敏*感*词*和实现数据接口?|网易财经)

  本文文章主要介绍如何使用Python爬取*敏*感*词*并实现数据接口。

  1.定期获取和解析数据

  2.将数据存储到MongoDB

  3.缓存数据到Redis

  4.配置Nginx和数据接口

  源码下载地址:

  1.定期获取和解析数据

  这次我们爬取的对象是网易财经的股票板块。我们先来分析一下链接。根据链接的格式,我们拼接了股票代码,年份和季度:

  url = "http://quotes.money.163.com/trade/lsjysj_" + key + ".html?year=" + year + "&season=" + season

  拼接好链接后,使用requests库获取页面内容:

  requests.get(url)

self.parse_pager(content.content, item["code"])

  考虑到网络请求可能会失败,我们设置了请求失败时的多次重请求(最多8次)。如果多次请求后请求仍然失败,则将请求的相关内容存储在error_logs中:

<p># 请求失败后重新请求(最多8次)

max_try = 8

for tries in range(max_try):

try:

content = requests.get(url)

self.parse_pager(content.content, item["code"])

break

except Exception:

if tries

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线