python网页数据抓取(如何使用Python爬取敏感词和实现数据接口？|网易财经)

优采云发布时间: 2021-11-16 23:04

　　python网页数据抓取(如何使用Python爬取*敏*感*词*和实现数据接口？|网易财经)

　　本文文章主要介绍如何使用Python爬取*敏*感*词*并实现数据接口。

　　1.定期获取和解析数据

　　2.将数据存储到MongoDB

　　3.缓存数据到Redis

　　4.配置Nginx和数据接口

　　源码下载地址：

　　1.定期获取和解析数据

　　这次我们爬取的对象是网易财经的股票板块。我们先来分析一下链接。根据链接的格式，我们拼接了股票代码，年份和季度：

　　url = "http://quotes.money.163.com/trade/lsjysj_" + key + ".html?year=" + year + "&season=" + season

　　拼接好链接后，使用requests库获取页面内容：

　　requests.get(url)

self.parse_pager(content.content, item["code"])

　　考虑到网络请求可能会失败，我们设置了请求失败时的多次重请求（最多8次）。如果多次请求后请求仍然失败，则将请求的相关内容存储在error_logs中：

<p># 请求失败后重新请求(最多8次)

max_try = 8

for tries in range(max_try):

try:

content = requests.get(url)

self.parse_pager(content.content, item["code"])

break

except Exception:

if tries

0

2021-11-16

python网页数据抓取

0 个评论

要回复文章请先登录或注册