excel抓取网页动态数据(接下来就是使用xlwt及xlwt模块实现urllib2有用过,可参看 )
优采云 发布时间: 2021-12-11 03:18excel抓取网页动态数据(接下来就是使用xlwt及xlwt模块实现urllib2有用过,可参看
)
一直想做一个网页的excel导出功能。最近抽时间研究了一下,用urllib2和BeautifulSoup和xlwt模块实现了
之前使用过urllib2模块。 BeautifulSoup模块请参考,介绍更详细。
以下是部分视图代码:
首先使用urlopen解析网页数据
urlfile = urllib2.urlopen('要解析的url地址')
html = urlfile.read()
创建一个 BeautifulSoup 对象
soup = BeautifulSoup(html)
以表格数据为例,使用findAll获取所有标签数据并将其内容添加到列表中。
result=[]
for line in soup.findAll('td'):
result.append(line.string)
下一步就是使用xlwt模块生成excel实现
创建excel文件
workbook = xlwt.Workbook(encoding = 'utf8')
worksheet = workbook.add_sheet('My Worksheet')
在excel文件中插入数据
for tag in range(0,8):
worksheet.write(0, tag, label = result[tag])
返回结果到网页,然后网页上就可以生成excel了
response = HttpResponse(content_type='application/msexcel')
response['Content-Disposition'] = 'attachment; filename=example.xls'
workbook.save(response)
return response