excel抓取网页动态数据(接下来就是使用xlwt及xlwt模块实现urllib2有用过,可参看 )

优采云 发布时间: 2021-12-11 03:18

  excel抓取网页动态数据(接下来就是使用xlwt及xlwt模块实现urllib2有用过,可参看

)

  一直想做一个网页的excel导出功能。最近抽时间研究了一下,用urllib2和BeautifulSoup和xlwt模块实现了

  之前使用过urllib2模块。 BeautifulSoup模块请参考,介绍更详细。

  以下是部分视图代码:

  首先使用urlopen解析网页数据

  urlfile = urllib2.urlopen('要解析的url地址')

html = urlfile.read()

  创建一个 BeautifulSoup 对象

  soup = BeautifulSoup(html)

  以表格数据为例,使用findAll获取所有标签数据并将其内容添加到列表中。

  result=[]

for line in soup.findAll('td'):

result.append(line.string)

  下一步就是使用xlwt模块生成excel实现

  创建excel文件

  workbook = xlwt.Workbook(encoding = 'utf8')

worksheet = workbook.add_sheet('My Worksheet')

  在excel文件中插入数据

  for tag in range(0,8):

worksheet.write(0, tag, label = result[tag])

  返回结果到网页,然后网页上就可以生成excel了

  response = HttpResponse(content_type='application/msexcel')

response['Content-Disposition'] = 'attachment; filename=example.xls'

workbook.save(response)

return response

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线