抓取网页生成电子书(本文实例讲述Python实现抓取网页生成Excel文件的方法。)

优采云 发布时间: 2022-01-09 21:20

  抓取网页生成电子书(本文实例讲述Python实现抓取网页生成Excel文件的方法。)

  本文中的示例描述了 Python 如何实现爬取网页以生成 Excel 文件。分享给大家,供大家参考,如下:

  Python抓取网页,主要使用PyQuery,和jQuery一样,超级强大

  示例代码如下:

   #-*- encoding:utf-8 -*- import sys import locale import string import traceback import datetime import urllib2 from pyquery import PyQuery as pq # 确定运行环境的encoding reload(sys); sys.setdefaultencoding('utf8'); f = open('gongsi.csv', 'w'); for i in range(1,24): d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i)); itemsa=d('dl dt a') #取title元素 itemsb=d('dl dd') #取title元素 for j in range(0,len(itemsa)): f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text)); #end for #end for f.close();

  接下来就是用Notepad++打开gongsi.csv,然后[emailprotected]~Codewang把它转成ANSI编码格式保存。然后用Excel软件打开csv文件,保存为Excel文件

  对更多Python相关内容感兴趣的读者可以查看本站专题:《Python中Excel表格技巧总结》、《Python文件和目录操作技巧总结》、《Python文本文件操作总结》 《技能》、《Python数据》《结构与算法教程》、《Python函数技巧总结》、《Python字符串操作技巧总结》和《Python入门与进阶经典教程》

  希望这篇文章对你的 Python 编程有所帮助。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线