网页表格抓取( 《Python操作Excel表格技巧总结》及Python抓网页生成Excel文件)
优采云 发布时间: 2021-11-18 12:05网页表格抓取(
《Python操作Excel表格技巧总结》及Python抓网页生成Excel文件)
抓取网页生成Excel文件的方法的python实现
时间:2019-03-31
本文章给大家介绍了爬取网页生成Excel文件的Python实现。主要包括爬取网页生成Excel文件的Python实现。用例举例、应用技巧、基础知识点总结和注意事项有一定的参考价值,有需要的朋友可以参考。
本文介绍如何使用Python抓取网页生成Excel文件。分享给大家,供大家参考,如下:
Python抓取网页,主要使用PyQuery,这个和jQuery用法一样,超级棒
示例代码如下:
#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
itemsa=d('dl dt a') #取title元素
itemsb=d('dl dd') #取title元素
for j in range(0,len(itemsa)):
f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
#end for
#end for
f.close();
下一步是用Notepad++打开company.csv,然后将其转换为ANSI编码格式,并保存。然后用Excel软件打开csv文件,另存为Excel文件
对Python相关内容感兴趣的读者可以查看本站专题:《Python操作Excel表格技巧总结》、《Python文件及目录操作技巧总结》、《Python文本文件操作技巧总结》、 《Python数据结构与算法教程》、《Python函数技巧总结》、《Python字符串操作技巧总结》、《Python入门及高级经典教程》
我希望这篇文章能对你的 Python 编程有所帮助。