网页表格抓取( 《Python操作Excel表格技巧总结》及Python抓网页生成Excel文件)

优采云 发布时间: 2021-11-18 12:05

  网页表格抓取(

《Python操作Excel表格技巧总结》及Python抓网页生成Excel文件)

  抓取网页生成Excel文件的方法的python实现

  时间:2019-03-31

  本文章给大家介绍了爬取网页生成Excel文件的Python实现。主要包括爬取网页生成Excel文件的Python实现。用例举例、应用技巧、基础知识点总结和注意事项有一定的参考价值,有需要的朋友可以参考。

  本文介绍如何使用Python抓取网页生成Excel文件。分享给大家,供大家参考,如下:

  Python抓取网页,主要使用PyQuery,这个和jQuery用法一样,超级棒

  示例代码如下:

  

#-*- encoding:utf-8 -*-

import sys

import locale

import string

import traceback

import datetime

import urllib2

from pyquery import PyQuery as pq

# 确定运行环境的encoding

reload(sys);

sys.setdefaultencoding('utf8');

f = open('gongsi.csv', 'w');

for i in range(1,24):

d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));

itemsa=d('dl dt a') #取title元素

itemsb=d('dl dd') #取title元素

for j in range(0,len(itemsa)):

f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));

#end for

#end for

f.close();

  下一步是用Notepad++打开company.csv,然后将其转换为ANSI编码格式,并保存。然后用Excel软件打开csv文件,另存为Excel文件

  对Python相关内容感兴趣的读者可以查看本站专题:《Python操作Excel表格技巧总结》、《Python文件及目录操作技巧总结》、《Python文本文件操作技巧总结》、 《Python数据结构与算法教程》、《Python函数技巧总结》、《Python字符串操作技巧总结》、《Python入门及高级经典教程》

  我希望这篇文章能对你的 Python 编程有所帮助。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线