python网页数据抓取(《PythonSocket编程技巧总结》及Python简单实现网页内容抓取功能)

优采云发布时间: 2021-11-07 03:03

　　本文文章主要介绍了Python对网页内容抓取功能的简单实现，并结合示例表单，分析了Python基于urllib模块的网页请求、内容阅读等相关操作技巧。有需要的朋友可以参考以下

　　本文中的例子描述了Python爬取网页内容功能的简单实现。分享给大家，供大家参考，如下：

　　使用模块：

　　 import urllib2 import urllib

　　常见爬取示例：

　　 #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib2 url = 'http://www.baidu.com' #创建request对象 request = urllib2.Request(url) #发送请求，获取结果 try: response = urllib2.urlopen(request) except BaseException, err: print err exit() #获取状态码，如果是200表示获取成功 code = response.getcode() print code #读取内容 if 200 == code: content = response.read() print content

　　获取获取实例的请求：

　　 #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib2 import urllib #urllib2使用GET方式的请求 url = 'http://www.baidu.com/s' values = {'wd' : '车云'} # 必须编码 data = urllib.urlencode(values) url = url + '?' + data print url #url == http://www.baidu.com/s?wd=%E8%BD%A6%E4%BA%91 #创建request对象 request = urllib2.Request(url) #发送请求，获取结果 try: response = urllib2.urlopen(request) except BaseException, err: print err exit() #获取状态码，如果是200表示获取成功 code = response.getcode() print code #读取内容 if 200 == code: content = response.read() print content

　　更多Python相关内容请参考本站专题：《Python Socket编程技巧总结》、《Python正则表达式使用总结》、《Python数据结构与算法教程》、《Python函数使用技巧》总结》、《Python字符串操作技巧总结》、《Python入门及进阶经典教程》、《Python文件和目录操作技巧总结》

　　希望这篇文章对你的 Python 编程有所帮助。

　　以上是Python中简单实现网页内容爬取功能示例的详细内容。更多详情请关注其他相关html中文网站文章！

0

2021-11-07

python网页数据抓取

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

python网页数据抓取(《PythonSocket编程技巧总结》及Python简单实现网页内容抓取功能)

0 个评论

发起人

AI时代内容工厂

python网页数据抓取(《PythonSocket编程技巧总结》及Python简单实现网页内容抓取功能)

0 个评论

发起人

相关问题