python网页数据抓取(《PythonSocket编程技巧总结》及Python简单实现网页内容抓取功能)

优采云 发布时间: 2021-11-07 03:03

  python网页数据抓取(《PythonSocket编程技巧总结》及Python简单实现网页内容抓取功能)

  本文文章主要介绍了Python对网页内容抓取功能的简单实现,并结合示例表单,分析了Python基于urllib模块的网页请求、内容阅读等相关操作技巧。有需要的朋友可以参考以下

  本文中的例子描述了Python爬取网页内容功能的简单实现。分享给大家,供大家参考,如下:

  使用模块:

   import urllib2 import urllib

  常见爬取示例:

   #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib2 url = 'http://www.baidu.com' #创建request对象 request = urllib2.Request(url) #发送请求,获取结果 try: response = urllib2.urlopen(request) except BaseException, err: print err exit() #获取状态码,如果是200表示获取成功 code = response.getcode() print code #读取内容 if 200 == code: content = response.read() print content

  获取获取实例的请求:

   #!/usr/bin/python # -*- coding: UTF-8 -*- import urllib2 import urllib #urllib2使用GET方式的请求 url = 'http://www.baidu.com/s' values = {'wd' : '车云'} # 必须编码 data = urllib.urlencode(values) url = url + '?' + data print url #url == http://www.baidu.com/s?wd=%E8%BD%A6%E4%BA%91 #创建request对象 request = urllib2.Request(url) #发送请求,获取结果 try: response = urllib2.urlopen(request) except BaseException, err: print err exit() #获取状态码,如果是200表示获取成功 code = response.getcode() print code #读取内容 if 200 == code: content = response.read() print content

  更多Python相关内容请参考本站专题:《Python Socket编程技巧总结》、《Python正则表达式使用总结》、《Python数据结构与算法教程》、《Python函数使用技巧》总结》、《Python字符串操作技巧总结》、《Python入门及进阶经典教程》、《Python文件和目录操作技巧总结》

  希望这篇文章对你的 Python 编程有所帮助。

  以上是Python中简单实现网页内容爬取功能示例的详细内容。更多详情请关注其他相关html中文网站文章!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线