c爬虫抓取网页数据(博客地址:Python入门(一)(图):爬虫)

优采云 发布时间: 2021-11-20 04:00

  c爬虫抓取网页数据(博客地址:Python入门(一)(图):爬虫)

  题外话

  我第一次听说 Python 是在我大二的时候。当时我没有学好C语言,所以不想学其他的编程语言。现在,我想在我的毕业项目中使用爬虫技术。上网查了一下,Python语言的爬虫技术得到了一致好评。

  于是从昨天开始,在网上搜索了各种Python爬虫小程序的源码,可是一天过去了,不仅没有写出简单的爬虫程序,反而对Python应该编写的各种包和语法越来越糊涂了介绍。去菜鸟教程,Python语言比较复杂(虽然它的语法很简单,但是对于初学者来说,很多东西封装在一个包里是很陌生的),自己补了Python语法,然后开始搜索各种教程在网上,总之,我把别人写的爬虫入门级的程序都打出来了,但都没有奏效,还出现各种错误。

  然而,我今天找到了一个博客。博主仔细讲了最简单的爬虫步骤,用到了哪些包,源代码也是逐句分析的,于是我的第一个爬虫程序就成功了。分享一下这位博主的博客,写下我的感受。

  博客地址:Python入门(一):爬虫基本结构&简单例子。

  我的实践

  下图是我按照博主的代码得到的结果。虽然过程中出现了一点语法错误(完全是我自己的错误),但结果还是成功获取了网页上的数据,进行了筛选,同意了。当然,输出的数据很多,我只剪了一小部分。你看到的最后一句 >>> for 循环块是迭代打印迭代器的内容,这里就不展示了。

  

  最后的结果就是打印出大家的数据。

  我的感觉是:Python可以做很多事情,搜索引擎在很大程度上利用了爬虫。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线