python爬虫入门教程(一)

优采云 发布时间: 2020-06-12 08:01

  目录:

  1、Python能做哪些

  2、网络爬虫简介

  3、网络爬虫能做哪些

  4、开发爬虫的打算工作

  5、推荐的python爬虫学习书籍

  --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

  Python能做哪些

  

  网络爬虫简介

  网络爬虫,也叫网路蜘蛛(Web Spider)。爬虫是依照网页地址(URL)爬取网页上的内容,这里说的网页地址(URL)就是我们在浏览器中输入的网站链接。例如:/,这就是一个URL。

  爬虫是在某个URL页面入手,抓取到这个页面的内容网络爬虫 教程,从当前的页面中找到其他的链接地址,然后从这地址再度爬到下一个网站页面,这样仍然不停的抓取到有用的信息,所以可以说网络爬虫是不停的抓取获得页面上想要的信息的程序。

  网络爬虫能做哪些

  例如:我关注的找工作的网站会不定期的发布急聘信息,我不信每晚都耗费自己的精力去点击网站查看信息,但是我又想在有新的通知时,能够及时晓得信息并看见这个信息。

  此时,我就须要爬虫来帮助我,这个爬虫程序会手动在一定的时间模拟人去访问官网,检查是否有新的通知发布,如果没有就不进行任何操作,如果有通知,那么就将通知从网页中提取下来,保存到指定的位置,然后发送邮件或则电邮告知我即可。

  开发爬虫的打算工作

  编程语言:Python

  IDE的话,推荐使用Pycharm。windows、linux、macos多平台支持网络爬虫 教程,非常好用。

  开发环境:Win7+Python 2.7 64bit+PyCharm :环境配置方式自行百度

  推荐的python爬虫学习书籍

  1.米切尔 (Ryan Mitchell) (作者), 陶俊杰 (译者), 陈小莉 (译者)的Python网路数据采集

  2.范传辉 (作者)的Python爬虫开发与项目实战

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线