python爬虫入门教程(一)
优采云 发布时间: 2020-06-12 08:01目录:
1、Python能做哪些
2、网络爬虫简介
3、网络爬虫能做哪些
4、开发爬虫的打算工作
5、推荐的python爬虫学习书籍
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Python能做哪些
网络爬虫简介
网络爬虫,也叫网路蜘蛛(Web Spider)。爬虫是依照网页地址(URL)爬取网页上的内容,这里说的网页地址(URL)就是我们在浏览器中输入的网站链接。例如:/,这就是一个URL。
爬虫是在某个URL页面入手,抓取到这个页面的内容网络爬虫 教程,从当前的页面中找到其他的链接地址,然后从这地址再度爬到下一个网站页面,这样仍然不停的抓取到有用的信息,所以可以说网络爬虫是不停的抓取获得页面上想要的信息的程序。
网络爬虫能做哪些
例如:我关注的找工作的网站会不定期的发布急聘信息,我不信每晚都耗费自己的精力去点击网站查看信息,但是我又想在有新的通知时,能够及时晓得信息并看见这个信息。
此时,我就须要爬虫来帮助我,这个爬虫程序会手动在一定的时间模拟人去访问官网,检查是否有新的通知发布,如果没有就不进行任何操作,如果有通知,那么就将通知从网页中提取下来,保存到指定的位置,然后发送邮件或则电邮告知我即可。
开发爬虫的打算工作
编程语言:Python
IDE的话,推荐使用Pycharm。windows、linux、macos多平台支持网络爬虫 教程,非常好用。
开发环境:Win7+Python 2.7 64bit+PyCharm :环境配置方式自行百度
推荐的python爬虫学习书籍
1.米切尔 (Ryan Mitchell) (作者), 陶俊杰 (译者), 陈小莉 (译者)的Python网路数据采集
2.范传辉 (作者)的Python爬虫开发与项目实战