vb抓取网页内容(编写爬虫,最好的库永远是python(图))
优采云 发布时间: 2021-09-30 11:04vb抓取网页内容(编写爬虫,最好的库永远是python(图))
vb抓取网页内容,然后用mfc或者c++库,
python在文本编辑处理有比较好的基础,而数据库已经被navicat3渗透进入一些列操作指令,可以用于爬虫。
编写爬虫,最好的库永远是python.=.我觉得爬虫本身,不需要什么特别高级的语言基础,python入门即可。为什么其他的回答推荐python?语言本身其实不过是一个工具,何况编程语言都是相通的,不管你写的是哪个编程语言的爬虫,如果你足够熟练,那么所有语言都是一样的,如果不够熟练,再高级的语言也很难编程。
所以什么python,也不用太在意吧...以前我爬取大学生*敏*感*词*的网站,自己写了爬虫,最初就是拿一些带保护的二维图片来爬取的,有些图片库从一个来看,不能爬取,因为经过编码过,或者压缩了,有的人自己知道这是经过编码了,有的图片库都编码了(这个问题我就不解释了),但是图片要是不编码的,对于爬虫来说就可以,对于爬取来说都是可以爬取的。
后来,我看到这个数据库,想往里面记录工作工资,发现什么都是不记录的,也算是抓一下,毕竟有工资信息不是,没有条件就不要下载别人的图片做自己的数据,把图片也编码了。不过现在爬虫越来越泛滥了,不一定编一个爬虫,编一段代码就成了爬虫。