不用采集规则就可以采集(爬虫爬虫不用采集规则就可以采集的网站太多了)
优采云 发布时间: 2021-09-03 17:11不用采集规则就可以采集(爬虫爬虫不用采集规则就可以采集的网站太多了)
不用采集规则就可以采集的网站太多了,要使用爬虫爬虫可以去一些带接口的网站,页面非常多带这些接口的,比如外卖平台的美团,或者旅游的携程等等有了这些接口,其实你根本就不用采集了,看看商品价格和评论就可以做出一个假单,如果这都不会,
推荐ipythonnotebook。利用ipythonnotebook的交互式命令行以及强大的功能,可以实现我们生活中一般使用电脑能实现的任何操作,无论是爬虫,excel,编程等等。
*敏*感*词*好像可以,自己用过,你下载个*敏*感*词*的app就可以了,
在某公司财务平台上写爬虫,用了很久。感觉比一般的网站速度快很多,可以抓取出*敏*感*词*流量图,方便分析情况,但是数据量小,一天只能抓取100条,还要经常清理,很麻烦。不过最近遇到个问题,那里需要收款的会员名单,直接提交后台打不开,耗了很久了,
正在进行的几个网站都可以,自动采集数据注意采集速度和正确率。
你指的采集是哪方面?如果你只想简单的走一遍流程,设置好基本的算法,自动采集,目前比较成熟的就是全文采集了,如果要进一步比对数据,发现不完整数据等特殊情况,或者人工选择和清洗不完整数据,那人工采集数据目前做的比较好的公司就是word2vec,github搜word2vec和xinrui123,还有国内的优采云采集器等,也是目前我用过的,在技术方面都可以达到一个初步的水平。