不用采集规则就可以采集(爬虫爬虫不用采集规则就可以采集的网站太多了)

优采云 发布时间: 2021-09-03 17:11

  不用采集规则就可以采集(爬虫爬虫不用采集规则就可以采集的网站太多了)

  不用采集规则就可以采集的网站太多了,要使用爬虫爬虫可以去一些带接口的网站,页面非常多带这些接口的,比如外卖平台的美团,或者旅游的携程等等有了这些接口,其实你根本就不用采集了,看看商品价格和评论就可以做出一个假单,如果这都不会,

  推荐ipythonnotebook。利用ipythonnotebook的交互式命令行以及强大的功能,可以实现我们生活中一般使用电脑能实现的任何操作,无论是爬虫,excel,编程等等。

  *敏*感*词*好像可以,自己用过,你下载个*敏*感*词*的app就可以了,

  在某公司财务平台上写爬虫,用了很久。感觉比一般的网站速度快很多,可以抓取出*敏*感*词*流量图,方便分析情况,但是数据量小,一天只能抓取100条,还要经常清理,很麻烦。不过最近遇到个问题,那里需要收款的会员名单,直接提交后台打不开,耗了很久了,

  正在进行的几个网站都可以,自动采集数据注意采集速度和正确率。

  你指的采集是哪方面?如果你只想简单的走一遍流程,设置好基本的算法,自动采集,目前比较成熟的就是全文采集了,如果要进一步比对数据,发现不完整数据等特殊情况,或者人工选择和清洗不完整数据,那人工采集数据目前做的比较好的公司就是word2vec,github搜word2vec和xinrui123,还有国内的优采云采集器等,也是目前我用过的,在技术方面都可以达到一个初步的水平。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线