抓取网页数据(抓取网页数据的话,也可以用you-get,)

优采云 发布时间: 2022-01-13 01:01

  抓取网页数据(抓取网页数据的话,也可以用you-get,)

  抓取网页数据的话,也可以用you-get,flask-login这样的爬虫工具,数据来源可以是微博也可以是网站的公共信息。可以先试一下digwuser的网站爬虫,地址为:/you-get。

  刚刚是写好了这么个爬虫的文章的,接下来还要不断更新文章才能够更好实现目标(滑稽),

  其实,这个我也想过,因为比较好的渠道是在招聘网站上,如果你一直想的是单向爬虫的话,大可能找到一个下家,而且网站本身也可以自定义对账号和密码,这个人是无法被封号的。后来我想了一下,这样其实很麻烦,所以我就没再大批量的尝试。

  这样的提问只是为了找台阶下,先用弱力提问,然后找共同好友编个口子,让他们帮你再卖一个。

  charles,okflush,phantomjs,scrapy啥的可以试试,但是爬虫的爬取力度和效率是关键,数据多了之后大部分都是有用的信息,但是实际上没有几个人会重视,如果天天往外卖量你看,erp、网站内容等等都是没用的。所以把数据量控制在一定区间就很关键。

  不谢邀,接盘侠一枚。

  找我就可以了哟

  bilibili爬虫对于b站流量一直在500万以上,年用户数也上千万,说不定可以帮你达到。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线