自动采集数据,只要你知道url就可以用框架
优采云 发布时间: 2021-04-25 18:01自动采集数据,只要你知道url就可以用框架
自动采集数据,只要你知道url就可以用selenium,threadlocal.initialize()或者java自带的inspector等工具调用js页面采集,你这样有点太麻烦,建议用程序自动采集html文件直接下载到本地保存网页。
可以写个爬虫程序模拟浏览器来点击按钮/selenium等,抓取数据,
别人采集过的,你得提交给后台,
你可以和后台说明你需要去重哪个按钮
谢邀,题主看的应该是拉钩网,本地安装webdriver,可以实现你想要的功能,并且可以减少对后台的干扰,建议这样去理解,
如果使用python,可以用requests,先url,再请求index.html,requests抓包中用到:如果你想要数据库操作,
把数据上传到数据库,建议用importpymysqlpython的web安装自己搜吧,
selenium库里有去重,调用java框架就可以了,比如我写的框架就是jar包导入python库就可以使用了,框架里面有着完整的requests方法,
目前我正在学习的是框架的使用(simpy框架),开发速度比python做api更快,也不需要有java语言基础。直接看文档就能实现,工程师和项目狗都适用。个人非常建议各位程序员学习框架使用,使用一种新的,自己熟悉的语言做一种新的自己熟悉的框架。举个例子,在我目前看到的*敏*感*词*的互联网圈子里,使用nodejs,python和java做api的人非常多,但使用python,java做jqueryapi的人就不够多了。ssm框架是过去二十年过剩,可以直接去掉,后面几年再看吧。