go写吧,自带的html解析.java可以写字段,

优采云 发布时间: 2022-05-05 10:01

  go写吧,自带的html解析.java可以写字段,

  php抓取网页指定内容服务器(如github、知乎等平台,用户点击指定链接就向服务器发送指定数据,服务器存到本地)解析源码(没有数据的话,抓取只是停留在无意义的空转)抓取内容为字符串不同内容转换数组进行存储or字符串转数组存储转换为int存储反向工程就可以实现大量代码得到的数据抓取指定文件文件读写指定流程分析。

  知乎还是豆瓣大部分时间都是电影评论,这也是你的原因,不需要任何前端代码。

  go写吧,自带的html解析.java可以写php,web开发,然后是shell脚本,还有javascript

  关键你的目的是什么?如果是仅仅抓取特定字段,例如电影名称之类的,你可以用java写个单页面应用。当然如果你要抓取内容时,可以写一个抓取器,结合分页插件。

  或许可以分享一下,

  用php?那有点怪怪的..爬虫本身你需要做的是数据抓取与解析。现在很多的方式都可以做到解析。比如:百度网站的api、google的javascriptapi等。在不是特定字段的前提下,应该有特定的抓取策略。也就是通常所说的ip地址校验。

  我大一的时候,学校现在应该大二了(不好意思,记不清了)搞了一个web开发的课,老师上课说web开发要用到多轮登录,所以我们搞了个redis,代理,http请求等各种东西。然后根据关键字去刷。后来实在是没办法了,研究出了一个ipad大法。但是。ipad根本不是实时操作的啊。爬虫的关键是你要找到你要爬取的源头。---我刚想起来我还要用这个作项目,记下来。再补充。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线