php抓取网页标签并分析其属性设置打印的表单数据

优采云 发布时间: 2022-08-31 10:00

  php抓取网页标签并分析其属性设置打印的表单数据

  php抓取网页标签并分析其属性设置打印的表单数据以前写了一些php抓取网页标签的代码,目前还没正式写完。相比于php所有的操作http协议的底层代码来说,可能php爬虫本身并不需要实现所有的http方法,没有了cookie,请求header和响应header这些怪东西,取代浏览器来获取页面更加简单。

  写个php的虚拟机,里面跑上自己喜欢的编程语言,比如python,ruby,java。

  不玩游戏的话,

  

  可以看看chrome的网页浏览器,爬虫应该可以用浏览器来写。

  操作系统,

  用java来写

  我不了解c++的情况,但java的这个项目我分享一下自己的经验可以参考上面的资料然后在java上添加pptttracker可以做网页爬虫。

  

  写java的人,

  前面有人说ajax有cookie,现在是反爬虫的好时机。

  看看c#吧,支持net/http协议,

  一般网页爬虫都不需要自己编写,是c++用于反爬虫,根据你的目标不同,处理的方式会有些不同,比如你有关键字体验要求,这种需求就用nodejs去做,反爬虫采用seleniumie浏览器反爬虫,可以通过cookie或者用js来处理。前端页面尽量采用反爬虫,反爬虫后,以防来自后端的ddos流量。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线