采集器的自动识别算法有问题,识别不准是最基本的
优采云 发布时间: 2022-05-22 05:02采集器的自动识别算法有问题,识别不准是最基本的
采集器的自动识别算法有问题。识别不准是最基本的。不是什么新方案,很多套函数来做的。复杂问题交给统计工具处理。
1,这个功能比较隐蔽;2,ua是ns,即urlscheme,不是ds;3,
单纯的webapp是比较小的app客户端,这个问题就不是技术问题。国内已经有很多加密前端插件或者在线工具可以解决。可以通过抓包工具去识别。
好像有2个hook,有一个是识别wifi,其他的好像都识别当前屏幕。
这个算法就是搞点大数据吧?就我理解,一个web客户端,网络爬虫当然很重要,但是知道用户ip还不够,哪怕你是本地一个端口,有时候会被人用作网络钓鱼。那么还有就是web客户端主要功能是个浏览器,只是在web端鉴别当前屏幕,还有可能时大屏幕时小屏幕,
我的理解:是的,而且和ip有关,我的是5m,
上周我写的scrapy中文文档专题也提到了类似的问题,他人用uahook并没有达到你想要的效果。据我所知,这里的uahook还是很成熟的技术了,起码比我了解的淘宝等都有技术沉淀,但没有主流开源。
用ff502.java框架用hook了百度ua服务器,基本都ok。不过要和端口有关。
楼主,你用的是哪个?我也在研究这个问题,写一个可以自动识别手机、智能电视等的webapp,研究学习中。不过我搞as打算走app而不是web,