excel自动抓取网页数据(验证码100%,java能将验证码识别为数字吗? )
优采云 发布时间: 2022-03-01 17:17excel自动抓取网页数据(验证码100%,java能将验证码识别为数字吗?
)
如何使用带有验证码的网站自动捕获数据?最近在做网站的数据抓取,但是这个网站有验证码,是不是需要去掉图片识别为4个数字,用httpclient加所有参数登录。是java有没有办法将图像解析为数字?网上百度说用ocr识别,不知道准确率是不是100%,java能把验证码识别为数字,用httpclient完成自动登录?验证码识别抓包数据--------编程问答--------orc肯定不是100%,这是毫无疑问的。你说的想法只能是做验证码识别。
抓取数据还有其他方式,比如绕过验证码/绕过登录等,访问实际数据所在的地址。这需要对您的业务和对该站点的请求进行一些测试和分析。
-------------------- 编程问答 -------------------- 你可以把一张图片反转成一个数字--------编程问答--------ORC的识别能力一般不弱,稍微扭曲的字体不起作用--------编程问答------ ——很难猜。--------------------编程问答--------------------喜欢这种验证码
, 不知道怎么解析成数字--------编程问答---- ----依赖 识别验证码的方法太难了,一般网站验证码要分开,可以想办法绕过------------ -------- 编程问答--------------------引用5楼萌兰香2的回复:就像这个验证码
,不知道怎么解析成数字
这种验证码过于规则,容易识别。先去除噪声,然后分成4个独立的数字,采集10个图片,分别比较每个部分的匹配度。
网上有相关的文章介绍。我曾经寻找文章,现在我不知道如何再次找到它。这是一个类似的 文章
补充:Java , Java EE