浏览器抓取网页(小编来一起获取浏览器信息的方法(1)_java代码参考文章)
优采云 发布时间: 2021-11-23 07:09浏览器抓取网页(小编来一起获取浏览器信息的方法(1)_java代码参考文章)
java request.getHeader("user-agent") 获取浏览器信息的方法
更新时间:2019-03-29 14:53:22 作者:小天才
本文文章主要介绍java request.getHeader("user-agent")获取浏览器信息的方法。本文介绍的示例代码非常详细,对你的学习或工作有一定的参考价值。有需要的朋友,和小编一起学习吧。
一、用户代理的含义
User Agent的中文名称是User Agent,简称UA。它是一个特殊的字符串头,使服务器能够识别操作系统和版本、CPU 类型、客户端使用的浏览器和版本、浏览器渲染引擎、浏览器语言和浏览器插件等。
一些网站经常判断UA将不同的页面发送到不同的操作系统和不同的浏览器,这可能会导致某些页面在某个浏览器中无法正常显示,但是可以通过伪装UA来绕过检测。
浏览器的UA字符串
标准格式为:浏览器标识(操作系统标识;加密级别标识;浏览器语言)渲染引擎标识版本信息
浏览器 ID
由于很多网站在进行UA检测时忽略了两位版本号,可能会导致浏览器及以后的版本收到不良页面。因此,浏览器10以后版本中的浏览器标识项固定为Browser,在UA字符串末尾添加真实版本信息。
注:来自百度百科
当浏览器发起请求时,我们可以查看请求信息。
请求头:请求头将收录请求信息。
2:在浏览器请求头中获取User-Agent
(1) 请求
String userAgent = request.getHeader("user-agent");
(2)获取
User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36
三、UserAgentUtils.jar
UserAgentUtils.jar 是 UserAgent 的工具类。
(1)maven
eu.bitwalker
UserAgentUtils
1.20
(2)java 代码
UserAgent userAgent = UserAgent.parseUserAgentString(request.getHeader("User-Agent"));
Browser browser = userAgent.getBrowser();
OperatingSystem os = userAgent.getOperatingSystem();
参考文章: