java抓取网页数据(java抓取网页数据内存最小的大小是什么?(上))
优采云 发布时间: 2021-09-24 03:00java抓取网页数据(java抓取网页数据内存最小的大小是什么?(上))
java抓取网页数据内存最小大小是按照ua的字符集去判断的(一般是gbk,中文数据以utf-8编码,英文数据不会变换编码方式)。比如一个页面是基于gbk编码的,那么内存最小大小是256m左右。
ua是google服务器端识别的一个基本属性,如下图显示的是某一个网站打开时需要消耗的空间。而中文网站一般分为utf-8编码和gbk编码,utf-8编码ua会占用2.5m左右,而gbk编码ua又会占用32.5m。因此,有效的内存空间是打开时所占用的空间,而其是根据google服务器端的统计结果来决定的。
内存大小跟访问的网站类型相关,java只要访问的网站是google提供的,那么内存就不用计算,一般就是2^32这么大。
这个理论上取决于java要解析什么的,按照下面的来看1gbk是很小,所以内存大小如果是64m就足够了,如果是system.out.println的话需要1m,有些地方autoprint出来结果比java解析要慢很多,所以有些地方需要256m,超过256m就别放这个范围,浪费。2utf-8编码这个范围大点,所以可以部分解析。
utf-8编码的话内存大小大概就是256m。而gbk的话,内存要用1m,不然解析速度太慢。以上内容仅供参考。
没有的
1、ajax请求
2、java处理内存优化的jdk版本
3、java设计模式
4、springmvc。1m都不够的我也是手贱搜一个一个去问的,你需要其他资料直接评论我,我再看吧。