从萌新的角度理解JVM内存管理

1,619 阅读8分钟

1. JVM内存管理机制

在进行Java程序设计时,一般不涉及内存的分配和内存回收的相关代码,此处引用一句话:Java和C++之间存在一堵由内存动态分配和垃圾收集技术所围成的高墙,墙外的人想进去,墙里面的人想出来,个人从这两句话中,捕获到了两个点

  • java的自动内存管理机制,极大的节省了开发人员的精力,避免了易错且复杂的内存管理设计,相对于手动的内存管理这是极大的飞跃。
  • java自动内存管理机制,其不能根据具体的场景提供最优的内存管理,其只提供普适的内存管理机制。想比于C++的手动内存管理,灵活性不够,存在制约系统性能的瓶颈。

第二点是我们深入了解JVM内存管理机制的意义,通过对原理的把握,在指定的场景下设计JVM最优的内存管理策略,本文内容组织结构如下:

  • JVM内存分配
  • JVM内存回收

2. JVM内存分配

ClassExample refereenceExample  = new ClassExample ();

上述代码,如果粗略划分的话,可以划分为两个过程:

  1. 在堆区分配对象内存
  2. 将对象内存地址赋值给对象引用 上述两个过程基本就是内存分配中,比较重要的两个知识点了,内存分配策略和对象引用 #####2.1 堆区布局 对象分配在堆上这是毫无疑问的,如果在往下细分的话,那么堆区的内存布局还是挺有讲究的,大致可以分为如下布局:
    堆内存布局
  • 新生代:从名字可见一般,新生代区域中存放的对象一般是两种:刚刚被new出来的对象,或者经历内存回收次数不多的对象
  • 老年代:老年代从名字也可见一般,一般存放两种对象: 占用内存比较多的大对象和经历过多次内存回收过程的对象
  • 永久代:永久代的内存就比较固定,每个类的class对象,一般存放在永久代当中。

上述JVM堆区中的内存布局代表的是逻辑视图,并不是实际的物理布局,实际上,JVM了提供多种不同的内存分配和回收的策略,每种策略抽闲出逻辑视图都会有细微的差别,但是上述逻辑视图可以说是所有逻辑视图的根视图

2.2 内存分配一般过程

内存分配的一般过程
在图中有几个重要的概念,需要着重强调:

  • 对象大小阈值设定,在JVM中可以通过设PretenureSizeThreshold这个参数,指定该阈值大小,如果待分配对象大小超过该阈值,尝试在老年代中开辟内存空间存储对象,否则尝试在新生代中开辟内存空间存储对象
  • MinorGC,这是JVM中一次内存回收过程,内存回收过程又称垃圾回收过程,这次内存回收是由新生代中内存空间不足引起的,主要对新生代中的内存对象进行回收
  • FullGC,这也是JVM中的一次内存回收过程,这次内存回收过程是有老年代中内存空间不足造成的,主要针对所有堆区中的内存对象进行回收,包括新生代,老年代,以及永久代
  • 对象年龄,经过一次内存回收后依然存活的对象,其年龄会加1。当对象年龄超过一个指定阈值后,其由新生代转向老年代存储。这个对象年龄的阈值,同样可以通过设置JVM的MaxTenuringThreshold参数进行指定
2.3对象引用

JVM内存区域的布局详情中介绍了对象引用相关的内容

3. JVM内存回收

从程序员角度来看,内存回收的过程是透明,具体细节都对程序员屏蔽了。JVM内存区域的布局详情,仔细的介绍了JVM中的内存模型以及各个内存区存储的数据类型。

JVM内存布局
内存回收主要针对的内存区域主要是堆区和方法区,在上文中谈及了MinorGC以及FullGC。MinorGC主要是针对堆区进行内存回收,FullGC除了对堆区进行回收,对方法区也进行回收,是相对重量级的回收动作。在内存回收这个章节中,主要从以下三个方面阐述: 1. 什么样的对象可回收? 解决方法:可达性分析 2. 如何回收内存? 解决方法:标记-清除算法,标记-复制算法,标记-整理算法等内存回收算法 3.什么时候回收合适? 解决方法:安全点和安全区域

3.1 可达性分析

可达性分析示意图
在上图中,一共有七个对象,箭头的走向代表引用关系、对象1引用对象2,对象2引用对象3。对象1是根节点(GCROOT),其他的是非根节点(GCROOT)。 **可达性分析是指:不能被GCROOT节点通过引用链达到的节点,将被列入拟回收对象范围。对象6和对象7就不能被任何一个GCRoot节点所引用,是目标回收对象。**JVM认为这些对象不具备使用价值,可以将其进行内存回收。 **根节点(GCROOT)**是上文中提出的重要概念,一般来说,如下对象可作为根节点对象: (1)JVM虚拟机栈中引用的对象 (2)方法区中类静态属性引用对象 (3)方法区中类常量引用对象 (4)本机方法栈中引用对象 可达性分析是进行内存回收的判定条件,在可达性分析之后,确定哪些对象是回收目标。除了可达性分析之外,引用计数法同样可用来进行判断内存回收目标对象,但是其无法解决循环引用问题。主流的JVM都采用可达性分析。

3.2内存回收算法

通过可达性分析之后,将确定哪些对象是回收目标,接着内存回收算法将执行具体的回收细节。下图是内存区域中三个状态,空闲内存是未使用内存,目标回收内存是可达性分析之后可回收内存,已占内存是不需要回收内存。

内存对象

  • 标记-清除算法 标记-清除算法是比较直白的内存回收算法,其直接释放目标回收内存,没有其他任何附加操作。该算法执行后的结果如下:
    标记-清除算法执行后的内存图
    标记-清除算法,逻辑简单,易于理解,但是其有个致命的缺点就是其极易产生内存碎片,在分配大对象时,不能有足够连续的内存空间而造成频繁的GC。
  • 标记-复制算法 标记-复制算法是针对内存碎片问题提出的一种算法。
    image.png
    在标记-复制算法的设定中,始终有块空白内存区域,如上图长内存区域二。在内存回收时,将内存区域一种存活对象全部按序复制到内存区域二中后再对内存区域一中所有对象进行回收。通过这种做法可以极大的避免内存碎片,但是空白内存区域将始终闲置,内存利用率不高。在上文中提及将堆区的内存分为两个surivior区以及Eden区就是采用标记-复制算法。Eden区和surivior之间大小比例分配默认是8:1:1.
  • 标记-整理算法 标记-整理算法,同样是为解决内存碎片提出的内存回收算法,其在标记-清楚算法的基础上增加的整理功能,对内存对象进行拷贝移动,以保证空间内存空间连续。
    标记-整理算法回收后内存
    标记-整理算法,能够克服内存碎皮,且不需要额外内存,但是其拷贝和移动对象的时间消耗较高。该算法常用在老年代对象回收中。
3.3 什么时候回收内存合适

通过可达性分析,可知哪些对象是需要回收的对象,在这过程中需要枚举根节点,这是一个耗时操作,为了保证内存回收的顺利进行,必须保证引用关系的一致性,即在内存回收过程中对象引用关系不会发生变化。只有在这些地方进行内存回收才是安全点,因此JVM引入了安全点的概念,安全点处的对象引用关系不会改变,适合内存回收。安全区域是对安全点概念的扩充,指在这一段区域内对象引用关系具有一致性,能进行内存回收。