面试官:谈谈你对JVM垃圾收集器算法的了解

1,691 阅读4分钟

本文默认JVM为HotSpot,在介绍各款垃圾收集器之前先介绍下垃圾收集器的算法,不是讲解算法如何实现,而是介绍下算法的处理思想和一些优缺点。

垃圾收集器算法

垃圾收集器用于清除垃圾的算法有:标记-清除算法、复制算法、标记-整理算法。 用于针对对象不同的存活周期而分代的算法有:分代收集算法。这个算法把Java堆分为新生代和老年代。

标记-清除算法(Mark-Sweep)

标记-清除算法应该是最符合我们人一开始处理垃圾的思路的算法,例如我们想清除房间的垃圾,我们肯定是先定位(对应标记)哪些是垃圾,然后把这些垃圾之后扔了(对应清除),简单粗暴,剩下的不是垃圾的东西我也懒得理,不管了哈哈哈。

当然有的人说我打扫房间会先整理不是垃圾的东西然后把垃圾扔了...你走错片场了请去标记-整理片场(勤劳的孩子)。

标记-清除算法
这算法有两个缺点 1.标记和清除的效率不高,按这种思路是一个一个标记过去,并且扫描哪些是标记过得然后才清除了 2.空间碎片问题,看上图整理后中间空了好多,这样会使得比较大的对象要申请比较多的连续空间的时候申请不到,明明你空间还很足的。然后导致又一次GC。

复制算法

复制算法等于说根据标记-清除算法的不足之处进行了改进。简单的来说它把空间切成了两半,一次我就用一半,一半满了我就把活着的对象放在另一半按顺序放,然后无脑的把刚才使用的那一半空间一次清理干净,然后保留着存活的那些对象的内存空间换上去使用。这样就没了标记-清除算法的空间碎片问题。

复制算法
虚拟机基本上用这种算法来回收新生代,但是切一半空间利用率太低了,一次就只能用一半。所以在HotSpot中是把这一块空间分为3块,一块Eden,两块Survivor。

因为正常情况下新生代的大部分对象都是短命鬼,所以能活下来的不多,所以默认的空间划分比例是8:1:1。用法就是每次只使用Eden和一块Survivor,然后把活下来的对象都扔到另一块Survivor。再清理Eden和之前的那块Survivor。然后再把Eden和存放存活对象的那一块Survivor用来迎接新的对象。就等于每次回收了之后都会对调一下两个Survivor。

但是事情总有意外,万一这波对象短命鬼较少,存活下来的很多,那一个Survivor放不下,所以还有个担保机制,就像我们现实生活中的担保人,你还不起了担保人上!这个担保人就是老年代,也就是Survivor放不下了就放老年代去。 那为什么虚拟机基本上用这种算法来回收新生代呢?就是因为新生代的对象大部分存活时间不长,所以每次GC的时候复制的比较少,效率高啊,每次就复制一点点对象到Survivor。

那要是到老年代也就是一些老不死的对象那用复制效率就低了啊,首先8:1:1这种分法就不合适了,因为每次存活下来的对象会很多,1就放不下了,你可能就得"五五开"分了,那"五五开"之分也就算了,因为每次对象基本上都活着,所以每次复制等于复制一半空间的对象。效率低啊。

还有,新生代有老年代做担保啊,多了的对象可以放到老年代,而老年代不行啊,没有依靠了。所以就又有了下面的算法。

标记-整理算法(Mark-Compact)

标记-整理算法的思路也是和标记-清除算法一样,先标记那些需要清除的对象,但是后续步骤不一样,它是整理,对就是像上面说的那些清除房间垃圾每次都会整理的人一样那么勤劳。

标记-整理
每次会移动所有存活的对象,且按照内存地址次序依次排列,也就是把活着的对象都像一端移动,然后将末端内存地址以后的内存全部回收。所以用了它也就没有空间碎片的问题了。

分代收集算法

这算法就是把Java堆分为新生代和老年代,这样好根据每个代的对象存活时间特点上不同的收集算法。 所以一般新老代就是用复制算法。老年代用标记-清除或标记-整理算法。


如有错误欢迎指正! 个人公众号:yes的练级攻略