JVM之对象的创建、内存布局、访问走位总结

494 阅读6分钟

Born


  Java是一门面向对象的语言,在Java程序运行的过程中无时无刻都有对象被创建出来。在语言层面上,创建对象通常仅仅是一个new关键字而已,而在虚拟机中,对象(本文讨论仅限于普通Java对象,不包括数组和Class对象)的创建又是一个怎样的过程呢?

1. 类加载检查

  当虚拟机需要一条new指令时,首先会去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用是否已经被加载、解析初始化过。如果没有,那必须先执行相应的类加载过程。   

2. 分配内存

  在类加载检查通过后,接下来虚拟机将为新生对象分配内存(所需内存大小在类加载完成后遍可完全确定)。所谓分配内存,就等同于把一块确定大小的内存从Java堆中划分出来(对象实例存在于JVM内存区域的堆区域)。根据Java堆中的内存是否规整,将分配方式分为两种:

  • 指针碰撞(Java堆内存规整)

  内存规整的含义是,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那么分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。

  • 空闲列表(Java堆内存不规整)

  内存不规整的含义是,已使用的内存和空闲的内存相互交错。如果是这样那就没法简单的进行指针碰撞了,那么分配内存的方式就变为,虚拟机维护一个列表,记录哪些内存是可用的,哪些内存是不可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。

注: 选择哪种分配方式是由Java堆是否规整而决定,而Java堆是否规整又由所采用的的垃圾收集器是否带压缩整理功能决定。

2.1 内存分配的并发问题

  在创建对象的时候有一个很重要的问题,那就是线程安全,因为在实际开发中,创建对象是很频繁的事,即使是仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存情况。

解决上述为题通常有两种方案:

  • CAS+失败重试

  CAS是乐观锁的一种实现方式。所谓乐观锁就是,每次不加锁而是假设没有冲突而去完成某项操作,如果因为冲突失败就重试,直到成功为止。虚拟机采用CAS配上失败重试的方式来保证更新操作的原子性。

  • TLAB

  为每一个线程预先在Eden区分配一块内存,JVM在给线程中的对象分配内存时,首先在TLAB分配,当对象大于TLAB中的剩余内存TLAB内存已用尽时,再采用第一种方法(CAS+失败重试)进行内存分配。

3. 初始化零值

  内存分配完成之后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就能直接使用,程序能访问到这些字段的数据类型所对用的零值。

4. 设置对象头

  初始化零值完成之后,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如果才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息都存在对象头中。另外,根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。

5. 执行init方法

  在上面的工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了,但是从Java程序的角度来看,对象的创建才刚刚开始,<init>方法还没有执行,所有的字段都为零。所以一般来说,执行new指令之后会接着指向<init>方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

对象的内存布局


在HotSpot虚拟机中,对象的内存中存储的布局可以分为3块区域:对象头、实例数据、和对其填充

  • 对象头

HotSpot虚拟机的对象头包括两部分信息,第一部分: 用于存储对象自身的自身运行数据(哈希码、GC分代年龄、锁状态标志灯);第二部分: 是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

  • 实例数据

实例数据是对象真正存储的有效信息,也是在程序中所定义的各种花类型的字段内容。

  • 对其填充

对其填充部分不是必然存在的,也没有什么特别的含义,仅仅起占作用。 因为Hotspot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数(1倍或2倍),因此,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

对象的访问走位


建立对象就是为了使用对象,我们Java程序通过栈上的reference数据来操作堆上的具体对象。对象的访问方式由虚拟机实现,目前主流的访问方式有两种:句柄访问、直接指针。

  • 句柄访问

如果使用句柄访问的话,那么Java堆中将会划分出来一块内存作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。如下图所示。

  • 直接指针

如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。如下图所示。

两者优缺点:

访问方式 优点 缺点
句柄访问 reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而 reference 本身不需要修改 速度相对较慢
直接指针 速度快,它节省了一次指针定位的时间开销 由于对对象的访问在Java总非常频繁,因此这类开销极少成多之后,也是很大的成本

参考资料


  • 周志明:《深入理解Java虚拟机》