JVM笔记(1.1)Java内存区域和内存溢出异常

235 阅读8分钟

运行时数据区域

image

程序计数器

作用:

  • 可以看作是当前线程所执行的字节码的行号指示器,通过改变这个计数器的值来选取下一跳需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成
  • 因为Java虚拟机的多线程执行是通过线程轮流切换并分配处理器执行时间的方式实现的。为了线程切换后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器
  • 若执行的是Java方法,则计数器为正在执行的虚拟机字节码地址;若为Native方法,则为空

Java虚拟机栈

它是线程私有的,生命周期和线程相同。

用处

他描述的是Java方法执行的内存模型:每个方法执行的时候都会创建一个栈帧来存储局部变量表(存放编译期可知的各种基本数据类型、对象引用)、操作数栈、指向运行时常量池引用、方法返回地址

  • 局部变量表:存储方法中的局部变量(包括在方法中声明的非静态变量以及函数形参)。对于基本数据类型的变量,则直接存储它的值,对于引用类型的变量,则存的是指向对象的引用。局部变量表的大小在编译器就可以确定其大小了,因此在程序执行期间局部变量表的大小是不会改变的。
  • 操作数栈:对表达式求值
  • 指向运行时常量池的引用:指向类中的常量
  • 方法返回地址:返回之前调用的地址
这个区域有两个异常:
  • 线程请求的栈深度大于虚拟机所允许的深度,抛出StackOverflow异常
  • 若虚拟机栈可以动态拓展,并拓展时无法申请到足够的内存,抛出OutOfMemoryError异常

Java本地方法栈

和虚拟机栈作用类似,本地方法栈是虚拟机使用的native方法服务。(HotSpot将本地方法栈和Java栈合二为一)

Java堆

Java堆是被所有线程共享的一块内存区域,JVM中只有一个堆。

目的:

这块区域的唯一目的就是存放对象实例

分类:

  • 内存回收角度:
    • 新生代
    • 老年代
  • 内存分配角度:
    • 多个线程私有的分配缓冲区

Java堆可以处于物理上不连续的空间,但是再逻辑上要连续

方法区:

线程共享的内存区域,存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。(也叫non-heap,为了和堆区分)

不需要连续的内存、可扩展、可选择不实现垃圾收集。这部分的内存回收目标主要是针对常量池的回收和对类型的卸载

当方法去无法满足内存分配需求时,抛出OutOfMemoryError

运行时常量池:

它是方法区的一部分

  • Class文件常量池常量池用于存放编译期生成的各种字面量和符号引用,这部分将在类加载后进入方法区的运行时常量池中存放(运行期间也可将新的常量放入运行时常量池中,如String的intern()方法)
  • 运行时常量池具有动态性,即运行期间可以将新的常量放入池中

直接内存

直接内存并不是虚拟机运行时数据区的一部分,也不是Java 虚拟机规范中农定义的内存区域。在JDK1.4 中新加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O 方式,它可以使用native 函数库直接分配堆外内存,然后通脱一个存储在Java堆中的DirectByteBuffer 对象作为这块内存的引用进行操作。

  • 本机直接内存的分配不会受到Java 堆大小的限制,受到本机总内存大小限制
  • 配置虚拟机参数时,不要忽略直接内存 防止出现OutOfMemoryError异常
直接内存(堆外内存)与堆内存比较
  • 直接内存申请空间耗费更高的性能,当频繁申请到一定量时尤为明显
  • 直接内存IO读写的性能要优于普通的堆内存,在多次读写操作的情况下差异明显

举例

接下来看一个例子来了解内存各空间具体的分配

对象的创建

  1. 当遇到new指令,首先检查指令的参数能否在常量池中定位到一个符号引用,检查这个符号引用代表的类是否被加载、解析、初始化过,没有,执行类加载。
  2. 类加载完成后,准备在堆中分配内存
    1. 若堆中内存是规整的(即用过的放一边,没用过的放一边),有一个指针作为分界点,分配内存就是将这个指针向空闲的堆移动和对象大小相等的距离
    2. 若堆中内存是不规整的,虚拟机就要维护一个表来记录哪些空间是可用的
    3. 这里还有一个问题,就是线程安全问题,例如在创建对象a时,指针还没来得及修改,对象b用同一个指针来分配内存。这就造成了线程不安全,这里有两个解决方案:
      1. 对分配内存空间的动作进行同步——CAS失败重试保证原子性
      2. 把内存分配动作按照线程划分在不同的空间,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲
  3. 内存分配完成后,虚拟机将分配到的内存空间初始化为零值
  4. 对对象进行一些设置,如这个对象是谁的类实例、如何找到类的元数据信息、对象的哈希码、对象的GC分代年龄
  5. 执行new指令之后执行方法(构造方法)

对象的内存布局

对象在内存中的布局可分为3块区域:对象头、实例数据、对齐填充

  • 对象头:(分为两部分,若为数组,则还有还有一块数据记录数组长度)
    • 第一部分存储对象自身运行时数据(哈希码、GC分代年龄、锁状态标志、线程持有锁、偏向线程id、偏向时间戳登)
    • 第二部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例
  • 实例数据:保存程序所定义的字段内容
  • 对齐填充:不是必然存在,占位符的作用,因为对象大小必须为8字节的整数倍

对象访问定位

创建完对象后,我们还要能通过引用来操作堆

访问方式主要分两种:
  • 句柄,堆中会划分一块内存作为句柄池,引用存储的就是对象的句柄地址,句柄包含了对象实例数据和类型数据的地址信息。对象移动时只改变句柄的实例数据指针。如图
  • 直接指针,速度快。如图

句柄

image

直接指针

image

内存溢出异常

除了程序计数器外,虚拟机内存其他运行时区域都有可能发生OOM(OutOdMemoryError)

Java堆溢出

  • 内存泄漏:指程序在申请内存后,无法释放已申请的内存空间,一次内存泄露危害可以忽略,但内存泄露堆积后果很严重,无论多少内存,迟早会被占光。
  • 内存溢出:指程序在申请内存时,没有足够的内存空间供其使用

为防止内存泄漏、溢出,有几个方法:

  • Thinking in Java中提到可以让引用变量不用时设置为null
  • 尽量少用静态变量
  • 避免创建大对象
  • 对虚拟机调节配置

虚拟机栈和本地方法溢出

  • 若线程请求的栈深度大于虚拟机所允许的最大深度:抛出StackOverflowError
  • 若线程拓展栈时无法申请到足够的内存空间:抛出OutOfMemoryError

StackOverflow和OOM的区别:
单个线程下,内存无法分配时,抛出的为StackOverflowError
多个线程下,为每个线程的栈分配的越大,越容易产生内存溢出异常

方法区和运行时常量池溢出

动态大量生成Class应用、大量jsp生成(jsp会先转为servlet编译)、OSGi的应用时要注意类的回收状况

本机直接内存溢出

如查看到Heap Dump文件小,又使用了NIO,多半是本机直接内存溢出