String 到底创建了多少个对象

869 阅读4分钟

之前有人在群里问了这么一个问题

如果你和我一样经常会关注面试题的话,会知道这其实是一个没有什么实际意义的面试题(虽然经常会有人问起,但在实际面试中好像已经没人会问这个了),甚至早在9年前,R大就已经写了一篇吐槽这个问题的长文来说明问题。尽管如此,但对于这道题来说,还是有不少坑的。

回到这道题来,当时群里也给了好几个答案,有6个,3个,2个;你也可以自己先想想有几个再来看下面的答案。

首先,在类加载时(准确的说是 resolve 阶段),JVM会在堆中创建这些字面量对应的字符串对象实例并在字符串常量池中保留其引用,所以需要弄清楚的第一点是,这部分产生的字符串对象是否算这些代码所产生的。如果不算,那么答案就很明显了,就是2个,也就是第2,3行所产生的两个 String 对象。

如果认为 JVM 加载类自动生成的 String 对象也算那段代码生成的话,那么生成了多少对象?那么第二个需要弄清楚的点就是,到底有多少字面量?当时就有群友认为是 "a","bc","bcd" 3个对象,因为编译器自动进行了优化,可真的如此吗?我们可以用 javap 来看一下字节码:

0: ldc           #2                  // String a
2: astore_1
3: new           #3                  // class java/lang/StringBuilder
6: dup
7: invokespecial #4                  // Method java/lang/StringBuilder."<init>":()V
10: aload_1
11: invokevirtual #5                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
14: ldc           #6                  // String b
16: invokevirtual #5                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
19: ldc           #7                  // String c
21: invokevirtual #5                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
24: invokevirtual #8                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
27: astore_1
28: new           #3                  // class java/lang/StringBuilder
31: dup
32: invokespecial #4                  // Method java/lang/StringBuilder."<init>":()V
35: aload_1

这里我只截取到了第二个对象,可以发现并不是大家想的这样,并没有将 "b" 和 "c" 自动拼接成 "bc",第三个对象也是如此。那么也就是说,到底生成了多少个字面量对象还和编译器有关,如果是使用 sun 自带的 javac (测试时使用的1.8) 编译器的话,实际上生成了4个,而如果使用其他优化过的编译器话,可能就只会生成3个。

还有第三个需要注意的是,我们前面提到了,字面量是在类加载时,就已经生成对象了,也就是说不管有没有运行到这些代码,对象都已经生成了,那么为什么还要讨论算上这些对象的情况?

我们可以做一个小测试,在第一行代码处打一个断点,然后 Debug 模式运行一下,这个时候,这些代码都还没有运行,然后我们再用另一个程序打印一下 StringTable 的信息(也就是字符串常量池的引用表),代码如下:(PS:可以用 jps 命令查看需要的进程号)

import sun.jvm.hotspot.memory.StringTable;
import sun.jvm.hotspot.runtime.VM;
import sun.jvm.hotspot.tools.Tool;

public class PrintStringTable extends Tool {
    public static void main(String[] args) {
        if (args.length == 0 || args.length > 1) {
            System.err.println("Usage: java PrintStringTable <PID of the JVM whose string table you want to print>");
            System.exit(1);
        }
        PrintStringTable pst = new PrintStringTable();
        pst.execute(args);
        pst.stop();
    }

    @Override
    public void run() {
        VM vm = VM.getVM();
        StringTable table = vm.getStringTable();
        table.stringsDo(instance -> instance.print());
    }
}

在打印出来的信息中,我们可以找一下 "a", "b", "c" 的信息,但发现并没有找到。然后回到之前的程序,执行一步端点调试,再重新打印 StringTable ,就能够找到 "a" 的信息,也就是说,字面量的字符串确实是在运行完代码之后才生成的,并不是想象中的认为在加载完毕后就已经有了,这是怎么回事?

实际上,在 JVM规范中明确表面了,resolve 阶段是可以延迟到运行代码之前的,也就是说,到底有没有提前生成对象,还和使用的 JVM 有关。

总结

所以到底生成了几个对象,其实一点也不重要,毕竟这是 JVM 的行为,也不影响你的开发使用,而且涉及到的因素众多,很难给出标准答案,但是如果能掌握其中的原理,不管从哪个角度回答都无所谓啦。