【JVM】Java 中的三种常量池

原文链接：https://tangxman.github.io/2015/07/27/the-difference-of-java-string-pool/，本文做了一些简单排版

在java的内存分配中，经常听到很多关于常量池的描述，我开始看的时候也是看的很模糊，网上五花八门的说法简直太多了，最后查阅各种资料，终于算是差不多理清了，很多网上说法都有问题，笔者尝试着来区分一下这几个概念。

1.全局字符串池（string pool也有叫做string literal pool）

全局字符串池里的内容是在类加载完成，经过验证，准备阶段之后在堆中生成字符串对象实例，然后将该字符串对象实例的引用值存到 string pool 中.

记住：string pool中存的是引用值而不是具体的实例对象，具体的实例对象是在堆中开辟的一块空间存放的。

在 HotSpot VM 里实现的 string pool 功能的是一个 StringTable 类，它是一个哈希表，里面存的是驻留字符串(也就是我们常说的用双引号括起来的)的引用（而不是驻留字符串实例本身），也就是说在堆中的某些字符串实例被这个 StringTable 引用之后就等同被赋予了”驻留字符串”的身份。这个 StringTable 在每个 HotSpot VM 的实例只有一份，被所有的类共享。

2.class文件常量池（class constant pool）

我们都知道，class 文件中除了包含类的版本、字段、方法、接口等描述信息外，还有一项信息就是常量池(constant pool table)，用于存放编译器生成的各种字面量(Literal)和符号引用(Symbolic References)。

字面量就是我们所说的常量概念，如文本字符串、被声明为final的常量值等。

符号引用是一组符号来描述所引用的目标，符号可以是任何形式的字面量，只要使用时能无歧义地定位到目标即可（它与直接引用区分一下，直接引用一般是指向方法区的本地指针，相对偏移量或是一个能间接定位到目标的句柄）。一般包括下面三类常量：

类和接口的全限定名
字段的名称和描述符
方法的名称和描述符

常量池的每一项常量都是一个表，一共有如下表所示的11种各不相同的表结构数据，这每个表开始的第一位都是一个字节的标志位（取值1-12），代表当前这个常量属于哪种常量类型。

序号	常量池中数据项类型	类型标志	类型描述
1	CONSTANT_Utf8	1	UTF-8 编码的Unicode字符串
2	CONSTANT_Integer	3	int 类型字面值
3	CONSTANT_Float	4	float 类型字面值
4	CONSTANT_Long	5	long 类型字面值
5	CONSTANT_Double	6	double 类型字面值
6	CONSTANT_Class	7	对一个类或接口的符号引用
7	CONSTANT_String	8	String 类型字面值
8	CONSTANT_Fieldref	9	对一个字段的符号引用
9	CONSTANT_Methodref	10	对一个类中声明的方法的符号引用
10	CONSTANT_InterfaceMethodref	11	对一个接口中声明的方法的符号引用
11	CONSTANT_NameAndType	12	对一个字段或方法的部分符号引用

每种不同类型的常量类型具有不同的结构，具体的结构本文就先不叙述了，本文着重区分这三个常量池的概念（读者若想深入了解每种常量类型的数据结构可以查看《深入理解java虚拟机》第六章的内容）。

3.运行时常量池（runtime constant pool）

当 java 文件被编译成 class 文件之后，也就是会生成我上面所说的 class 常量池，那么运行时常量池又是什么时候产生的呢？

jvm 在执行某个类的时候，必须经过加载、连接、初始化，而连接又包括验证、准备、解析三个阶段。而当类加载到内存中后，jvm 就会将class常量池中的内容存放到运行时常量池中，由此可知，运行时常量池也是每个类都有一个。

在上面我也说了，class常量池中存的是字面量和符号引用，也就是说他们存的并不是对象的实例，而是对象的符号引用值。而经过解析（resolve）之后，也就是把符号引用替换为直接引用，解析的过程会去查询全局字符串池，也就是我们上面所说的StringTable，以保证运行时常量池所引用的字符串与全局字符串池中所引用的是一致的。

举个实例来说明一下:

String str1 = "abc";
String str2 = new String("def");
String str3 = "abc";
String str4 = str2.intern();
String str5 = "def";
System.out.println(str1 == str3);//true
System.out.println(str2 == str4);//false
System.out.println(str4 == str5);//true

先来说一下 JVM 对于字符串处理的整个流程：

上面程序的经过编译之后，在该类的class常量池中存放一些符号引用
类加载之后，将class常量池中存放的符号引用转存到运行时常量池中
经过验证，准备阶段之后，在堆中生成驻留字符串的实例对象（也就是上例中str1所指向的”abc”实例对象）
然后将这个对象的引用存到全局String Pool中，也就是StringTable中
最后在解析阶段，要把运行时常量池中的符号引用替换成直接引用，那么就直接查询 StringTable，保证StringTable里的引用值与运行时常量池中的引用值一致，大概整个过程就是这样了

回到上面的那个程序，现在就很容易解释整个程序的内存分配过程了，

首先，在堆中会有一个”abc”实例，全局StringTable中存放着”abc”的一个引用值
然后在运行第二句的时候会生成两个实例，
- 一个是”def”的实例对象，并且StringTable中存储一个”def”的引用值
- 还有一个是new出来的一个”def”的实例对象，与上面那个是不同的实例
当在解析str3的时候查找StringTable，里面有”abc”的全局驻留字符串引用，所以str3的引用地址与之前的那个已存在的相同
str4是在运行的时候调用intern()函数，返回 StringTable中”def”的引用值，如果没有就将 str2 的引用值添加进去，在这里，StringTable 中已经有了”def”的引用值了，所以返回上面在 new str2 的时候添加到StringTable中的 “def”引用值
最后str5在解析的时候就也是指向存在于StringTable中的”def”的引用值

那么这样一分析之后，下面三个打印的值就容易理解了。

总结一下，字符串实例都是存在堆上的；但是，如果不 new，则会直接将字符串常量池的引用返回；如果 new，则会再创建一个字符串实例，并将其引用返回；如果要将某个字符串也添加到字符串常量池，可以通过 intern() 方法（前提是字符串常量池无该实例）。

总结

1.全局常量池在每个VM中只有一份，存放的是字符串常量的引用值。
2.class常量池是在编译的时候每个class都有的，在编译阶段，存放的是常量的符号引用。
3.运行时常量池是在类加载完成之后，将每个class常量池中的符号引用值转存到运行时常量池中，也就是说，每个class都有一个运行时常量池，类在解析之后，将符号引用替换成直接引用，与全局常量池中的引用值保持一致。