1 JVM 中对象的创建过程
主要包括以下几个过程:检查加载、内存分配、内存空间初始化、设置、对象初始化。
1.1 检查加载
当Java虚拟机遇到一条字节码new指令
时,首先将去检查这个指令的参数是否能在常量池
中定位到一个类的符号引用
,并且检查这个符号引用代表的类是否已被加载
、解析
和初始化
过。如果没有,那必须先执行相应的类加载
过程。
1.2 内存分配
在类加载检查通过后,接下来虚拟机将为新生对象分配内存
。
对象所需内存的大小在类加载
完成后便可完全确定
,为对象分配空间的任务实际上便等同于把一块确定大小的内存块
从Java堆
中划分出来。
常见的分配方式根据堆内存是否规整
确定。
1.2.1 指针碰撞
如果Java堆
中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针
作为分界点的指示器
,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”。
1.2.2 空闲列表
如果Java堆
中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表
,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”。
选择哪种分配方式由
Java堆是否规整
决定,而Java堆是否规整又由所采用的垃圾收集器
是否带有空间压缩整理
(Compact)的能力决定。因此,当使用Serial
、ParNew
等带压缩整理过程的收集器时,系统采用的分配算法是指针碰撞
,既简单又高效;
而当使用CMS
这种基于清除(Sweep)算法
的收集器时,理论上1就只能采用较为复杂的空闲列表
来分配内存。
1.2.3 并发安全问题
对象创建在虚拟机中是非常频繁的行为,即使仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的
,可能出现正在给对象 A
分配内存,指针还没来得及修改,对象B
又同时使用了原来的指针来分配内存的情况。
可采取以下措施进行处理:
CAS
+失败重试
- 本地线程分配缓存
TLAB
每个线程在
Java堆
中预先分配一小块内存,称为本地线程分配缓冲
(Thread Local Allocation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完 了,分配新的缓存区时才需要同步锁定
。
虚拟机是否使用TLAB
,可以通过-XX:+/-UseTLAB
参数来设定。JVM默认开启。-XX:TLABSize
:指定TLAB
大小,默认大小伊甸园的1%
。
1.3 内存空间初始化
内存分配完成之后,虚拟机必须将分配到的内存空间(但不包括对象头)都初始化为零值
,如果使用了TLAB
的话,这一项工作也可以提前至TLAB
分配时顺便进行。这步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用
,使程序能访问到这些字段的数据类型所对应的零值
。
1.4 设置
主要设置对象头
。例如这个对象是哪个类的实例
、如何才能找到类的元数据信息
、对象的哈希码
(实际上对象的哈希码会延后到真正调用Object ::hashCode()
方法时才计算)、对象的GC分代年龄等信息
。这些信息存放在对象的对象头
(Object Header)之中。根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。
详细的对象头信息,会在第2节给出。
1.5 对象初始化
在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了。但是从Java程序的视角
看来,对象创建才刚刚开始——构造函数
,即Class文件
中的<init>()
方法还没有执行,所有的字段
都为默认的零值
,对象需要的其他资源和状态信息也还没有按照预定的意图构造好。一般来说(由字节码流中new指令
后面是否跟随invoke special指令
所决定,Java编译器会在遇到new关键字
的地方同时生成这两条字节码指令,但如果直接通过其他方式产生的则不一定如此),new指令
之后会接着执行<init> ()
方法,按照程序员的意愿对对象
进行初始化
,这样一个真正可用的对象才算完全被构造出来
。
下面这张图给出了上述流程全过程。详细的类加载过程会在后续文章中讲述。
2 对象的组成
在HotSpot虚拟机
里,对象在堆内存
中的存储布局可以划分为三个部分:
对象头
(Header):分为两类信息。Mark Word
:用于存储对象自身的运行时数据,如哈希码
(HashCode)、GC分代年龄
、锁状态标志
、线程持有的锁
、偏向线程ID
、偏向时间戳
等,这部分数据的长度在32位
和64位
的虚拟机(未开启压缩指针)中分别为32个比特
和64个比特
,官方称它为“Mark Word”。类型指针
:对象指向它的类型元数据的指针。确定该对象是哪个类的实例
。数组长度
:如果对象是一个Java数组
的话。
实例数据
(Instance Data):对象真正存储的有效信息。对齐填充
(Padding):这并不是必然存在的,也没有特别的含义,它仅仅起着占位符
的作用。由于HotSpot虚拟机
的自动内存管理系统要求对象起始地址必须是8字节的整数倍
,换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数
(1倍或者2倍),因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全
。
这里先给出对象头的组成,后面在讨论锁的流程时会具体涉及里面的字段意义。
3 对象的访问定位
创建对象自然是为了后续使用该对象,我们的Java程序会通过栈
上的reference数据
来操作堆
上的具体对象
。由于reference类型
在《Java虚拟机规范》里面只规定了它是一个指向对象的引用,并没有定义这个引用应该通过什么方式去定位、访问到堆中对象的具体位置,所以对象访问方式也是由虚拟机实现
而定的,主流的访问方式主要有使用句柄
和直接指针
两种:
- 句柄
使用句柄来访问的最大好处就是
reference
中存储的是稳定的句柄地址
,在对象被移动时只会改变句柄中的实例数据指针
,而reference
本身不需要修改。 - 直接指针
使用直接指针访问方式的最大好处就是
速度更快
,它节省了一次指针定位的时间开销,由于对象的访问在 Java 中非常频繁,因此这类开销积少成多
后也是一项非常可观的执行成本。
对HotSpot
而言,它是使用直接指针访问
方式进行对象访问的。
1 强调“理论上”是因为在CMS
的实现里面,为了能在多数情况下分配得更快,设计了一个叫作Linear Allocation Buffer
的分配缓冲区,通过空闲列表
拿到一大块分配缓冲区之后,在它里面仍然可以使用指针碰撞
方式来分配。