一、Golang内存管理的原理
Golang的内存管理的核心思想就是完成类似预分配、内存池等操作,以避开系统调用带来的性能问题,防止每次分配内存都需要系统调用。
下图是Golang内存管理流程图 PS:如果有什么错请各位大佬指正
对图中几个名词进行解释
page
mheap向虚拟内存申请的最小单位。一般为8KB
span
go内存分配的基本单位,有n个page组成
class size
为了减少内存碎片,将span的大小分级。目前分为0-66级共67级。可以看到class=0是没有使用的(图中也标为灰色)
66种span如下:(v.14.13)
1 | // class bytes/obj bytes/span objects tail waste max waste |
bytes/obj 指的是span的大小,可以看到范围是8B~32KB
bytes/span 指的是占用堆的字节数,也就是页数*页大小 (eg:8192=1x8k)
objects 值得是该span可以分配对象的个数(eg:1024=8192/8)
tail waste 产生的内存碎片 (eg:32=8192%48)
mcache
mcache是分配给M运行中的goroutine,是协程级所以无需加锁。为什么不用加锁呢,是因为在M上运行的goroutine只有一个,不会存在抢占资源的情况,所以是无需加锁的。
从上图中可以看到,mache供2种类型的对象分配内存。一个是微对象[1B,16B),一个是小对象[16B,32KB]。
在图中可以看到,对于微对象的内存分配是由mcache提供专门的Tiny allocator专门进行分配,具体的分配流程后续会介绍。
小对象是选择最适应自己大小的span进行分配,从图中可以可以看到同一级别的span是分成2类的,一类是可以被GC扫描的span,里面是包含指针的对象;另一类似不可以被GC扫描的span,里面不包含指针的对象。可以看到分配内存的时候会按照是否有指针对象对应不同的span,为了后续GC垃圾回收使用。
每一个级别的span链表是一个双向链表,每一个span都会指向前一个span和后一个span。每一级size class可以有1个或者多个span
当小对象申请内存在mache不够时,会继续向mcentral进行申请
mcentral
mcentral是为mcache提供切分好的span。mcentral是全局的,也就是多个M共享mcentral,会出现并发问题,所以此时申请都是需要加锁的。
mcentral存储67级别大小span,其中size=0是不使用的(图中标灰色)。每一级别的span分为2种,一种empty表示这条链的mspan已经被分配了对象,或者已经被mcache使用,被对应线程占用;nonempty表示有空闲对象的 mspan列表
值得注意的是mcentral链表都在mheap进行维护
若分配内存是没有空闲的span的列表,此时需要像mheap申请。
mheap
mheap是go程序持有的整个堆空间,是go的全局变量,所以在使用的时候需要全局锁。
大对象(大于32KB)直接通过mheap进行分配。除此之外,mcentrals保存在mheap中,mheap对mcentral了如指掌。
若mheap没有足够的内存,则会向虚拟内存申请page,然后将page组装成span再供程序使用。
mheap还存储多个heapArena ,heapArena 存储连续的span,主要是为了mheap管理span和GC垃圾回收
二、不同粒度对象内存分配原理
微对象 [1B,16B)
微对象的内存分配是由mcache提供专门的Tiny allocator专门进行分配,分配的对象是不包含指针的,例如一些小的字符串和不包含指针的独立逃逸变量等。
小对象 [16B,32KB]
小对象是在mache申请适合自己大小的span,若mache没有可用的span,mache会向mcentral申请,加锁,找一个可用的span,从nonempty删除该span,然后放到empty链表中,将span返回给工作线程,解锁;若没有足够的内存,mcentral还会继续向mheap继续申请。
当归还时,加锁,将empty链表删除对应的span,然后将其加到nonempty链表中,解锁。
大对象(32KB,+∞)
大对象,使用mheap直接分配,若mheap没有足够的内存,则mheap向虚拟内存申请若干个pages。可以看到,约到后面申请内存的代价就越来越大
三、Golang内存管理的优点是什么
1、可以看到申请内存的时候是以span为单位的,span又分为不同大小,从大小的规律我们可以看到不是简单的按照2次幂进行递增的,是根据计算造成碎片最少的情况下对span的分类,在申请的时候会减少内存碎片。比如在申请47B大小的时候,如果按照2次幂会提供64B大小的内存供应用使用,但是如果按照span会提供48B大小的span,很明显看出,后者造成的碎片会更少。
2、每次从操作系统申请一大块内存,由Go来做分配,减少了系统调用
3、go的内存算法是使用google的TCMalloc内存管理算法,把内存分的非常细,分为多级管理,减少锁的粒度。在回收对象内存时,并没有将其真正释放掉,只是放回预先分配的大块内存中,以便复用。只有内存闲置过多的时候,才会尝试归还部分内存给操作系统,降低整体开销