V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
herongwei
V2EX  ›  推广

[再硬核 | 5 千字长文+ 30 张图解 | 陪你手撕 STL 空间配置器源码]

  •  
  •   herongwei · 2021-04-17 15:17:44 +08:00 · 1239 次点击
    这是一个创建于 1309 天前的主题,其中的信息可能已经有所发展或是发生改变。

    STL 源码剖析-空间配置器

    大家好,我是小贺。

    1 、前言

    天下大事,必作于细。

    源码之前,了无秘密。

    你清楚下面这几个问题吗?

    • 调用 new 和 delete 时编译器底层到底做了哪些工作?
    • STL 器底层空间配置原理是怎样的?
    • STL 空间配置器到底要考虑什么?
    • 什么是内存的配置和释放?

    这篇,我们就来回答这些问题。

    2 、STL 六大组件

    在深入配置器之前,我们有必要了解下 STL 的背景知识:

    标准模板库(英文:Standard Template Library,缩写:STL ),是一个 C++ 软件库。

    STL 的价值在于两个方面,就底层而言,STL 带给我们一套极具实用价值的零部件以及一个整合的组织;除此之外,STL 还带给我们一个高层次的、以泛型思维 (Generic Paradigm) 为基础的、系统化的“软件组件分类学”。

    STL 提供六大组件,了解这些为接下来的阅读打下基础。

    • 容器( containers ):各种数据结构,如 vector, list, deque, set, map 用来存放数据。从实现的角度来看,STL 容器是一种 class template 。

    • 算法( algorithms ):各种常用的算法如 sort, search, copy, erase…从实现角度来看,STL 算法是一种 function template 。

    • 迭代器( iterators ):扮演容器与算法之间的胶合剂,是所谓的“泛型指针”。从实现角度来看,迭代器是一种将 operator *, operator ->, operator++, operator– 等指针相关操作予以重载的 class template 。

    • 仿函数( functors ):行为类似函数,可以作为算法的某种策略。从实现角度来看,仿函数是一种重载了 operator() 的 class 或 class template 。

    • 适配器( adapters ):一种用来修饰容器或仿函数或迭代器接口的东西。例如 STL 提供的 queue 和 stack,虽然看似容器,其实只能算是一种容器适配器,因为它们的底部完全借助 deque,所有操作都由底层的 deque 供应。

    • 配置器( allocator ):负责空间配置与管理,从实现角度来看,配置器是一个实现了动态空间配置、空间管理、空间释放的 class template 。

    3 、何为空间配置器

    3.1 为何需要先了解空间配置器?

    从使用 STL 层面而言,空间配置器并不需要介绍 ,因为容器底层都给你包装好了,但若是从 STL 实现角度出发,空间配置器是首要理解的。

    作为 STL 设计背后的支撑,空间配置器总是在默默地付出着。为什么你可以使用算法来高效地处理数据,为什么你可以对容器进行各种操作,为什么你用迭代器可以遍历空间,这一切的一切,都有“空间配置器”的功劳。

    3.2 SGI STL 专属空间配置器

    SGI STL 的空间配置器与众不同,且与 STL 标准规范不同。

    其名为 alloc,而非 allocator 。

    虽然 SGI 也配置了 allocatalor,但是它自己并不使用,也不建议我们使用,原因是效率比较感人,因为它只是在基层进行配置 /释放空间而已,而且不接受任何参数。

    SGI STL 的每一个容器都已经指定缺省的空间配置器是 alloc 。

    在 C++ 里,当我们调用 new 和 delete 进行对象的创建和销毁的时候,也同时会有内存配置操作和释放操作:

    这其中的 new 和 delete 都包含两阶段操作:

    • 对于 new 来说,编译器会先调用 ::operator new 分配内存;然后调用 Obj::Obj() 构造对象内容。

    • 对于 delete 来说,编译器会先调用 Obj::~Obj() 析构对象;然后调用 ::operator delete 释放空间。

    为了精密分工,STL allocator 决定将这两个阶段操作区分开来。

    • 对象构造由 ::construct() 负责;对象释放由 ::destroy() 负责。

    • 内存配置由 alloc::allocate() 负责;内存释放由 alloc::deallocate() 负责;

    STL 配置器定义在头文件,如下图直观的描述了这一框架结构:

    memory

    4 、构造和析构源码

    我们知道,程序内存的申请和释放离不开基本的构造和析构基本工具:construct() 和 destroy() 。

    在 STL 里面,construct() 函数接受一个指针 P 和一个初始值 value,该函数的用途就是将初值设定到指针所指的空间上。

    destroy() 函数有两个版本,第一个版本接受一个指针,准备将该指针所指之物析构掉。直接调用析构函数即可。

    第二个版本接受 first 和 last 两个迭代器,将[first,last)范围内的所有对象析构掉。

    其中 destroy() 只截取了部分源码,全部实现还考虑到特化版本,比如判断元素的数值类型 (value type) 是否有 trivial destructor 等限于篇幅,完整代码请参阅《 STL 源码剖析》。

    再来张图吧,献丑了。

    5 、内存的配置与释放

    前面所讲都是对象的构造和析构,接下来要讲的是对象构造和析构背后的故事—(内存的分配与释放),这块是才真正的硬核,不要搞混了哦。

    5.1 真· alloc 设计奥义

    对象构造和析构之后的内存管理诸项事宜,由 <stl_alloc.h> 一律负责。SGI 对此的设计原则如下:

    • 向 system heap 要求空间

    • 考虑多线程 (multi-threads) 状态

    • 考虑内存不足时的应变措施

    • 考虑过多“小型区块”可能造成的内存碎片 (fragment) 问题

    考虑到小型区块可能造成的内存破碎问题,SGI 为此设计了双层级配置器。当配置区块超过 128bytes 时,称为足够大,使用第一级配置器,直接使用 malloc() 和 free()。

    当配置区块不大于 128bytes 时,为了降低额外负担,直接使用第二级配置器,采用复杂的 memory pool 处理方式。

    无论使用第一级配接器(__malloc_alloc_template )或是第二级配接器(__default_alloc_template ),alloc 都为其包装了接口,使其能够符合 STL 标准。

    其中, __malloc_alloc_template 就是第一级配置器;

    __default_alloc_template 就是第二级配置器。

    这么一大堆源码看懵了吧,别着急,请看下图。

    其中 SGI STL 将配置器多了一层包装使得 Alloc 具备标准接口。

    6 、alloc 一级配置器源码解读

    这里截取部分(精华)解读

    ( 1 )第一级配置器以 malloc(), free(), realloc() 等 C 函数执行实际的内存配置、释放和重配置操作,并实现类似 C++ new-handler 的机制(因为它并非使用 ::operator new 来配置内存,所以不能直接使用 C++ new-handler 机制)。

    ( 2 ) SGI 第一级配置器的 allocate() 和 reallocate() 都是在调用 malloc() 和 realloc() 不成功后,改调用 oom_malloc() 和 oom_realloc()。

    ( 3 ) oom_malloc() 和 oom_realloc() 都有内循环,不断调用“内存不足处理例程”,期望某次调用后,获得足够的内存而圆满完成任务,哪怕有一丝希望也要全力以赴申请啊,如果用户并没有指定“内存不足处理程序”,这个时候便无力乏天,真的是没内存了,STL 便抛出异常。或调用 exit(1) 终止程序。

    7 、alloc 二级配置器源码解读

    照例,还是截取部分(精华)源码解读。看累了嘛,远眺歇会,回来继续看,接下来的这部分,将会更加的让我们为大师的智慧折服!

    第二级配置器多了一些机制,专门针对内存碎片。内存碎片化带来的不仅仅是回收时的困难,配置也是一个负担,额外负担永远无法避免,毕竟系统要划出这么多的资源来管理另外的资源,但是区块越小,额外负担率就越高。

    7.1 SGI 第二级配置器到底解决了多少问题呢?

    简单来说 SGI 第二级配置器的做法是:sub-allocation (层次架构):

    前面也说过了,SGI STL 的第一级配置器是直接使用 malloc(),free(), realloc() 并配合类似 C++ new-handler 机制实现的。第二级配置器的工作机制要根据区块的大小是否大于 128bytes 来采取不同的策略:

    继续跟上节奏,上面提到了 memory pool,相信程序员朋友们很熟悉这个名词了,没错,这就是二级配置器的精髓所在,如何理解?请看下图:

    有了内存池,是不是就可以了,当然没有这么简单。上图中还提到了自由链表,这个又是何方神圣?

    我们来一探究竟!

    7.2 自由链表自由在哪?又该如何维护呢?

    我们知道,一方面,自由链表中有些区块已经分配给了客端使用,所以 free_list 不需要再指向它们;另一方面,为了维护 free-list,每个节点还需要额外的指针指向下一个节点。

    那么问题来了,如果每个节点有两个指针?这不就造成了额外负担吗?本来我们设计 STL 容器就是用来保存对象的,这倒好,对象还没保存之前,已经占据了额外的内存空间了。那么,有方法解决吗?当然有!再来感受一次大师的智慧!

    ( 1 )在这之前我们先来了解另一个概念——union (联合体 /共用体),对 union 已经熟悉的读者可以跳过这一部分的内容;如果忘记了也没关系,趁此来回顾一下:

    ( a )共用体是一种特殊的类,也是一种构造类型的数据结构。

    ( b )共用体表示几个变量共用一个内存位置,在不同的时间保存不同的数据类型和不同长度的变量。

    ( c )所有的共用体成员共用一个空间,并且同一时间只能储存其中一个成员变量的值。例如如下:

    union

    一个 union 只配置一个足够大的空间以来容纳最大长度的数据成员,以上例而言,最大长度是 double 类型,

    所以 ChannelManager 的空间大小就是 double 数据类型的大小。在 C++ 里,union 的成员默认属性页为 public 。union 主要用来压缩空间,如果一些数据不可能在同一时间同时被用到,则可以使用 union 。

    ( 2 )了解了 union 之后,我们可以借助 union 的帮助,先来观察一下 free-list 节点的结构

    来深入了解 free_list 的实现技巧,请看下图。

    在 union obj 中,定义了两个字段,再结合上图来分析:

    从第一个字段看,obj 可以看做一个指针,指向链表中的下一个节点;

    从第二个字段看,obj 可以也看做一个指针,不过此时是指向实际的内存区。

    一物二用的好处就是不会为了维护链表所必须的指针而造成内存的另一种浪费,或许这就是所谓的自由奥义所在!大师的智慧跃然纸上。

    7.3 第二级配置器的部分实现内容

    到这里,我们已经基本了解了第二级配置器中 free_list 的工作原理了。附上第二级配置器的部分实现内容源码:

    太长了吧,看懵逼了,没关系,请耐心接着往下看。

    8 、空间配置器函数 allocate 源码解读

    我们知道第二级配置器拥有配置器的标准接口函数 allocate()。此函数首先判断区块的大小,如果大于 128bytes –> 调用第一级配置器;小于 128bytes–> 就检查对应的 free_list (如果没有可用区块,就将区块上调至 8 倍数的边界,然后调用 refill(), 为 free list 重新填充空间。

    8.1 空间申请

    调用标准接口函数 allocate():

    NOTE:每次都是从对应的 free_list 的头部取出可用的内存块。然后对 free_list 进行调整,使上一步拨出的内存的下一个节点变为头结点。

    8.2 空间释放

    同样,作为第二级配置器拥有配置器标准接口函数 deallocate()。该函数首先判断区块大小,大于 128bytes 就调用第一级配置器。小于 128 bytes 就找出对应的 free_list,将区块回收。

    NOTE:通过调整 free_list 链表将区块放入 free_list 的头部。

    区块回收纳入 free_list 的操作,如图所示:

    8.3 重新填充 free_lists

    ( 1 )当发现 free_list 中没有可用区块时,就会调用 refill() 为 free_list 重新填充空间;

    ( 2 )新的空间将取自内存池(经由 chunk_alloc() 完成);

    ( 3 )缺省取得 20 个新节点(区块),但万一内存池空间不足,获得的节点数可能小于 20 。

    8.4 内存池( memory pool )

    唔…在前面提到了 memory pool,现在终于轮到这个大 boss 上场。

    首先,我们要知道从内存池中取空间给 free_list 使用,是 chunk_alloc() 在工作,它是怎么工作的呢?

    我们先来分析 chunk_alloc() 的工作机制:

    chunk_alloc() 函数以 end_free – start_free 来判断内存池的“水量”(哈哈,很形象的比喻)。

    具体逻辑都在下面的图里了,很形象吧。

    如果第一级配置器的 malloc() 也失败了,就发出 bad_alloc 异常。

    说了这么多来看一下 STL 的源码吧。

    太长了,又看懵逼了吧,没关系,请看下图。

    NOTE:上述就是 STL 源码当中实际内存池的操作原理,我们可以看到其实以共用体串联起来共享内存形成了 free_list 的实质组成。

    9 、本文小结

    STL 源码本身博大精深,还有很多精妙的设计等着大家去探索。

    小贺本人才疏学浅,在这里也只是从自己的角度去写出自己的理解,不足之处希望对大家多多指出,互相讨论学习。

    这篇肝了一个礼拜的文章,在周日的晚上终于写完了,文中所有的图都是自己一个个亲手画的,不画不知道,画完之后真心感觉不容易啊。

    第一次写这种图解的文章,不知道读者朋友们喜不喜欢。如果反馈还不错的话,后面有时间会继续更新类型的图解文章。

    参考文章:

    《 STL 源码剖析-侯捷》

    https://cloud.tencent.com/developer/article/1686585

    https://dulishu.top/allocator-of-stl/

    10 、结尾

    如果觉得文章对你有帮助,欢迎分享给你的朋友,一键三连,谢谢你们,给各位小姐姐小哥哥们比心了。

    我是 herongwei,是男人,就该对自己狠一点,我们下期见。

    更多精彩

    🔭 宇宙中心五道口狗厂程序员,爱生活,好读书

    🌱 热爱分享: 公众号『 herongwei 』

    🤔 个人博客:herongwei.com

    📫 微信:icoredump

    😄 有问题欢迎知乎 @herongwei

    关注公众号 [ herongwei ] ,后台回复 [大礼包] 即可获取白嫖后端技术知识+算法电子书~

    为了回馈读者,本公众号不定期会有送礼活动,敬请关注~

    3 条回复    2021-04-18 08:00:28 +08:00
    putaozhenhaochi
        1
    putaozhenhaochi  
       2021-04-17 17:33:33 +08:00 via Android   ❤️ 1
    Livid
        2
    Livid  
    MOD
       2021-04-18 07:59:08 +08:00
    @putaozhenhaochi 这个主题已经被移动到 /go/promotions
    Livid
        3
    Livid  
    MOD
       2021-04-18 08:00:28 +08:00
    @herongwei 请阅读 V2EX 的节点使用说明:

    https://www.v2ex.com/help/node

    推广软文只能发布到 /go/promotions 节点。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2837 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 09:44 · PVG 17:44 · LAX 01:44 · JFK 04:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.