STL设计之EBO(空基类优化)

0.导语

EBO简称Empty Base Optimization。

本节从空类开始,到STL内部,到测试,再到我们自己实现一个EBO,对比性能,最后再测试,总结。

1.空类

定义一个空类:没有成员变量,没有继承,没有数据元素的类。

  1. class Empty{
  2. public:
  3. void print() {
  4. std::cout<<"I am Empty class"<<std::endl;
  5. }
  6. };

由于它是空的,所以这个sizeof是多少呢?

  1. std::cout<<sizeof(Empty)<<std::endl; //1

结果是1,它是空的怎么不是0呢?

因为空类同样可以被实例化,每个实例在内存中都有一个独一无二的地址,为了达到这个目的,编译器往往会给一个空类隐含的加一个字节,这样空类在实例化后在内存得到了独一无二的地址.所以上述大小为1.

根据上面的回答,估计大家或引出另一个问题:为什么两个不同对象的地址应该不同?

现在有下面这个例子:

  1. class Empty{
  2. public:
  3. void print() {
  4. std::cout<<"I am Empty class"<<std::endl;
  5. }
  6. };
  7. template < typename T >
  8. bool isSame( T const & t1, T const & t2 )
  9. {
  10. return &t1 == &t2;
  11. }

我们来测试一下:

  1. int main() {
  2. Empty a,b;
  3. assert(!isSame(a,b)); // 编译通过,a与b的地址不同
  4. Empty *p=new Empty;
  5. Empty *q=new Empty;
  6. assert(!isSame(p,q)); // 编译通过,a与b的地址不同
  7. return 0;
  8. }

上面测试了,两个不同对象地址是不同的,考虑下面场景:

  1. Empty a,b;
  2. // 在同一地址具有两个对象将意味着在使用指针引用它们时将无法区分这两个对象。
  3. Empty *p1=&a;
  4. p1->print();

此时会发现,如果a的地址与b的地址一样,那么在同一地址具有两个对象将意味着在使用指针引用它们时将无法区分这两个对象。因此两个不同对象的地址不同。

2.空基类优化

现在对比一下下面两个用法,第一种,一个类中包含了两一个类作为成员,然后通过这个来获得被包含类的功能。

  1. class notEbo {
  2. int i;
  3. Empty e;
  4. // do other things
  5. };

另一种直接采用继承的方式来获得基类的成员函数及其他功能等等。

  1. class ebo:public Empty {
  2. int i;
  3. // do other things
  4. };

接下来做个测试:

  1. std::cout<<sizeof(notEbo)<<std::endl;
  2. std::cout<<sizeof(ebo)<<std::endl;

输出:

  1. 8
  2. 4

第一种,会因为字节对齐,将其原来只占1字节,进行扩充到4的倍数,最后就是8字节。

对比这两个发现,第二种通过继承方式来获得基类的功能,并没有产生额外大小的优化称之为EBO(空基类优化)。

接下来,我们回到STL源码中,看看其中的使用!

3.STL中的EBO世界

不管是deque、rb_tree、list等容器,都离不开内存管理,在这几个容器中都包含了相应的内存管理,并通过_xx_impl来继承下面这几个类:

  1. std::allocator<_Tp>
  2. __gnu_cxx::bitmap_allocator<_Tp>
  3. __gnu_cxx::bitmap_allocator<_Tp>
  4. __gnu_cxx::__mt_alloc<_Tp>
  5. __gnu_cxx::__pool_alloc<_Tp>
  6. __gnu_cxx::malloc_allocator<_Tp>

那这和我们的EBO有啥关系呢?

实际上,上面所列出继承的基类都是内存管理的EBO(空基类)。

在每个容器中的使用都是调用每个内存管理的rebind<_Tp>::other

例如红黑树源码结构:

  1. typedef typename __gnu_cxx::__alloc_traits<_Alloc>::template
  2. rebind<_Rb_tree_node<_Val> >::other _Node_allocator;
  3. struct _Rb_tree_impl : public _Node_allocator
  4. {
  5. // do somethings
  6. };

接下来我们看上面列出的内存管理类里面的源码结构:这里拿allocator举例:

  1. template<typename _Tp>
  2. class allocator: public __allocator_base<_Tp>
  3. {
  4. template<typename _Tp1>
  5. struct rebind { typedef allocator<_Tp1> other; };
  6. };

看到了没,通过rebind<_Tp>::other来获得传递进来的内存分配器,也就是前面提到的这些。

  1. std::allocator<_Tp>
  2. __gnu_cxx::bitmap_allocator<_Tp>
  3. __gnu_cxx::bitmap_allocator<_Tp>
  4. __gnu_cxx::__mt_alloc<_Tp>
  5. __gnu_cxx::__pool_alloc<_Tp>
  6. __gnu_cxx::malloc_allocator<_Tp>

搞懂了这些,来测试一波:

  1. void print() {
  2. cout<<sizeof(std::allocator<int>)<<" "<<sizeof(std::allocator<int>::rebind<int>::other)<<endl;
  3. cout<<sizeof(__gnu_cxx::bitmap_allocator<int>)<<" "<<sizeof(__gnu_cxx::bitmap_allocator<int>::rebind<int>::other)<<endl;
  4. cout<<sizeof(__gnu_cxx::new_allocator<int>)<<" "<<sizeof(__gnu_cxx::new_allocator<int>::rebind<int>::other)<<endl;
  5. cout<<sizeof(__gnu_cxx::__mt_alloc<int>)<<" "<<sizeof(__gnu_cxx::__mt_alloc<int>::rebind<int>::other)<<endl;
  6. cout<<sizeof(__gnu_cxx::__pool_alloc<int>)<<" "<<sizeof(__gnu_cxx::__pool_alloc<int>::rebind<int>::other)<<endl;
  7. cout<<sizeof(__gnu_cxx::malloc_allocator<int>)<<" "<<sizeof(__gnu_cxx::malloc_allocator<int>::rebind<int>::other)<<endl;
  8. }

我们来测试这些sizeof是不是1,经过测试输出如下:

  1. 1 1
  2. 1 1
  3. 1 1
  4. 1 1
  5. 1 1
  6. 1 1

说明内存管理的实现就是通过采用继承的方式,使用空基类优化,来达到尽量降低容器所占的大小。

4.利用EBO,手动实现一个简单的内存分配与释放

首先定义一个sizeof(class)=1的类,同STL一样,里面使用allocate与deallocate来进行内存管理。

  1. class MyAllocator {
  2. public:
  3. void *allocate(std::size_t size) {
  4. return std::malloc(size);
  5. }
  6. void deallocate(void *ptr) {
  7. std::free(ptr);
  8. }
  9. };

第一种方式的内存管理:嵌入一个内存管理类

  1. template<class T, class Allocator>
  2. class MyContainerNotEBO {
  3. T *data_ = nullptr;
  4. std::size_t capacity_;
  5. Allocator allocator_; // 嵌入一个MyAllocator
  6. public:
  7. MyContainerNotEBO(std::size_t capacity)
  8. : capacity_(capacity), allocator_(), data_(nullptr) {
  9. std::cout << "alloc malloc" << std::endl;
  10. data_ = reinterpret_cast<T *>(allocator_.allocate(capacity * sizeof(T))); // 分配内存
  11. }
  12. ~MyContainerNotEBO() {
  13. std::cout << "MyContainerNotEBO free malloc" << std::endl;
  14. allocator_.deallocate(data_);
  15. }
  16. };

第二种方式:采用空基类优化,继承来获得内存管理功能

  1. template<class T, class Allocator>
  2. class MyContainerEBO
  3. : public Allocator { // 继承一个EBO
  4. T *data_ = nullptr;
  5. std::size_t capacity_;
  6. public:
  7. MyContainerEBO(std::size_t capacity)
  8. : capacity_(capacity), data_(nullptr) {
  9. std::cout << "alloc malloc" << std::endl;
  10. data_ = reinterpret_cast<T *>(this->allocate(capacity * sizeof(T)));
  11. }
  12. ~MyContainerEBO() {
  13. std::cout << "MyContainerEBO free malloc" << std::endl;
  14. this->deallocate(data_);
  15. }
  16. };

开始测试:

  1. int main() {
  2. MyContainerNotEBO<int, MyAllocator> notEbo = MyContainerNotEBO<int, MyAllocator>(0);
  3. std::cout << "Using Not EBO Test sizeof is " << sizeof(notEbo) << std::endl;
  4. MyContainerEBO<int, MyAllocator> ebo = MyContainerEBO<int, MyAllocator>(0);
  5. std::cout << "Using EBO Test sizeof is " << sizeof(ebo) << std::endl;
  6. return 0;
  7. }

测试结果:

  1. alloc malloc
  2. Using Not EBO Test sizeof is 24
  3. alloc malloc
  4. Using EBO Test sizeof is 16
  5. MyContainerEBO free malloc
  6. MyContainerNotEBO free malloc

我们发现采用EBO的设计确实比嵌入设计好很多。至此,本节学习完毕。