【C++】：STL源码剖析之vector类容器的底层模拟实现

青葱年少

11 月前

Table of Contents

📚1.vector接口总览

namespace lyp
{
	//模拟实现vector
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		//默认成员函数
		vector();                                           //构造函数
		vector(size_t n, const T& val);                     //构造函数
		template<class InputIterator>                      
		vector(InputIterator first, InputIterator last);    //构造函数
		vector(const vector<T>& v);                         //拷贝构造函数
		vector<T>& operator=(const vector<T>& v);           //赋值运算符重载函数
		~vector();                                          //析构函数

		//iterator
		iterator begin();
		iterator end();
		const_iterator begin()const;
		const_iterator end()const;

		//capacity
		size_t size()const;
		size_t capacity()const;
		void reserve(size_t n);
		void resize(size_t n, const T& val = T());
		bool empty()const;

		//modifiers
		void push_back(const T& x);
		void pop_back();
		void insert(iterator pos, const T& x);
		iterator erase(iterator pos);
		void swap(vector<T>& v);

		//access
		T& operator[](size_t i);
		const T& operator[](size_t i)const;

	private:
		iterator _start;        //指向容器的头
		iterator _finish;       //指向有效数据的尾
		iterator _endofstorage; //指向容器的尾
	};
}

📚2.vector模拟实现

📚构造函数

构造一个空vector size和capacity为0 将_start _finish _endofstorage 都置为空指针即可

vector()
	:_start(nullptr)
	,_finish(nullptr)
	,_endofstorage(nullptr)
{}

📚拷贝构造函数

/*vector(const vector<T>& v)
{
	_start = new T[v.capacity()];
	memcpy(_start, v._start, v.size()* sizeof(T));
	_finish = _start + v.size();
	_endofstorage = _start + v.capacity();
}*/

// v2(v1)
vector(const vector<T>& v)
{
	reserve(v.capacity());
	for (const auto& e : v)
	{
		push_back(e);
	}
}
void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_endofstorage, v._endofstorage);
}

// v1 = v3
vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

传统写法 :
1). 新开辟一块和 v 同样容量的空间，更新 _start， _finish， _endofstorage
2). 将 v 中的数据拷贝到新开辟的空间中
注意 : 不要使用memcpy函数拷贝数据，如果数据是内置类型或浅拷贝的自定义类型，使用memcpy是没有什么问题的，但如果数据是需要深拷贝的自定义类型(string)，问题就出现了，拷贝的数据和源数据指向同一块空间
现代写法 :
使用范围for进行遍历，变量e是v中元素的拷贝，如果v中元素是需要深拷贝的自定义类型，会调用拷贝构造函数构造e，从而使e和v中元素所指向的空间不一样 (auto& e : v 也可以，因为push_back在实现的时候还会调用深拷贝类型的赋值运算符重载)

void push_back(const T& x)
{
	if (_finish == _endofstorage)
	{
		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);
	}

	*_finish = x;
	++_finish;
}

📚赋值运算符重载

传统写法
1).释放原空间，新开一块容量和v一样大的空间，更新_start，_finish， _endofstorage
2).将v中的数据拷贝到新空间中
注意 : 不能使用memcpy进行拷贝
现代写法
1).调用拷贝构造函数生成tmp对象
2).分别交换tmp和this的_start，_finish， _endofstorage

void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_endofstorage, v._endofstorage);
}

// v1 = v3
vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

📚析构函数

1). 判断容器是否为空，若为空无需析构
2). 若不为空，将空间释放掉，_start，_finish， _endofstorage置为空指针

~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _endofstorage = nullptr;
	}
}

📚iterator

begin/end
begin()返回第一个元素的地址，end()返回最后一个元素下一位置的地址，为了能够让const对象调用，加入const版本的begin()和end()
iterator begin()

iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

const_iterator begin() const
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

📚size

返回容器中有效数据的个数，用 _finish – _start 即可

size_t size()const
{
	return _finish - _start;
}

📚capacity

返回容器的容量，用_endofstorage – _start 即可

size_t capacity()const
{
	return _endofstorage - _start;
}

📚reserve

1). 当n大于对象当前的capacity时，将capacity扩大到n或大于n。
2). 当n小于对象当前的capacity时，什么也不做。

实现步骤
1). 新开辟一块空间，若容器为空，将_start，_finish指向新开辟空间的首元素地址， _endofstorage指向新开辟空间的最后一个元素下一个位置
2). 若容器不为空，将数据拷贝到新空间，释放掉旧空间，更新_start，_finish， _endofstorage的位置

注意 : 将数据拷贝到新空间，仍然不能用memcpy函数，因为对于需要深拷贝的自定义类型，使用memcpy函数以后，新开辟空间里的元素和原空间里的元素所指向的内存空间是一样的，当旧空间被释放时，会调用自定义类型的析构函数，从而使得新开辟空间里的元素指向的内存空间也被释放掉了

void reserve(size_t n)
{
if (n > capacity())
{
	size_t old = size();
	T* tmp = new T[n];
	if (_start)
	{
		memcpy(tmp, _start, old * sizeof(T));
		delete[] _start;
	}

	_start = tmp;
	_finish = _start + old;
	_endofstorage = _start + n;
}
}

📚resize

1). 当 n < size 时，直接将 _finish = _start + n (将有效数据长度缩小)即可
(2).当 size < n <= capacity 时，我们将有效数据的长度增加到 n，增加出来的有效数据内容是val
(3).当 n > capacity时，先调用上面的 reserve 函数进行增容，再将有效数据的长度增加到 n，增加出来的有效数据内容是val

void resize(size_t n,const T& val = T())
{
	// 第一种 n < size()
	if (n < size())
	{
		_finish = _start + n;
	}
	// n > size()
	else
	{
		// 增容
		if (n > capacity())
			reserve(n);
		// 填充数据val
		size_t count = n - size();
		while (count--)
		{
			*_finish = val;
			++_finish;
		}
	}
}

📚empty

判断 size() == 0 即可

bool empty()const
{
	return size() == 0;
}

📚pop_back

尾删时，首先要判断容器是否为空，若为空，则断言报错，不为空，_finish– 即可

void pop_back()
{
	assert(size() > 0);
	--_finish;
}

📚insert

1). 容量不够，先增容，增容之前先记录下 pos – _start 的值，否则增容之后，pos 还指向原来已经被释放的空间
2). 将 pos 位置往后的数据往后挪动一位，在pos位置插入值val

void insert(iterator pos, const T& x)
{
	assert(pos >= _start && pos <= _finish);

	if (_finish == _endofstorage)
	{
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;
	}

	memmove(pos + 1, pos, sizeof(T) * (_finish - pos));
	*pos = x;

	++_finish;
}

📚剩下两三个接口我们在下一篇博客和List类的底层模拟实现给大家补上

📚STL中的vector类源码简单剖析含小部分注释

vector的数据结构：一个线性连续空间
下面介绍vector的3个数据结构：
start：表示目前使用空间的头
finish：表示目前使用空间的尾
end_of_storage：表示目前可用空间的尾

template <class T, class Alloc = alloc>
class vector {
...
protected:
    iterator start; //表示目前使用空间的头
    iterator finish; //表示目前使用空间的尾
    iterator end_of_storage; //表示目前可用空间的尾
    ...
};

说明：为了降低空间配置时的速度成本，vector实际配置的大小可能比客户端需求量更大一些，以备将来可能的扩充。这便是容量的概念。也就是说，一个vector的容量永远大于或等于其大小。一旦容量等于大小，下次再新增元素时就需要新开辟一块空间。如下图所示

运用start、finish、end_of_storage三个迭代器，vector提供了首尾标示、大小、容量、空容器判断、注标[]运算符、最前端元素值、最后端元素值…等机能，如下：

template <class T, class Alloc = alloc>
class vector {
...
public:
    iterator begin() { return start; }
    iterator end() { return finish; }
    size_type size() const { return size_type(end() - begin()); }
    size_type capacity() const {
        return size_type(end_of_storage - begin()); 
    }
    bool empty() const { return begin() == end(); }
    reference operator[](size_type n) { return *(begin() + n); }
    reference front() { return *begin(); }
    reference back() { return *(end() - 1); }
    ...
};

📚vector的构造与内存管理（constructor、push_back）

template <class T, class Alloc = alloc>
class vector {
protected:
    // simple_alloc<>见前面文章介绍
    typedef simple_alloc<value_type, Alloc> data_allocator;
    ...
};

//构造函数，允许指定vector大小n和初值value
vector(size_type n, const T& value) { fill_initialize(n, value); }

// 充填并予初始化
void fill_initialize(size_type n, const T& value) {
    start = allocate_and_fill(n, value);
    finish = start + n;
    end_of_storage = finish;
}

// 配置而后充填
iterator allocate_and_fill(size_type n, const T& x) {
    iterator result = data_allocator::allocate(n); //配置n个元素空间
    uninitialized_fill_n(result, n, x); //全局函式，会根据第1个参数类型特性决定使用算法fill_n()或反复调用construct()来完成任务
    return result;
}

push_back()函数：当我们以push_back() 将新元素安插入于vector尾端时，该函式首先检查是否还有备用空间，如果有就直接在备用空间上建构元素，并调整迭代器finish，使vector变大。如果没有备用空间了，就扩充空间（重新配置、搬移数据、释放原空间）。push_back()原型如下：

void push_back(const T& x) {
    if (finish != end_of_storage) { //还有备用空间
        construct(finish, x); //全局函式
        ++finish; //调整水位高度
    }
    else //已无备用空间
        insert_aux(end(), x); // vector member function，见下
}

template <class T, class Alloc>
void vector<T, Alloc>::insert_aux(iterator position, const T& x) {
    if (finish != end_of_storage) { //还有备用空间
        // 在备用空间起始处建构一个元素，并以 vector 最后一个元素值为其初值。
        construct(finish, *(finish - 1));
        // 调整水位。
        ++finish;
        T x_copy = x;
        copy_backward(position, finish - 2, finish - 1);
        *position = x_copy;
    }
    else { // 已无备用空间
        const size_type old_size = size();
        const size_type len = old_size != 0 ? 2 * old_size : 1;
        // 以上配置原则：如果原大小为0，则配置 1（个元素大小）
        // 如果原大小不为 0，则配置原大小的两倍，
        // 前半段用来放置原数据，后半段准备用来放置新数据
        iterator new_start = data_allocator::allocate(len); // 实际配置
        iterator new_finish = new_start;
        try {
            // 将原 vector 的内容拷贝到新vector
            new_finish = uninitialized_copy(start, position, new_start);
            // 为新元素设定初值 x
            construct(new_finish, x);
            // 调整水位
            ++new_finish;
            // 将原vector的备用空间中的内容也忠实拷贝过来
            new_finish = uninitialized_copy(position, finish, new_finish);
        }
        catch(...) {
            // "commit or rollback" semantics.
            destroy(new_start, new_finish);
            data_allocator::deallocate(new_start, len);
            throw;
        }
        //析构并释放原vector
        destroy(begin(), end());
        deallocate();

        // 调整迭代器，指向新vector
        vector start = new_start;
        finish = new_finish;
        end_of_storage = new_start + len;
    }
}

源码就给大家分享这么多源码不是我们要关注的简单了解即可

文章出处登录后可见！

已经登录？立即刷新