从零实现C++ Vector容器：STL核心设计与内存管理-嵌云网-嵌入式AI开发资源站

从零实现C++ Vector容器：STL核心设计与内存管理

逍遥Eric

1. 从零实现C++ Vector容器：深入理解STL核心设计

在C++开发中，vector是最常用的容器之一，但很多开发者对其底层实现机制并不了解。本文将带你从零开始实现一个简化版的vector容器，深入剖析其核心设计思想和关键技术细节。通过这个实践过程，你不仅能掌握vector的工作原理，还能提升对内存管理、迭代器失效等关键概念的理解。

2. Vector容器基础架构设计

2.1 成员变量与内存管理

vector的核心是一个动态数组，我们需要三个指针来管理内存：

cpp复制template<class T>
class vector {
private:
    iterator _start = nullptr;        // 指向数组起始位置
    iterator _finish = nullptr;       // 指向最后一个元素的下一个位置
    iterator _end_of_storage = nullptr; // 指向分配内存的末尾
};

这种三指针设计是vector高效管理内存的关键：

_start和_finish之间的空间存储实际元素
_finish和_end_of_storage之间的空间是预分配但未使用的容量
通过指针相减可以快速获取size()和capacity()

注意：这里使用了成员变量声明时直接初始化的方式（C++11特性），避免了在多个构造函数中重复初始化，也确保了拷贝构造时的正确性。

2.2 构造函数与初始化

vector提供了默认构造函数，采用现代C++的初始化方式：

cpp复制vector() = default;  // 使用编译器生成的默认实现

这种简洁的实现依赖于成员变量的类内初始化，避免了传统构造函数中可能出现的遗漏初始化问题。同时它也与拷贝构造函数保持了一致的行为模式。

3. 核心功能实现解析

3.1 内存分配与reserve实现

reserve()是vector性能优化的关键函数，负责预分配内存：

cpp复制void reserve(size_t n) {
    if (n > capacity()) {
        size_t oldSize = size();
        T* tmp = new T[n];
        
        // 深拷贝元素
        for (size_t i = 0; i < oldSize; i++) {
            tmp[i] = _start[i];  // 调用元素的赋值运算符
        }
        
        delete[] _start;
        _start = tmp;
        _finish = _start + oldSize;
        _end_of_storage = _start + n;
    }
}

关键点说明：

只在新容量大于当前容量时才执行操作
必须使用元素级别的拷贝而非memcpy，确保自定义类型的深拷贝语义
拷贝后需要正确更新所有指针位置

常见陷阱：

直接使用memcpy会导致浅拷贝问题
忘记保存旧的size()会导致指针计算错误
异常安全性考虑不足

3.2 元素访问与operator[]

vector提供数组式访问接口：

cpp复制T& operator[](size_t n) {
    assert(n < size());
    return _start[n];
}

const T& operator[](size_t n) const {
    assert(n < size());
    return _start[n];
}

设计要点：

提供const和非const两个版本
使用assert进行边界检查
返回引用允许修改元素

4. 动态扩容策略与元素操作

4.1 push_back与扩容机制

push_back实现了vector的动态增长：

cpp复制void push_back(const T& val) {
    if (_finish == _end_of_storage) {
        size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();
        reserve(newcapacity);
    }
    *_finish = val;
    ++_finish;
}

扩容策略分析：

初始容量为0时分配4个元素空间
之后每次按2倍当前容量扩容
这种策略在时间复杂度和空间利用率之间取得了平衡

4.2 pop_back与边界检查

pop_back实现相对简单但需要安全检查：

cpp复制void pop_back() {
    assert(_finish > _start);
    --_finish;
}

注意事项：

必须检查容器非空
只移动指针不释放内存（符合STL语义）
不会自动缩容（与reserve策略一致）

5. 容量调整与resize实现

resize提供了灵活的容量调整：

cpp复制void resize(size_t n, const T& val = T()) {
    if (n < size()) {
        _finish = _start + n;  // 缩减size
    } else {
        reserve(n);  // 确保足够容量
        while (_finish != _start + n) {
            *_finish = val;
            ++_finish;
        }
    }
}

关键设计：

当n<size()时只调整指针不释放内存
当n>size()时使用默认值填充新空间
参数val有默认值T()，支持自定义类型的默认构造

6. 赋值与拷贝语义实现

6.1 传统赋值运算符实现

传统实现方式：

cpp复制vector& operator=(const vector& v) {
    if (this != &v) {
        delete[] _start;
        _start = _finish = _end_of_storage = nullptr;
        reserve(v.capacity());
        for (const auto& e : v) {
            push_back(e);
        }
    }
    return *this;
}

注意事项：

必须检查自赋值情况
先释放旧内存再申请新内存
需要手动将指针置nullptr避免悬垂指针

6.2 现代C++实现（拷贝交换技法）

更优雅的现代实现：

cpp复制void swap(vector<T>& v) {
    std::swap(_start, v._start);
    std::swap(_finish, v._finish);
    std::swap(_end_of_storage, v._end_of_storage);
}

vector<T>& operator=(vector<T> v) {  // 注意：传值而非引用
    swap(v);
    return *this;
}

优势分析：

利用拷贝构造函数完成资源分配
通过swap交换资源所有权
异常安全性更好
代码更简洁，自动处理自赋值情况

7. 迭代器失效问题深度解析

7.1 insert操作与迭代器失效

insert实现需要特别注意迭代器失效：

cpp复制void insert(iterator pos, const T& val) {
    assert(pos >= _start && pos <= _finish);
    if (_finish == _end_of_storage) {
        size_t len = pos - _start;  // 保存相对位置
        reserve(capacity() == 0 ? 4 : 2 * capacity());
        pos = _start + len;  // 重新计算位置
    }
    
    // 移动元素
    iterator it = _finish - 1;
    while (it >= pos) {
        *(it + 1) = *it;
        --it;
    }
    
    *pos = val;
    ++_finish;
}

失效场景分析：

扩容会导致所有迭代器失效
必须保存并重新计算插入位置
移动元素时需要从后向前避免覆盖

7.2 erase操作与迭代器失效

erase的实现及正确用法：

cpp复制iterator erase(iterator pos) {
    assert(pos >= _start && pos < _finish);
    iterator it = pos + 1;
    while (it < _finish) {
        *(it - 1) = *it;
        ++it;
    }
    --_finish;
    return pos;  // 返回被删除元素的下一个位置
}

// 正确删除所有偶数的写法
auto it = v.begin();
while (it != v.end()) {
    if (*it % 2 == 0) {
        it = erase(it);  // 使用返回值更新迭代器
    } else {
        ++it;
    }
}

关键点：

erase会使其后所有迭代器失效
必须使用返回值更新迭代器
错误用法会导致未定义行为或逻辑错误

8. 完整实现与测试用例

8.1 vector.h 完整代码

cpp复制#pragma once
#include <iostream>
#include <algorithm>
#include <cassert>

namespace LC {
    template<class T>
    class vector {
        typedef T* iterator;
        typedef const T* const_iterator;
        
    public:
        // 构造函数
        vector() = default;
        
        // 拷贝构造
        vector(const vector& v) {
            reserve(v.capacity());
            for (const auto& e : v) {
                push_back(e);
            }
        }
        
        // 赋值运算符
        vector& operator=(vector v) {
            swap(v);
            return *this;
        }
        
        // 析构函数
        ~vector() {
            delete[] _start;
            _start = _finish = _end_of_storage = nullptr;
        }
        
        // 迭代器支持
        iterator begin() { return _start; }
        iterator end() { return _finish; }
        const_iterator begin() const { return _start; }
        const_iterator end() const { return _finish; }
        
        // 容量相关
        size_t size() const { return _finish - _start; }
        size_t capacity() const { return _end_of_storage - _start; }
        bool empty() const { return _start == _finish; }
        
        // 元素访问
        T& operator[](size_t n) {
            assert(n < size());
            return _start[n];
        }
        
        const T& operator[](size_t n) const {
            assert(n < size());
            return _start[n];
        }
        
        // 修改操作
        void push_back(const T& val);
        void pop_back();
        void reserve(size_t n);
        void resize(size_t n, const T& val = T());
        void insert(iterator pos, const T& val);
        iterator erase(iterator pos);
        void swap(vector& v) {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_end_of_storage, v._end_of_storage);
        }
        
    private:
        iterator _start = nullptr;
        iterator _finish = nullptr;
        iterator _end_of_storage = nullptr;
    };
}

8.2 测试用例设计

基础功能测试：

cpp复制void TestVector1() {
    LC::vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    v1.push_back(4);
    
    assert(v1.size() == 4);
    assert(v1.capacity() >= 4);
    assert(v1[0] == 1);
    
    v1.pop_back();
    assert(v1.size() == 3);
    
    LC::vector<int> v2 = v1;  // 测试拷贝构造
    assert(v2.size() == 3);
    
    v2.resize(10, 5);  // 测试resize
    assert(v2.size() == 10);
    assert(v2[5] == 5);
}

迭代器失效测试：

cpp复制void TestIteratorInvalidation() {
    LC::vector<int> v;
    for (int i = 0; i < 10; ++i) {
        v.push_back(i);
    }
    
    // 测试insert失效
    auto it = v.begin() + 5;
    v.insert(it, 99);
    assert(*it != 5);  // 原迭代器已失效
    
    // 测试erase失效
    it = v.begin() + 3;
    it = v.erase(it);  // 正确用法
    assert(*it == 4);  // 指向被删除元素的下一个
    
    // 删除所有偶数
    it = v.begin();
    while (it != v.end()) {
        if (*it % 2 == 0) {
            it = v.erase(it);
        } else {
            ++it;
        }
    }
    assert(std::none_of(v.begin(), v.end(), [](int x) { return x % 2 == 0; }));
}

通过实现这个简化版vector，我们深入理解了动态数组容器的核心设计思想、内存管理策略以及迭代器失效等关键问题。这些知识不仅对理解STL容器有帮助，也是提升C++内存管理能力的重要实践。