C++11 std::thread多线程编程实战指南-嵌云网-嵌入式AI开发资源站

C++11 std::thread多线程编程实战指南

周恰恰

1. 为什么需要掌握std::thread？

十年前我刚接触多线程编程时，最头疼的就是不同平台API的差异。Windows有CreateThread，Linux用pthread_create，写跨平台代码得搞一堆条件编译。直到C++11引入了std::thread，才让多线程开发真正实现了"一次编写，到处运行"。

std::thread作为C++标准库的线程类，封装了底层操作系统的线程API，提供了统一的接口。这意味着我们不再需要关心不同平台下线程创建的细节差异。比如在Windows和Linux上创建线程，现在只需要写一次std::thread代码就能在两个平台编译运行。

但std::thread的价值远不止于此。它还与C++的其他特性深度集成，比如可以与std::mutex、std::condition_variable等同步原语完美配合，还能利用RAII机制管理线程生命周期。这些特性让多线程编程变得更安全、更不容易出现资源泄漏。

2. std::thread核心用法详解

2.1 创建线程的四种姿势

创建std::thread对象时，最常用的方式是传入一个可调用对象。这里我总结了几种典型用法：

cpp复制// 1. 普通函数
void hello() {
    std::cout << "Hello from thread!\n";
}
std::thread t1(hello);

// 2. Lambda表达式
std::thread t2([](){
    std::cout << "Hello from lambda thread!\n";
});

// 3. 成员函数
class Worker {
public:
    void doWork() {
        std::cout << "Working...\n";
    }
};
Worker w;
std::thread t3(&Worker::doWork, &w);

// 4. 带参数的函数
void printNum(int num) {
    std::cout << "Number: " << num << "\n";
}
std::thread t4(printNum, 42);

注意：创建线程后必须调用join()或detach()，否则程序终止时会调用std::terminate。这是新手最容易犯的错误之一。

2.2 线程传参的陷阱与技巧

给线程函数传递参数看似简单，实则暗藏玄机。std::thread的参数传递机制与普通函数调用有所不同：

cpp复制void modify(int& num) {
    num = 100;
}

int main() {
    int x = 0;
    // std::thread t(modify, x);  // 编译错误！x必须是可修改的左值引用
    std::thread t(modify, std::ref(x));  // 正确方式
    t.join();
    std::cout << x;  // 输出100
}

这里的关键点在于，std::thread的参数默认是按值传递的。如果需要传递引用，必须使用std::ref包装。类似地，如果要传递指针，也要特别注意生命周期管理。

2.3 线程标识与硬件并发

每个std::thread对象都有唯一的线程ID，可以通过get_id()获取：

cpp复制std::thread t([](){
    std::cout << "Thread ID: " 
              << std::this_thread::get_id() << "\n";
});
std::cout << "Main thread ID: " 
          << t.get_id() << "\n";
t.join();

此外，C++还提供了硬件并发数的查询接口：

cpp复制unsigned int cores = std::thread::hardware_concurrency();
std::cout << "This machine has " << cores 
          << " hardware threads.\n";

这个信息对设计线程池或任务调度系统非常有用，可以帮助我们确定最优的线程数量。

3. 线程生命周期管理实战

3.1 join与detach的抉择

join()和detach()是管理线程生命周期的两种基本方式：

cpp复制// join示例
std::thread t1([](){
    // 长时间运行的任务
});
// 做一些其他工作...
t1.join();  // 等待t1完成

// detach示例
std::thread t2([](){
    // 后台任务
});
t2.detach();  // 分离线程，不再管理

选择join还是detach取决于具体场景。join保证线程执行完毕才继续，适合需要结果的场景；detach让线程独立运行，适合后台任务。但detach要特别注意：分离后的线程不能再join，且必须确保线程不会访问已销毁的对象。

3.2 RAII包装线程对象

为了避免忘记join或detach，我们可以用RAII技术封装线程：

cpp复制class ThreadGuard {
    std::thread& t;
public:
    explicit ThreadGuard(std::thread& t_) : t(t_) {}
    ~ThreadGuard() {
        if(t.joinable()) {
            t.join();  // 或根据需求改为t.detach()
        }
    }
    // 禁止拷贝
    ThreadGuard(const ThreadGuard&) = delete;
    ThreadGuard& operator=(const ThreadGuard&) = delete;
};

void use_thread() {
    std::thread t([](){ /*...*/ });
    ThreadGuard g(t);
    // 函数结束时自动join
}

这种模式确保了线程资源的安全释放，是C++多线程编程的最佳实践之一。

4. 线程同步与数据竞争

4.1 互斥量的正确使用姿势

多线程访问共享数据必须同步。std::mutex是最基本的同步原语：

cpp复制std::mutex mtx;
int shared_data = 0;

void increment() {
    for(int i = 0; i < 100000; ++i) {
        std::lock_guard<std::mutex> lock(mtx);
        ++shared_data;
    }
}

int main() {
    std::thread t1(increment);
    std::thread t2(increment);
    t1.join();
    t2.join();
    std::cout << shared_data;  // 正确输出200000
}

这里使用了std::lock_guard来自动管理锁的获取和释放。C++17还引入了std::scoped_lock，可以更方便地处理多个互斥量：

cpp复制std::mutex mtx1, mtx2;

void safe_access() {
    std::scoped_lock lock(mtx1, mtx2);  // 同时锁定两个互斥量
    // 访问受保护资源
}

4.2 条件变量的使用模式

条件变量(std::condition_variable)用于线程间的通知机制：

cpp复制std::mutex mtx;
std::condition_variable cv;
bool ready = false;

void worker() {
    std::unique_lock<std::mutex> lock(mtx);
    cv.wait(lock, []{ return ready; });
    std::cout << "Worker is processing...\n";
}

int main() {
    std::thread t(worker);
    
    // 模拟准备工作
    std::this_thread::sleep_for(std::chrono::seconds(1));
    
    {
        std::lock_guard<std::mutex> lock(mtx);
        ready = true;
    }
    cv.notify_one();
    
    t.join();
}

条件变量的使用有几个关键点：

必须与std::unique_lock配合使用
wait操作会自动释放锁并在唤醒后重新获取
通常需要配合一个条件判断来避免虚假唤醒

5. 高级技巧与性能考量

5.1 线程局部存储

有时候我们需要每个线程有自己的变量副本，这时可以使用thread_local：

cpp复制thread_local int thread_specific_value = 0;

void worker() {
    thread_specific_value = std::rand();
    std::cout << "Thread " << std::this_thread::get_id() 
              << " has value " << thread_specific_value << "\n";
}

int main() {
    std::thread t1(worker);
    std::thread t2(worker);
    t1.join();
    t2.join();
}

每个线程都会有自己的thread_specific_value实例，修改不会影响其他线程。这在实现线程安全的随机数生成器或日志系统时特别有用。

5.2 原子操作的应用

对于简单的计数器，使用原子操作(std::atomic)比互斥量更高效：

cpp复制std::atomic<int> counter(0);

void increment() {
    for(int i = 0; i < 100000; ++i) {
        ++counter;  // 原子操作，无需锁
    }
}

int main() {
    std::thread t1(increment);
    std::thread t2(increment);
    t1.join();
    t2.join();
    std::cout << counter;  // 正确输出200000
}

原子操作适用于简单的读-修改-写操作。对于复杂操作，还是需要互斥量保护。

5.3 线程亲和性与调度策略

虽然C++标准没有直接提供设置线程亲和性的接口，但我们可以通过平台特定API实现：

cpp复制void set_affinity(std::thread& t, int cpu) {
    cpu_set_t cpuset;
    CPU_ZERO(&cpuset);
    CPU_SET(cpu, &cpuset);
    pthread_setaffinity_np(t.native_handle(), 
                          sizeof(cpu_set_t), &cpuset);
}

int main() {
    std::thread t([](){
        // 计算密集型任务
    });
    
    // 绑定到CPU 0
    set_affinity(t, 0);
    
    t.join();
}

这种技术对性能敏感的应用很有帮助，可以减少缓存失效和上下文切换。

6. 常见陷阱与调试技巧

6.1 死锁的预防与诊断

死锁是多线程编程中最令人头疼的问题之一。典型的死锁场景：

cpp复制std::mutex mtx1, mtx2;

void thread_a() {
    std::lock_guard<std::mutex> lock1(mtx1);
    std::this_thread::sleep_for(std::chrono::milliseconds(100));
    std::lock_guard<std::mutex> lock2(mtx2);
    // ...
}

void thread_b() {
    std::lock_guard<std::mutex> lock2(mtx2);
    std::this_thread::sleep_for(std::chrono::milliseconds(100));
    std::lock_guard<std::mutex> lock1(mtx1);
    // ...
}

预防死锁的几个原则：

总是以相同的顺序获取锁
使用std::lock或std::scoped_lock一次性获取多个锁
避免在持有锁时调用用户代码
使用锁层次结构

6.2 数据竞争的调试工具

数据竞争是最难调试的多线程问题之一。一些有用的工具和技术：

ThreadSanitizer (TSan)：编译时添加-fsanitize=thread选项
Helgrind：Valgrind的一个工具，用于检测同步错误
日志记录：在关键点添加日志输出
断言：验证不变量

例如使用TSan：

bash复制g++ -fsanitize=thread -g my_program.cpp
./a.out

它会报告发现的数据竞争和死锁。

7. 现代C++中的线程改进

7.1 C++17的改进

C++17引入了std::scoped_lock，简化了多个互斥量的锁定：

cpp复制std::mutex mtx1, mtx2;

void safe_access() {
    std::scoped_lock lock(mtx1, mtx2);  // 自动避免死锁
    // 访问受两个互斥量保护的资源
}

此外，并行算法也开始进入标准库：

cpp复制std::vector<int> data = {1, 2, 3, 4, 5};
std::for_each(std::execution::par, data.begin(), data.end(), 
             [](int& x) { x *= 2; });

7.2 C++20的新特性

C++20引入了std::jthread，它在析构时会自动join：

cpp复制void worker() {
    // 长时间运行的任务
}

int main() {
    std::jthread t(worker);  // 不需要手动join
    // ...
}  // t析构时自动join

还有std::stop_token用于线程取消：

cpp复制void worker(std::stop_token st) {
    while(!st.stop_requested()) {
        // 执行工作
    }
}

int main() {
    std::jthread t(worker);
    // ...
    t.request_stop();  // 请求停止
}

这些新特性让线程管理更加安全和方便。

8. 实战：构建简单线程池

最后，让我们用std::thread实现一个简单的线程池：

cpp复制class ThreadPool {
    std::vector<std::thread> workers;
    std::queue<std::function<void()>> tasks;
    std::mutex queue_mutex;
    std::condition_variable condition;
    bool stop = false;

public:
    ThreadPool(size_t threads) {
        for(size_t i = 0; i < threads; ++i) {
            workers.emplace_back([this] {
                while(true) {
                    std::function<void()> task;
                    {
                        std::unique_lock<std::mutex> lock(queue_mutex);
                        condition.wait(lock, 
                            [this]{ return stop || !tasks.empty(); });
                        if(stop && tasks.empty()) return;
                        task = std::move(tasks.front());
                        tasks.pop();
                    }
                    task();
                }
            });
        }
    }

    template<class F>
    void enqueue(F&& f) {
        {
            std::unique_lock<std::mutex> lock(queue_mutex);
            tasks.emplace(std::forward<F>(f));
        }
        condition.notify_one();
    }

    ~ThreadPool() {
        {
            std::unique_lock<std::mutex> lock(queue_mutex);
            stop = true;
        }
        condition.notify_all();
        for(std::thread& worker : workers)
            worker.join();
    }
};

这个线程池实现展示了std::thread与其它同步原语的综合应用。使用时可以这样：

cpp复制ThreadPool pool(4);

for(int i = 0; i < 8; ++i) {
    pool.enqueue([i] {
        std::cout << "Task " << i << " executed by thread " 
                  << std::this_thread::get_id() << "\n";
    });
}

在实际项目中，你可能需要考虑任务优先级、工作窃取等更复杂的调度策略。