线程 · cpp · 看云

[TOC] # 线程概念在许多经典的操作系统教科书中，总是把进程定义为程序的执行实例，它并不执行什么, 只是维护应用程序所需的各种资源，而线程则是真正的执行实体。所以，线程是轻量级的进程（LWP：light weight process），在Linux环境下线程的本质仍是进程。为了让进程完成一定的工作，进程必须至少包含一个线程。 ![](https://img.kancloud.cn/e9/36/e936bb6449e10ecb945e32b3957c81ed_302x420.png) 进程，直观点说，保存在硬盘上的程序运行以后，会在内存空间里形成一个独立的内存体，这个内存体有自己的地址空间，有自己的堆，上级挂靠单位是操作系统。操作系统会以进程为单位，分配系统资源，所以我们也说，**进程是CPU分配资源的最小单位**。线程存在与进程当中(进程可以认为是线程的容器)，是操作系统调度执行的最小单位。说通俗点，线程就是干活的。进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动，进程是系统进行资源分配和调度的一个独立单位。线程是进程的一个实体，是 CPU 调度和分派的基本单位，它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源，只拥有一点在运行中必不可少的资源（如程序计数器，一组寄存器和栈），但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。如果说进程是一个资源管家，负责从主人那里要资源的话，那么线程就是干活的苦力。一个管家必须完成一项工作，就需要最少一个苦力，也就是说，一个进程最少包含一个线程，也可以包含多个线程。苦力要干活，就需要依托于管家，所以说一个线程，必须属于某一个进程。进程有自己的地址空间，线程使用进程的地址空间，也就是说，进程里的资源，线程都是有权访问的，比如说堆啊，栈啊，静态存储区什么的。 > 进程是操作系统分配资源的最小单位 > > 线程是操作系统调度的最小单位 # 线程函数列表安装命令： > sudo apt-get install manpages-posix-dev 【说明】manpages-posix-dev 包含 POSIX 的 header files 和 library calls 的用法查看： > man -k pthread # NPTL 当 Linux 最初开发时，在内核中并不能真正支持线程。但是它的确可以通过 clone() 系统调用将进程作为可调度的实体。这个调用创建了调用进程（calling process）的一个拷贝，这个拷贝与调用进程共享相同的地址空间。LinuxThreads 项目使用这个调用来完全在用户空间模拟对线程的支持。不幸的是，这种方法有一些缺点，尤其是在信号处理、调度和进程间同步原语方面都存在问题。另外，这个线程模型也不符合 POSIX 的要求。要改进 LinuxThreads，非常明显我们需要内核的支持，并且需要重写线程库。有两个相互竞争的项目开始来满足这些要求。一个包括 IBM 的开发人员的团队开展了 NGPT（Next-Generation POSIX Threads）项目。同时，Red Hat 的一些开发人员开展了 NPTL 项目。NGPT 在 2003 年中期被放弃了，把这个领域完全留给了 NPTL。 NPTL，或称为 Native POSIX Thread Library，是 Linux 线程的一个新实现，它克服了 LinuxThreads 的缺点，同时也符合 POSIX 的需求。与 LinuxThreads 相比，它在性能和稳定性方面都提供了重大的改进。查看当前pthread库版本：getconf GNU\_LIBPTHREAD\_VERSION ~~~ root@master:~ # getconf GNU_LIBPTHREAD_VERSION NPTL 2.17 ~~~ # 线程的特点类Unix系统中，早期是没有“线程”概念的，80年代才引入，借助进程机制实现出了线程的概念。因此在这类系统中，进程和线程关系密切： 1) 线程是轻量级进程(light-weight process)，也有PCB，创建线程使用的底层函数和进程一样，都是clone 2) 从内核里看进程和线程是一样的，都有各自不同的PCB. 3) 进程可以蜕变成线程 4) 在linux下，线程最是小的执行单位；进程是最小的分配资源单位 ![](https://img.kancloud.cn/7c/3f/7c3fb224933c3e459c0ff3bfabadeadc_675x462.png) 查看指定进程的LWP号： > ps -Lf pid 实际上，无论是创建进程的fork，还是创建线程的pthread\_create，底层实现都是调用同一个内核函数 clone 。 Ø 如果复制对方的地址空间，那么就产出一个“进程”； Ø 如果共享对方的地址空间，就产生一个“线程”。 Linux内核是不区分进程和线程的, 只在用户层面上进行区分。所以，线程所有操作函数 pthread\_\* 是库函数，而非系统调用。 # 线程共享资源 1) 文件描述符表 2) 每种信号的处理方式 3) 当前工作目录 4) 用户ID和组ID 内存地址空间 (.text/.data/.bss/heap/共享库) # 线程非共享资源 1) 线程id 2) 处理器现场和栈指针(内核栈) 3) 独立的栈空间(用户空间栈) 4) errno变量 5) 信号屏蔽字 6) 调度优先级 # 线程的优缺点 **优点：** Ø 提高程序并发性 Ø 开销小 Ø 数据通信、共享数据方便 **缺点：** Ø 库函数，不稳定 Ø 调试、编写困难、gdb不支持 Ø 对信号支持不好优点相对突出，缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。 # 线程常用操作 ## 线程号就像每个进程都有一个进程号一样，每个线程也有一个线程号。进程号在整个系统中是唯一的，但线程号不同，线程号只在它所属的进程环境中有效。进程号用 pid\_t 数据类型表示，是一个非负整数。线程号则用 pthread\_t 数据类型来表示，Linux 使用无符号长整数表示。有的系统在实现pthread\_t 的时候，用一个结构体来表示，所以在可移植的操作系统实现不能把它做为整数处理。 pthread\_self函数： ~~~ #include <pthread.h> pthread_t pthread_self(void); 功能：获取线程号。参数：无返回值：调用线程的线程 ID 。 ~~~ pthread\_equal函数: ~~~ int pthread_equal(pthread_t t1, pthread_t t2); 功能：判断线程号 t1 和 t2 是否相等。为了方便移植，尽量使用函数来比较线程 ID。参数： t1，t2：待判断的线程号。返回值：相等：非 0 不相等：0 ~~~ ~~~ int main() { pthread_t thread_id; thread_id = pthread_self(); // 返回调用线程的线程ID printf("Thread ID = %lu \n", thread_id); if (0 != pthread_equal(thread_id, pthread_self())) { printf("Equal!\n"); } else { printf("Not equal!\n"); } return 0; } ~~~ 【注意】线程函数的程序在 pthread 库中，故链接时要加上参数 -lpthread。 ## 线程的创建 pthread\_create函数： ~~~ #include <pthread.h> int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine)(void *), void *arg ); 功能：创建一个线程。参数： thread：线程标识符地址。 attr：线程属性结构体地址，通常设置为 NULL。 start_routine：线程函数的入口地址。 arg：传给线程函数的参数。返回值：成功：0 失败：非 0 ~~~ 在一个线程中调用pthread\_create()创建新的线程后，当前线程从pthread\_create()返回继续往下执行，而新的线程所执行的代码由我们传给pthread\_create的函数指针start\_routine决定。由于pthread\_create的错误码不保存在errno中，因此不能直接用perror()打印错误信息，可以先用strerror()把错误码转换成错误信息再打印。 ~~~ // 回调函数 void *thread_fun(void * arg) { sleep(1); int num = *((int *)arg); printf("int the new thread: num = %d\n", num); return NULL; } int main() { pthread_t tid; int test = 100; // 返回错误号 int ret = pthread_create(&tid, NULL, thread_fun, (void *)&test); if (ret != 0) { printf("error number: %d\n", ret); // 根据错误号打印错误信息 printf("error information: %s\n", strerror(ret)); } while (1); return 0; } ~~~ ## 线程资源回收 pthread\_join函数： ~~~ #include <pthread.h> int pthread_join(pthread_t thread, void **retval); 功能：等待线程结束（此函数会阻塞），并回收线程资源，类似进程的 wait() 函数。如果线程已经结束，那么该函数会立即返回。参数： thread：被等待的线程号。 retval：用来存储线程退出状态的指针的地址。返回值：成功：0 失败：非 0 ~~~ ~~~ void *thead(void *arg) { static int num = 123; //静态变量 printf("after 2 seceonds, thread will return\n"); sleep(2); return &num; } int main() { pthread_t tid; int ret = 0; void *value = NULL; // 创建线程 pthread_create(&tid, NULL, thead, NULL); // 等待线程号为 tid 的线程，如果此线程结束就回收其资源 // &value保存线程退出的返回值 pthread_join(tid, &value); printf("value = %d\n", *((int *)value)); return 0; } ~~~ 调用该函数的线程将挂起等待，直到id为thread的线程终止。thread线程以不同的方法终止，通过pthread\_join得到的终止状态是不同的，总结如下： 1) 如果thread线程通过return返回，retval所指向的单元里存放的是thread线程函数的返回值。 2) 如果thread线程被别的线程调用pthread\_cancel异常终止掉，retval所指向的单元里存放的是常数PTHREAD\_CANCELED。 3) 如果thread线程是自己调用pthread\_exit终止的，retval所指向的单元存放的是传给pthread\_exit的参数。 ## 线程分离一般情况下，线程终止后，其终止状态一直保留到其它线程调用pthread\_join获取它的状态为止。但是线程也可以被置为detach状态，这样的线程一旦终止就立刻回收它占用的所有资源，而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread\_join，这样的调用将返回EINVAL错误。也就是说，如果已经对一个线程调用了pthread\_detach就不能再调用pthread\_join了。 pthread\_detach函数： ~~~ #include <pthread.h> int pthread_detach(pthread_t thread); 功能：使调用线程与当前进程分离，分离后不代表此线程不依赖与当前进程，线程分离的目的是将线程资源的回收工作交由系统自动来完成，也就是说当被分离的线程结束之后，系统会自动回收它的资源。所以，此函数不会阻塞。参数： thread：线程号。返回值：成功：0 失败：非0 ~~~ # 线程退出在进程中我们可以调用exit函数或\_exit函数来结束进程，在一个线程中我们可以通过以下三种在不终止整个进程的情况下停止它的控制流。 * 线程从执行函数中返回。 * 线程调用pthread\_exit退出线程。 * 线程可以被同一进程中的其它线程取消。 pthread\_exit函数 ~~~ #include <pthread.h> void pthread_exit(void *retval); 功能：退出调用线程。一个进程中的多个线程是共享该进程的数据段，因此，通常线程退出后所占用的资源并不会释放。参数： retval：存储线程退出状态的指针。返回值：无 ~~~ ~~~ void *thread(void *arg) { static int num = 123; //静态变量 int i = 0; while (1) { printf("I am runing\n"); sleep(1); i++; if (i == 3) { pthread_exit((void *)&num); // return &num; } } return NULL; } int main(int argc, char *argv[]) { int ret = 0; pthread_t tid; void *value = NULL; pthread_create(&tid, NULL, thread, NULL); pthread_join(tid, &value); printf("value = %d\n", *(int *)value); return 0; } ~~~ # 线程取消 ~~~ #include <pthread.h> int pthread_cancel(pthread_t thread); 功能：杀死(取消)线程参数： thread : 目标线程ID。返回值：成功：0 失败：出错编号 ~~~ 注意：线程的取消并不是实时的，而又一定的延时。需要等待线程到达某个取消点(检查点)。类似于玩游戏存档，必须到达指定的场所(存档点，如：客栈、仓库、城里等)才能存储进度。杀死线程也不是立刻就能完成，必须要到达取消点。取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用creat，open，pause，close，read，write..... 执行命令**man 7 pthreads**可以查看具备这些取消点的系统调用列表。可粗略认为一个系统调用(进入内核)即为一个取消点。 ~~~ void *thread_cancel(void *arg) { while (1) { pthread_testcancel(); //设置取消点 } return NULL; } int main() { pthread_t tid; pthread_create(&tid, NULL, thread_cancel, NULL); //创建线程 sleep(3); //3秒后 pthread_cancel(tid); //取消tid线程 pthread_join(tid, NULL); return 0; } ~~~