105-【八股】操作系统
虚拟地址空间
以32位机器为例,它的虚拟内存空间大小为
进程, 线程和协程
概念和区别
进程、线程和协程是操作系统和程序设计中重要的概念,它们的主要区别在于执行单元的粒度、资源开销以及调度方式。下面详细解释它们之间的区别:
- 进程(Process)
- 定义:进程是操作系统资源分配的基本单位,它是正在运行的程序的实例。每个进程都有自己独立的地址空间、代码段、数据段、堆栈以及文件描述符。
- 资源管理:进程拥有自己独立的资源,如内存、文件句柄、网络连接等,进程间不能直接共享数据。
- 开销:进程间切换的开销较大,因为涉及到上下文切换,操作系统需要保存和恢复各个进程的状态信息。
- 调度:操作系统的调度程序管理进程的调度,通常通过时间片轮转(preemptive scheduling)来调度不同进程的执行。
- 优点:进程之间相互独立,一个进程的崩溃不会直接影响到其他进程。
- 缺点:进程之间的通信(IPC)比较复杂,开销也大。
- 线程(Thread)
- 定义:线程是进程中的一个执行单元,一个进程可以包含多个线程,它们共享进程的资源(如内存、文件描述符等),每个线程有独立的栈空间和程序计数器(PC)。
- 资源管理:多个线程共享进程的资源,可以直接共享内存中的数据,这使得线程之间的通信更加高效。
- 开销:线程切换的开销比进程切换小,但仍然需要保存和恢复线程的上下文,线程的创建和销毁比进程更轻量。
- 调度:操作系统通常使用抢占式调度或者协作式调度来调度线程。线程的调度比进程更频繁,通常会比进程切换更加高效。
- 优点:线程之间的共享资源使得数据传输更简单,适合执行并发任务。
- 缺点:线程之间的共享内存可能会导致数据竞争(race condition)和死锁(deadlock)等问题,必须小心同步。
- 协程(Coroutine)
- 定义:协程是一种比线程更加轻量级的执行单元,通常是程序中的一个函数或代码块。协程不像线程那样由操作系统调度,而是由程序本身进行调度。
- 资源管理:协程通常共享进程和线程的资源,因为它们在同一线程中运行。协程不需要额外的内存栈,因为它们是通过用户级的调度来管理的。
- 开销:协程的创建、切换和销毁的开销极小。与线程相比,协程更轻量,可以在同一线程中创建成千上万个协程。
- 调度:协程的调度完全由程序控制,通常是通过事件循环或回调机制来管理执行。协程通过
yield
或await
等操作来挂起和恢复执行,允许在执行中暂停并切换到其他任务。 - 优点:协程的切换非常轻便,适合处理大量 I/O 密集型任务(如网络请求或文件操作),并且协程通常不会有线程间的竞态问题。
- 缺点:协程不适合 CPU 密集型任务,因为它们是单线程执行的。如果有大量 CPU 密集型计算,可能会造成性能瓶颈。
主要区别总结:
特性 | 进程 | 线程 | 协程 |
---|---|---|---|
资源 | 拥有独立的资源,如内存空间和文件句柄 | 共享进程的资源 | 共享线程的资源 |
开销 | 高,切换和创建开销较大 | 低,线程切换开销小于进程 | 极低,协程切换开销最小 |
调度 | 由操作系统调度 | 由操作系统调度 | 由程序调度(协作式调度) |
执行 | 每个进程在独立地址空间中执行 | 线程在共享内存中执行 | 协程在同一线程中执行,基于协作式调度 |
优点 | 程序独立,可靠性高 | 线程共享资源,适合并发任务 | 极轻量,适合 I/O 密集型任务 |
缺点 | 进程间通信复杂,开销大 | 共享内存可能导致线程安全问题 | 适合 I/O 密集型,不适合 CPU 密集型 |
应用场景:
- 进程:适合于需要高度隔离和独立运行的任务,或者多进程并发(如 Web 服务中的多进程模式)。
- 线程:适合需要在同一应用内共享资源且并发执行的任务(如多线程下载、计算等)。
- 协程:适合大量 I/O 操作且希望极低的创建和切换开销的场景(如网络爬虫、异步编程)。
通信方式
进程间通信:
- 管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。
- 有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。
- 信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。
- 消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。
- 信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。
- 共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号量,配合使用,来实现进程间的同步和通信。
- 套接口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同设备及其间的进程通信。
线程间通信:
锁机制:包括互斥锁、条件变量、读写锁
互斥锁提供了以排他方式防止数据结构被并发修改的方法。
读写锁允许多个线程同时读共享数据,而对写操作是互斥的。
条件变量可以以原子的方式阻塞进程,直到某个特定条件为真为止。对条件的测试是在互斥锁的保护下进行的。条件变量始终与互斥锁一起使用。
信号量机制:包括无名线程信号量和命名线程信号量。
信号机制:类似进程间的信号处理。
线程间的通信目的主要是用于线程同步,所以线程没有像进程通信中的用于数据交换的通信机制。