Python 多线程和多进程高级应用：从入门到精通

左手厨刀右手茼蒿

324人浏览 · 2026-05-06 19:15:30

左手厨刀右手茼蒿 · 2026-05-06 19:15:30 发布

Python 多线程和多进程高级应用：从入门到精通

作为一名从Python转向Rust的后端开发者，我深刻体会到Python中多线程和多进程的重要性。它们可以帮助我们充分利用多核CPU，提高程序的性能。今天，我想分享一下Python多线程和多进程的高级应用，希望能帮助大家更好地理解和使用这些强大的特性。

一、多线程的基本概念

1. 线程的创建

在Python中，我们可以使用threading模块来创建和管理线程。

import threading
import time

def worker():
    print(f"Worker thread started")
    time.sleep(2)
    print(f"Worker thread finished")

# 创建线程
thread = threading.Thread(target=worker)

# 启动线程
thread.start()

# 等待线程完成
thread.join()

print("Main thread finished")

2. 线程安全

在多线程环境中，我们需要注意线程安全问题，避免多个线程同时修改共享数据。

import threading

# 共享变量
count = 0

# 锁对象
lock = threading.Lock()

def increment():
    global count
    for _ in range(1000000):
        with lock:
            count += 1

def decrement():
    global count
    for _ in range(1000000):
        with lock:
            count -= 1

# 创建线程
thread1 = threading.Thread(target=increment)
thread2 = threading.Thread(target=decrement)

# 启动线程
thread1.start()
thread2.start()

# 等待线程完成
thread1.join()
thread2.join()

print(f"Final count: {count}")

二、多进程的基本概念

1. 进程的创建

在Python中，我们可以使用multiprocessing模块来创建和管理进程。

import multiprocessing
import time

def worker():
    print(f"Worker process started")
    time.sleep(2)
    print(f"Worker process finished")

# 创建进程
process = multiprocessing.Process(target=worker)

# 启动进程
process.start()

# 等待进程完成
process.join()

print("Main process finished")

2. 进程间通信

在多进程环境中，我们需要使用进程间通信（IPC）机制来传递数据。

import multiprocessing

def worker(queue):
    queue.put("Hello from worker process")

# 创建队列
queue = multiprocessing.Queue()

# 创建进程
process = multiprocessing.Process(target=worker, args=(queue,))

# 启动进程
process.start()

# 从队列中获取数据
message = queue.get()
print(f"Received message: {message}")

# 等待进程完成
process.join()

三、高级应用技巧

1. 线程池

我们可以使用concurrent.futures模块中的ThreadPoolExecutor来创建线程池，这样可以更方便地管理线程。

from concurrent.futures import ThreadPoolExecutor
import time

def worker(n):
    print(f"Worker {n} started")
    time.sleep(2)
    print(f"Worker {n} finished")
    return n * 2

# 创建线程池
with ThreadPoolExecutor(max_workers=3) as executor:
    # 提交任务
    futures = [executor.submit(worker, i) for i in range(5)]
    
    # 获取结果
    for future in futures:
        result = future.result()
        print(f"Result: {result}")

2. 进程池

我们可以使用concurrent.futures模块中的ProcessPoolExecutor来创建进程池，这样可以更方便地管理进程。

from concurrent.futures import ProcessPoolExecutor
import time

def worker(n):
    print(f"Worker {n} started")
    time.sleep(2)
    print(f"Worker {n} finished")
    return n * 2

# 创建进程池
with ProcessPoolExecutor(max_workers=3) as executor:
    # 提交任务
    futures = [executor.submit(worker, i) for i in range(5)]
    
    # 获取结果
    for future in futures:
        result = future.result()
        print(f"Result: {result}")

3. 异步IO与多线程/多进程结合

我们可以将异步IO与多线程/多进程结合起来，充分利用系统资源。

import asyncio
from concurrent.futures import ThreadPoolExecutor

async def main():
    # 创建线程池
    executor = ThreadPoolExecutor(max_workers=3)
    
    # 提交阻塞任务到线程池
    loop = asyncio.get_event_loop()
    futures = [
        loop.run_in_executor(executor, lambda: sum(range(100000000)))
        for _ in range(5)
    ]
    
    # 等待任务完成
    results = await asyncio.gather(*futures)
    print(f"Results: {results}")

asyncio.run(main())

四、实用示例

1. 并行下载文件

我们可以使用多线程或多进程来并行下载多个文件，提高下载速度。

import requests
from concurrent.futures import ThreadPoolExecutor

urls = [
    "https://example.com/file1.txt",
    "https://example.com/file2.txt",
    "https://example.com/file3.txt",
    "https://example.com/file4.txt",
    "https://example.com/file5.txt"
]

def download_file(url):
    print(f"Downloading {url}")
    response = requests.get(url)
    filename = url.split("/")[-1]
    with open(filename, "wb") as f:
        f.write(response.content)
    print(f"Downloaded {filename}")

# 创建线程池
with ThreadPoolExecutor(max_workers=3) as executor:
    # 提交下载任务
    executor.map(download_file, urls)

2. 并行计算

我们可以使用多进程来并行计算密集型任务，提高计算速度。

from concurrent.futures import ProcessPoolExecutor

def calculate(n):
    result = 0
    for i in range(n):
        result += i
    return result

# 创建进程池
with ProcessPoolExecutor(max_workers=4) as executor:
    # 提交计算任务
    results = list(executor.map(calculate, [100000000, 200000000, 300000000, 400000000]))
    print(f"Results: {results}")

3. 生产者-消费者模式

我们可以使用多线程或多进程来实现生产者-消费者模式，处理大量任务。

import queue
import threading
import time

# 创建队列
q = queue.Queue()

# 生产者函数
def producer():
    for i in range(10):
        print(f"Producing {i}")
        q.put(i)
        time.sleep(0.5)

# 消费者函数
def consumer():
    while True:
        try:
            item = q.get(timeout=2)
            print(f"Consuming {item}")
            time.sleep(1)
            q.task_done()
        except queue.Empty:
            break

# 创建生产者线程
producer_thread = threading.Thread(target=producer)

# 创建消费者线程
consumer_threads = [threading.Thread(target=consumer) for _ in range(3)]

# 启动线程
producer_thread.start()
for thread in consumer_threads:
    thread.start()

# 等待生产者完成
producer_thread.join()

# 等待队列清空
q.join()

print("All tasks completed")

五、性能优化

1. 选择合适的并发模型

对于IO密集型任务，使用多线程或异步IO
对于CPU密集型任务，使用多进程

2. 合理设置线程/进程数

对于IO密集型任务，线程数可以设置为CPU核心数的2-4倍
对于CPU密集型任务，进程数可以设置为CPU核心数

3. 避免共享状态

尽量避免使用共享变量
如果必须使用共享变量，使用锁或其他同步机制

六、总结

Python的多线程和多进程是非常强大的特性，它们可以帮助我们充分利用系统资源，提高程序的性能。通过掌握线程池、进程池、异步IO等高级技巧，我们可以更好地利用这些特性，编写高性能的应用程序。

作为一名从Python转向Rust的开发者，我发现Rust的并发模型与Python有很大不同。Rust通过所有权系统和借用检查器来保证线程安全，而Python则通过GIL和锁来保证线程安全。这让我更加相信，Rust是构建高性能、可靠的并发应用程序的理想选择。

希望这篇文章能对你有所帮助，如果你有任何问题或建议，欢迎在评论区留言。

亚马逊云科技技术品牌专区

更多推荐

AI Agent 面试题 734：如何评估Agent的推理准确性和逻辑一致性？

评估指标设计是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在 Agent评估与测试层面实现智能化的行为和决策。在实际应用中，评估指标设计的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，评估指标设计的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan Turing 就提出

亚马逊云科技技术品牌专区

AI Agent 面试题 736：如何设计Agent的效率指标（延迟、Token消耗、步骤数）？

亚马逊云科技技术品牌专区

AI Agent 面试题 730：Agent安全的全生命周期管理和持续改进

对齐技术是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在 Agent安全与对齐层面实现智能化的行为和决策。在实际应用中，对齐技术的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，对齐技术的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan Turing 就提出了关于机器智