Locust性能测试实战：Python协程驱动的高并发压测框架解析

鸳鸯蝴蝶派

321人浏览 · 2026-06-26 10:10:01

鸳鸯蝴蝶派 · 2026-06-26 10:10:01 发布

1. 项目概述：为什么是Locust？

在性能测试这个领域，工具的选择往往决定了效率和结果的可靠性。从业这么多年，从LoadRunner到JMeter，再到各种云原生的压测平台，我都深度使用过。每次新项目启动，团队里总会有人问：“这次我们用哪个工具？” 尤其是在敏捷开发和微服务架构盛行的今天，传统的重量级工具在脚本编写、资源消耗和结果分析上的短板越来越明显。直到我遇到了Locust，一个用Python写的开源性能测试工具，它彻底改变了我对性能测试工作流的看法。

简单来说，Locust是一个分布式的、可编程的性能测试框架。它的核心思想是“用代码定义用户行为”。这听起来可能有点抽象，但它的好处是巨大的：你不再需要在一个笨重的GUI里拖拽元件、配置复杂的参数，而是像写普通的Python脚本一样，用清晰的逻辑来描述你的虚拟用户（我们称之为“蝗虫”）会做什么。比如，一个用户登录、浏览商品、加入购物车、下单，这一系列动作，你可以用几个Python函数就清晰地定义出来。这对于测试RESTful API、WebSocket、gRPC等现代接口协议来说，简直是如鱼得水。

那么，它适合谁呢？如果你是一名Python开发者，或者你的团队技术栈以Python为主，那么Locust几乎是性能测试的不二之选。它无缝集成到你的CI/CD流水线中，测试脚本就是代码，可以享受版本控制、代码审查、自动化执行等所有工程化实践的好处。即使你不是Python专家，只要具备基础的编程知识，也能快速上手，因为它的API设计得非常简洁直观。对于那些厌倦了JMeter的臃肿和LoadRunner的高昂成本，同时又需要强大、灵活压测能力的团队，Locust提供了一个绝佳的平衡点。

2. 核心设计思路与架构拆解

2.1 事件驱动与协程：高性能的基石

Locust的高性能并非偶然，其核心在于巧妙地利用了Python的 gevent 库，这是一个基于协程（coroutine）的网络库。要理解这一点，我们需要先看看传统性能测试工具的瓶颈。

像JMeter这样的工具，通常采用线程（Thread）模型来模拟并发用户。每个虚拟用户对应一个操作系统线程。当你有成千上万个并发用户时，就意味着要创建成千上万个线程。线程的创建、销毁和上下文切换会消耗大量的系统资源（内存和CPU），这就是为什么用JMeter做高并发压测时，压测机本身很容易先成为瓶颈，你需要多台机器做分布式压测来分担压力。

Locust走了另一条路： 单线程+协程 。在Locust的主进程中，一个物理线程（或进程）通过 gevent 可以运行数万甚至数十万个协程。每个协程模拟一个用户的行为。协程的切换发生在用户代码主动让出控制权的时候（比如等待HTTP响应时），这个切换由 gevent 在用户态调度，开销远小于操作系统级的线程切换。这意味着， 单台配置普通的机器，用Locust就能轻松模拟出数万级别的并发用户 ，极大地降低了压测本身的资源门槛。

注意：虽然Locust本身是单线程事件驱动，但它完美支持分布式运行。一个主节点（Master）负责协调和收集数据，多个从节点（Worker）执行实际的压测任务。每个Worker内部依然是单线程+协程模型，这样横向扩展起来非常高效。

2.2 用户行为建模：从“任务”到“场景”

Locust的脚本结构非常清晰，主要围绕两个核心类： HttpUser （或其基类 User ）和 TaskSet 。

HttpUser 类 ：代表一类虚拟用户。你可以把它理解为一个用户群体，比如“普通浏览用户”或“下单用户”。在这个类里，你需要定义两件事：
- wait_time ：用户执行完一个任务后等待多久。这用于控制请求的节奏，模拟真实用户的思考时间。常用的是 between 函数，例如 wait_time = between(1, 5) 表示等待1到5秒之间的一个随机数。
- tasks ：用户要执行的任务列表。这是一个列表，里面可以放 TaskSet 类或者普通的Python函数（会被自动包装成任务）。Locust会按照你定义的权重，从这个列表中随机挑选任务来执行。
TaskSet 类 ：代表一组有逻辑关联的任务序列。比如，“购物流程”这个TaskSet里，可以包含“浏览商品列表”、“查看商品详情”、“加入购物车”等一系列任务。TaskSet可以嵌套，让你能构建出非常复杂的用户行为树。

这种设计的美妙之处在于 极高的灵活性 。你不再受限于固定的“事务控制器”或“循环控制器”。你可以用纯Python的逻辑（ if/else , for 循环，甚至调用外部库）来控制任务的执行顺序和条件，轻松模拟出诸如“用户有30%的概率会进行搜索”、“失败后重试三次”等复杂场景。

2.3 与其他主流工具的对比选型

为什么在很多场景下我会优先选择Locust而不是JMeter或LoadRunner？下表是一个快速的对比分析：

特性维度	Locust	Apache JMeter	LoadRunner
脚本编写	Python代码，灵活，可版本控制，易于调试。	GUI配置或XML，灵活性中等，复杂逻辑实现困难。	专用脚本语言（如C的变种Vuser），学习成本高。
并发模型	协程（gevent），单机并发能力极强，资源消耗低。	线程模型，高并发时压测机资源消耗大。	进程/线程模型，资源消耗大。
分布式支持	原生支持，轻量级，配置简单。	需要额外插件（如JMeter Distributed），配置稍复杂。	企业级支持，功能强大但昂贵。
资源监控	需要自行集成或通过扩展实现，如Prometheus。	提供基础监控（如服务器性能计数器）。	提供强大的资源监控（如服务器、中间件、数据库）。
报告与分析	Web UI实时图表，可导出数据，深度分析需自行处理。	提供多种报告生成器（如HTML、聚合报告）。	提供极其详尽和专业的分析报告。
学习成本	低（对Python开发者），API简洁。	中等，需熟悉GUI组件和概念。	高，需专门培训。
成本	完全免费开源。	完全免费开源。	极其昂贵的商业软件。
最佳适用场景	API测试、微服务测试、敏捷/DevOps环境、需要复杂逻辑和CI/CD集成的测试。	HTTP/Web功能测试、常规负载测试、对GUI操作有依赖的团队。	企业级复杂系统性能验证、需要深度监控和权威报告的场景。

选择Locust的核心理由 ：当你需要快速、灵活地对现代API进行性能测试，并且希望测试脚本能像产品代码一样被工程化管理时，Locust几乎是完美的选择。它把性能测试从“工具操作”变成了“软件开发”，这对于技术团队来说是一个巨大的效率提升。

3. 环境搭建与核心脚本编写实战

3.1 一步到位的环境配置

很多人觉得配置Python环境很麻烦，其实用对工具就很简单。我强烈推荐使用 conda 或 venv 创建独立的虚拟环境，避免包冲突。

# 1. 创建并激活虚拟环境 (以conda为例)
conda create -n locust-demo python=3.9
conda activate locust-demo

# 2. 安装Locust
pip install locust

# 验证安装
locust -V

如果安装速度慢，可以配置国内的镜像源，例如清华源： pip install locust -i https://pypi.tuna.tsinghua.edu.cn/simple 。

实操心得 ：务必固定Locust的版本！在 requirements.txt 中写明 locust==2.15.1 这样的具体版本。性能测试要求结果可复现，Locust不同版本间API和表现可能有细微差别，固定版本是保证测试一致性的第一步。

3.2 你的第一个Locust脚本：模拟API压测

让我们从一个最经典的例子开始：压测一个简单的用户登录和查询信息的API。假设我们有一个待测系统（SUT），它提供了两个接口：

POST /api/login ：登录，需要用户名和密码。
GET /api/user/{id} ：获取用户信息。

我们的目标是模拟一批用户，他们先登录，然后随机查询自己的信息。下面是完整的 locustfile.py （Locust默认寻找这个文件）：

from locust import HttpUser, task, between, TaskSet
import random

class UserBehavior(TaskSet):
    # 在TaskSet启动时执行，用于初始化。这里我们模拟注册一批用户ID。
    def on_start(self):
        # 假设我们预置了100个测试用户，ID从1到100
        self.user_id = random.randint(1, 100)
        self.token = None

    # 定义任务1：用户登录
    # @task装饰器中的数字代表权重，权重越高，被选中的概率越大。
    @task(3) # 权重为3
    def login(self):
        # 定义请求的负载数据
        login_data = {
            "username": f"test_user_{self.user_id}",
            "password": "default_password_123"
        }
        # 使用self.client发起请求，它会自动记录响应时间、成功率等指标
        with self.client.post("/api/login", json=login_data, catch_response=True) as response:
            # catch_response=True 允许我们自定义成功/失败的判断逻辑
            if response.status_code == 200:
                resp_json = response.json()
                if resp_json.get("success"):
                    self.token = resp_json.get("data", {}).get("token")
                    response.success() # 标记此请求为成功
                else:
                    response.failure(f"Login failed: {resp_json.get('message')}")
            else:
                response.failure(f"HTTP {response.status_code}")

    # 定义任务2：查询用户信息（依赖于登录获得的token）
    @task(1) # 权重为1
    def get_user_info(self):
        # 如果尚未登录，则先不执行此任务
        if not self.token:
            return

        headers = {"Authorization": f"Bearer {self.token}"}
        with self.client.get(f"/api/user/{self.user_id}", headers=headers, catch_response=True) as response:
            if response.status_code == 200:
                response.success()
            else:
                response.failure(f"Get user info failed: HTTP {response.status_code}")

# 定义用户类
class ApiUser(HttpUser):
    # 这个用户类将执行UserBehavior这个TaskSet里定义的所有任务
    tasks = [UserBehavior]
    # 用户在每个任务执行后，等待1到3秒
    wait_time = between(1, 3)
    # 你可以在这里定义主机地址，也可以在启动命令中通过 --host 指定
    # host = "http://your-test-server.com"

脚本关键点解析 ：

on_start 方法 ：每个协程（模拟用户）在开始执行 tasks 列表前，都会先运行一次 on_start 。这里是初始化用户状态（如分配ID）的理想位置。
@task 装饰器 ：这是定义用户任务的核心。权重决定了任务被选择的相对频率。上面脚本中， login 任务权重是3， get_user_info 权重是1，意味着平均每执行4次任务，有3次是登录，1次是查询。
self.client ：这是 HttpUser 内置的 HttpSession 实例，它基于 requests 库，但集成了Locust的统计功能。所有发起的请求都会被自动记录。
catch_response=True 与响应验证 ：这是Locust比许多工具强大的地方。默认情况下，HTTP状态码为2xx或3xx即算成功。但实际业务中，接口可能返回200但业务状态是失败的。使用 catch_response=True 可以获取响应对象，根据业务逻辑（如检查JSON中的某个字段）手动调用 response.success() 或 response.failure() ，让测试结果更准确。
状态保持 ：通过 self.token 这样的实例变量，可以在同一个用户模拟会话中保持状态（如登录态），模拟出有状态的连贯操作。

3.3 运行测试与Web UI实时监控

保存好 locustfile.py 后，打开终端，进入脚本所在目录，运行：

locust

默认会启动Web UI在 http://localhost:8089 。打开浏览器，你会看到Locust的启动界面。

填写参数 ：
- Number of users ：要模拟的总用户数（峰值）。
- Spawn rate ：每秒启动多少个用户（控制爬升速度）。
- Host ：被测试系统的根URL，如果脚本里没写 host ，这里必须填。
启动测试 ：点击“Start swarming”，Locust就会开始按照你设定的速率创建虚拟用户并执行任务。
观察仪表盘 ：
- Statistics ：实时显示所有请求的RPS（每秒请求数）、响应时间（平均、中位数、P95、P99）、失败率等。这是最核心的监控面板。
- Charts ：用户数、RPS、响应时间随时间变化的曲线图，非常直观。
- Failures ：列出所有失败的请求及其原因，方便快速定位问题。
- Exceptions ：显示脚本运行中抛出的Python异常。
- Download Data ：可以将测试数据以CSV格式下载下来，用于后续更深入的分析或生成报告。

注意事项 ：Web UI虽然方便，但在长时间压测或分布式压测时，建议使用**无头模式（headless）**运行，并将结果导出。命令如下：
locust --headless --users 100 --spawn-rate 10 --run-time 5m --host=http://your-server.com
参数解释： --headless 无头模式， --users 总用户数， --spawn-rate 孵化率， --run-time 运行时间（如5m代表5分钟）， --host 目标主机。

4. 高级特性与实战技巧

4.1 参数化与测试数据管理

在真实压测中，使用固定的测试数据（如固定的用户名）会导致缓存、数据库锁等问题，无法真实模拟并发。Locust有多种方式实现参数化。

方法一：队列（Queue） 适用于需要循环使用一组数据，且要求数据不重复的场景。

from locust import HttpUser, task, between
from queue import Queue

class TestData:
    data_queue = Queue()
    # 初始化时往队列里填充数据
    for i in range(1000):
        data_queue.put({"username": f"user_{i}", "password": "pass_{i}"})

class ApiUser(HttpUser):
    wait_time = between(1, 2)

    @task
    def login(self):
        # 从队列中获取数据，如果队列为空，则任务结束
        try:
            data = TestData.data_queue.get_nowait()
        except Queue.Empty:
            # 可以在这里停止用户，或者标记测试结束
            self.stop(force=True)
            return

        with self.client.post("/login", json=data, catch_response=True) as resp:
            if resp.status_code == 200:
                resp.success()
                # 重要：如果业务允许，可以把用完的数据再放回队列尾部，实现循环使用
                # TestData.data_queue.put(data)
            else:
                resp.failure("Login failed")

方法二：从外部文件读取 适用于数据量大的场景，如从CSV、JSON文件中读取。

import csv
from itertools import cycle

class TestData:
    # 使用cycle创建一个无限循环的迭代器，数据用尽后会从头开始
    user_data = []
    with open('user_credentials.csv', 'r') as f:
        reader = csv.DictReader(f)
        for row in reader:
            user_data.append(row)
    data_pool = cycle(user_data)

class ApiUser(HttpUser):
    wait_time = between(1, 2)

    @task
    def login(self):
        data = next(TestData.data_pool) # 从迭代器中取下一个
        self.client.post("/login", json=data)

实操心得 ：对于 登录态依赖 的测试，更佳实践是 预生成Token 。在压测开始前，用一个脚本批量调用登录接口，将有效的Token和对应的用户ID写入一个文件或数据库。在Locust的 on_start 中，每个虚拟用户去领取一个未使用的Token。这样可以避免在压测过程中，大量的并发登录请求对认证服务造成不必要的压力，从而更纯粹地测试目标业务接口。

4.2 自定义客户端与测试非HTTP协议

Locust的魔力在于其可扩展性。 HttpUser 只是内置的一种用户类，你可以为任何协议创建自定义的 User 类。

例如，测试WebSocket服务：

from locust import User, task, between, events
import websocket
import json
import time

class WebSocketClient:
    def __init__(self, host):
        # 建立WebSocket连接
        self.ws = websocket.create_connection(f"ws://{host}/ws")
        self.receive_timeout = 5

    def send(self, message):
        start_time = time.time()
        try:
            self.ws.send(json.dumps(message))
            # 假设服务端会立即回显
            result = self.ws.recv()
            total_time = int((time.time() - start_time) * 1000) # 毫秒
            if result:
                events.request.fire(
                    request_type="WS",
                    name="send_message",
                    response_time=total_time,
                    response_length=len(result),
                    exception=None,
                )
            else:
                events.request.fire(
                    request_type="WS",
                    name="send_message",
                    response_time=total_time,
                    response_length=0,
                    exception=None,
                )
        except Exception as e:
            total_time = int((time.time() - start_time) * 1000)
            events.request.fire(
                request_type="WS",
                name="send_message",
                response_time=total_time,
                response_length=0,
                exception=e,
            )

    def close(self):
        self.ws.close()

class WebSocketUser(User):
    abstract = True # 这是一个抽象基类

    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.client = WebSocketClient(self.host)

    def on_stop(self):
        # 用户停止时关闭连接
        self.client.close()

class MyWebSocketUser(WebSocketUser):
    wait_time = between(1, 3)

    @task
    def send_ping(self):
        self.client.send({"action": "ping", "data": "hello"})

通过自定义客户端并触发 events.request 事件，你可以让任何协议的请求都被Locust的统计系统捕获，并在Web UI中展示出来。这对于测试MQTT、gRPC、Socket.IO等协议同样适用。

4.3 分布式压测与资源监控

当单台机器无法模拟足够多的用户，或者你想从不同网络区域发起请求时，就需要分布式压测。

启动主节点（Master） ：

locust --master --master-bind-host=0.0.0.0 --master-bind-port=5557

--master : 指定为主节点。
--master-bind-host/port : 主节点绑定的地址和端口，供Worker连接。

启动从节点（Worker） ：

locust --worker --master-host=192.168.1.100 --master-port=5557

--worker : 指定为工作节点。
--master-host/port : 主节点的地址和端口。

你可以在多台机器上启动多个Worker。所有Worker会从Master获取指令，执行相同的测试脚本，并将数据实时上报给Master汇总。

资源监控集成 ： Locust本身不监控被压测服务器的资源（CPU、内存等），但这可以通过扩展轻松实现。一个常见的做法是使用 locust-plugins 库，它提供了向Prometheus暴露指标的功能，再通过Grafana展示。

pip install locust-plugins

然后在脚本中启用：

from locust_plugins import run_single_user
from locust_plugins.listeners import PrometheusListener
# ... 你的用户类定义 ...

@events.init.add_listener
def on_locust_init(environment, **kwargs):
    PrometheusListener(env=environment, port=9100) # 在9100端口暴露指标

这样，你就可以在Prometheus中收集Locust自身的性能数据（如RPS、用户数、响应时间），再结合Node Exporter收集服务器资源数据，在Grafana中打造一个完整的性能监控看板。

5. 常见问题排查与性能调优实录

性能测试过程中，问题往往不出现在被测系统，而出在测试脚本或测试工具本身。以下是我踩过的一些坑和解决方案。

5.1 Locust压测机自身成为瓶颈

现象：当模拟的用户数增加时，Locust的Web UI变卡，或者Worker的CPU使用率接近100%，但发出去的RPS却上不去。

排查与解决 ：

检查代码效率 ：在 @task 方法中避免进行繁重的计算或同步的I/O操作（如读写大文件、复杂的字符串处理）。这些操作会阻塞协程，严重影响并发能力。将耗时的初始化工作移到 on_start 或脚本模块层。
调整 gevent 配置 ：默认情况下， gevent 可能对DNS解析使用同步查询。在高并发下，这会是瓶颈。在脚本开头设置：
```
from gevent import monkey
monkey.patch_all()
```
确保所有标准库的阻塞调用都被异步化。更进一步的，可以设置使用 dnspython 等异步DNS解析器。
增加Worker数量 ：单机资源有限。如果单个Worker的CPU已满，可以在同一台机器上启动多个Worker进程（绑定到不同端口），共同连接到一个Master。这能更好地利用多核CPU。
使用更快的HTTP客户端 ：Locust默认的 HttpSession 基于 requests 库，它是同步的（虽然被 gevent 猴补丁了）。对于极端性能要求，可以考虑使用 aiohttp 或 httpx 等异步HTTP客户端来自定义客户端，但这会显著增加脚本复杂度。

5.2 测试结果不准确或波动大

现象：多次测试同一场景，得到的平均响应时间或RPS差异很大。

排查与解决 ：

预热与稳态 ：没有给系统预热时间。在测试开始时，应用、数据库可能都有缓存冷启动的问题。解决方案是 增加预热阶段 。可以在Locust脚本中设置一个单独的低并发预热任务，运行1-2分钟后再开始正式测试。或者，在分析结果时，手动忽略前1-2分钟的数据。
垃圾回收（GC）干扰 ：Python的垃圾回收可能导致偶发的停顿。可以通过设置环境变量来调整GC行为，或在分析时忽略那些由GC引起的异常高延迟点（在导出数据后过滤）。
```
export PYTHONGC=2 # 使用更激进的GC策略
```
外部依赖与网络抖动 ：确保压测机和被压测服务器之间的网络稳定、低延迟且高带宽。最好在同一个内网环境中进行。同时，检查被压测系统是否有外部依赖（如第三方API、数据库），这些依赖的波动会直接影响结果。
思考时间（ wait_time ）的影响 ： wait_time 设置得过大，会显著降低施加给服务器的压力（RPS）。计算理论最大RPS的公式是： RPS_max = (用户数 * 每个用户的任务执行频率) 。如果每个任务平均耗时100ms， wait_time 为1秒，那么一个用户每秒最多执行不到1个请求。调整 wait_time 可以控制压力模型。

5.3 分布式压测中的数据不一致或Worker失联

现象：Worker节点突然停止发送请求，或者Master收集到的数据明显少于预期。

排查与解决 ：

防火墙与网络 ：确保所有Worker机器都能访问Master机器的 5557 端口（通信端口）和 8089 端口（Web UI，如果需要访问）。同时，所有机器（Master和Worker）都需要能访问被压测服务器。
时钟同步 ：分布式系统中，各机器时间不同步可能导致日志时间戳混乱。使用NTP服务确保所有机器时间同步。
脚本与依赖一致性 ：确保Master和所有Worker机器上的 locustfile.py 脚本以及Python依赖包（ requirements.txt ） 完全一致 。任何差异都可能导致不可预知的行为。
Master节点资源不足 ：当Worker数量很多（比如上百个）时，Master节点需要处理大量的数据上报，可能成为瓶颈。可以考虑使用更高配置的机器作为Master，或者使用 locust-plugins 中的 TimescaleListener 等插件，将数据直接写入数据库，减轻Master压力。

5.4 性能测试脚本设计的最佳实践

单一职责 ：一个 locustfile.py 最好只测试一个业务场景或一组强相关的接口。不要试图在一个脚本里塞进所有测试用例。这有利于维护和结果分析。
环境隔离 ：使用Python的 os.environ 或配置文件（如 config.ini 、 config.yaml ）来管理不同环境（测试、预生产、生产）的HOST、账号等配置。绝对不要在脚本里写死。
断言与检查点 ：充分利用 catch_response=True 和自定义断言。不仅要检查HTTP状态码，更要检查响应体的业务状态码、关键字段是否存在、数据类型是否正确。一个性能bug往往先表现为业务逻辑错误。
标签化任务 ：使用 @tag 装饰器为任务打标签，可以在启动Locust时选择只运行带有特定标签的任务，方便进行场景组合测试。
```
from locust import tag

class ApiUser(HttpUser):
    @task
    @tag('search')
    def search_api(self):
        ...

    @task
    @tag('order')
    def create_order(self):
        ...
```
运行命令： locust --tags order 只执行标记为 order 的任务。
结果分析与报告 ：不要只盯着Web UI。一定要下载CSV数据，用Pandas、Jupyter Notebook进行深入分析。计算在不同并发下的性能指标变化趋势，绘制趋势图，找出性能拐点和瓶颈。将每次测试的关键指标（如P95响应时间、最大RPS、错误率）记录到一个历史数据库中，便于进行版本间的性能对比和回归。

性能测试不是一个“跑完就完”的任务，而是一个“设计-执行-分析-优化”的循环。Locust给了你一把强大而灵活的瑞士军刀，但如何用好它，精准地发现系统瓶颈，还需要测试人员对系统架构、业务逻辑和数据分析有深入的理解。从我个人的经验来看，将Locust集成到自动化测试流程中，定期对核心链路进行性能回归，是保障系统长期稳定性的非常有效的手段。

亚马逊云科技技术品牌专区

更多推荐

Kiro Editor 开发实战：使用 Cargo 构建、测试与性能优化指南

欢迎来到这篇终极指南，我们将深入探索如何使用Rust构建高性能的终端文本编辑器Kiro Editor。无论你是Rust新手还是经验丰富的开发者，这篇完整教程将带你了解如何利用Cargo工具链进行高效的开发、测试和性能优化，打造一款快速、轻量且功能强大的UTF-8文本编辑器。## 什么是Kiro Editor？Kiro Editor是一款使用Rust编写的极简终端文本编辑器，它最初是著名编辑