Python Locust性能测试实战：从核心概念到分布式压测全解析

NewbeeSmart

293人浏览 · 2026-06-26 16:01:58

NewbeeSmart · 2026-06-26 16:01:58 发布

1. 项目概述：为什么性能测试是测试开发的必修课？

在测试开发这个行当里待久了，你会发现，功能测试只是确保系统“能用”，而性能测试才是验证系统“好用”和“扛用”的关键。很多项目上线前功能跑得飞起，一到用户量上来或者搞个促销活动，系统就卡成PPT，甚至直接宕机，这种场景我见过太多了。问题的根源往往在于，开发阶段只关注了业务逻辑的正确性，却忽略了在高并发、大数据量下的系统承载能力。这就是性能测试的价值所在——它不是锦上添花，而是保障系统稳定性的最后一道，也是至关重要的一道防线。

今天要聊的，就是如何用 Python 生态里一个非常强大的工具 Locust ，来实战性能测试，真正验证你的系统能扛住多少压力。Locust 不同于传统的 JMeter 或 LoadRunner，它完全基于代码定义用户行为，这让它极其灵活，尤其适合我们这些习惯用 Python 搞自动化的测试开发。你可以把它想象成指挥一支“蝗虫大军”，去模拟成千上万的用户同时访问你的系统，然后观察系统在各种压力下的表现。通过这次实战，你不仅能学会 Locust 的基本用法，更能掌握性能测试的核心思路：如何设计场景、如何分析指标、如何定位瓶颈。无论你是想验证一个新接口的吞吐量，还是想为整个电商系统做一次全链路压测，这套方法都能给你提供清晰的路径。

2. 性能测试核心概念与 Locust 优势解析

在动手之前，我们必须把一些核心概念理清楚。性能测试不是简单地用一个工具发请求，它是一套完整的工程方法。

2.1 关键性能指标（KPIs）到底是什么？

我们常说的性能指标，其实是在回答几个关键问题：

吞吐量（Throughput） ：系统在单位时间内能成功处理多少请求。比如每秒处理 1000 个订单（RPS, Requests Per Second）。这是衡量系统处理能力的核心。
响应时间（Response Time） ：从发送请求到接收到完整响应所花费的时间。通常我们关注平均响应时间、P90（90%的请求响应时间小于此值）、P95、P99。P99 尤其重要，它反映了最慢的那1%用户的体验。
并发用户数（Concurrent Users） ：同一时刻向系统发起请求的虚拟用户数量。注意，这和“在线用户数”是两码事，在线用户可能只是在浏览，而并发用户正在执行操作。
错误率（Error Rate） ：失败请求数占总请求数的比例。在压测中，错误率一旦超过阈值（比如0.1%），往往就意味着系统已经出现瓶颈。
资源利用率 ：压测期间，服务器的 CPU、内存、磁盘 I/O、网络带宽的使用情况。这是定位瓶颈的直接依据。

这些指标不是孤立的。比如，随着并发用户数增加，响应时间会变长，吞吐量会先上升后达到瓶颈甚至下降，错误率也会升高。我们的目标就是找到那个最佳的平衡点。

2.2 为什么选择 Locust 而不是 JMeter？

JMeter 很强大，图形化界面友好，但它有个致命问题：对于复杂的、有状态（如需要登录、依赖上下文）的业务流，用 GUI 配置和维护起来非常繁琐，而且难以版本化管理。Locust 的优势恰恰在这里：

代码即脚本 ：所有测试场景都用纯 Python 代码编写。这意味着你可以利用 Python 的所有强大功能：复杂的逻辑判断、数据处理、调用外部库、集成到 CI/CD 流水线。版本控制（Git）管理起来毫无压力。
分布式与可扩展性 ：Locust 天生支持分布式压测，一台机器作为主节点（Master），多台机器作为从节点（Worker），可以轻松模拟数百万级别的并发用户。部署和扩展比 JMeter 更简单。
资源消耗低 ：Locust 采用协程（gevent）机制，一个进程可以模拟数千个并发用户，对压测机本身的资源消耗远小于 JMeter 的线程模型。
实时 Web UI ：虽然基于代码，但它也提供了一个简洁的 Web 界面，可以实时启动/停止测试、查看当前的 RPS、响应时间、错误率等图表，非常直观。

注意：Locust 更适合于对灵活性和可编程性要求高的测试开发团队。如果你只需要做简单的 HTTP API 压测，且团队成员不熟悉代码，JMeter 的图形化或许更快。但对于我们测试开发而言，Locust 无疑是更“趁手”的兵器。

3. Locust 实战环境搭建与第一个脚本

理论说再多不如动手。我们来一步步搭建环境并写出第一个压测脚本。

3.1 环境准备与安装

首先确保你的机器上安装了 Python（3.6 及以上版本）。建议使用虚拟环境来管理依赖，避免污染全局环境。

# 创建并激活虚拟环境（以 venv 为例）
python -m venv locust_env
# Windows
locust_env\Scripts\activate
# Linux/Mac
source locust_env/bin/activate

# 安装 Locust
pip install locust

安装完成后，在命令行输入 locust -V ，如果能显示版本号，说明安装成功。

3.2 编写你的第一个 Locustfile

Locust 的核心就是一个名为 locustfile.py 的 Python 文件。在这个文件里，你需要定义两类对象： 用户类（User） 和 任务集（TaskSet） 。

我们来创建一个最简单的脚本，模拟用户访问一个待测的 API 接口（假设我们有一个查询用户信息的接口 GET /api/user/{id} ）。

# locustfile.py
from locust import HttpUser, task, between

class QuickstartUser(HttpUser):
    """
    定义一个虚拟用户类，继承自 HttpUser。
    这个类代表一类用户的行为模式。
    """
    # between 用于设置用户执行每个任务后等待的随机时间范围（单位：秒）
    # 这里表示等待 1 到 3 秒，模拟用户思考时间
    wait_time = between(1, 3)

    # 用 @task 装饰器标记这是一个任务，权重为 1
    @task(1)
    def get_user_info(self):
        """
        任务：查询用户信息。
        我们假设用户ID从1到1000随机取。
        """
        user_id = self.client.get("/api/user/1")
        # 这里我们写一个简单的断言，检查响应状态码是否为200
        # 在实际项目中，你可能需要检查响应内容或JSON结构
        if user_id.status_code != 200:
            # 标记此请求为失败，并记录失败原因
            user_id.failure(f"Unexpected status code: {user_id.status_code}")

    # 你可以定义多个任务，并通过权重控制执行频率
    # @task(3)  # 权重为3，执行频率是上面任务的3倍
    # def another_api(self):
    #     self.client.get("/api/another")

代码解读与实操要点：

HttpUser ：这是 Locust 为 HTTP 测试提供的用户基类，它内置了一个 client 属性，是一个 HttpSession 实例，用法和 requests 库非常像。
@task ：核心装饰器。括号里的数字是权重，权重越高，这个任务被执行的频率就越高。如果只有一个任务，权重无所谓。
wait_time ：控制用户节奏的关键。 between(1,3) 让虚拟用户在任务间随机等待1-3秒，这比连续疯狂发送请求更贴近真实用户行为，也能避免压测一开始就给系统一个无法承受的瞬时尖峰。
self.client.get/put/post... ：发起 HTTP 请求。Locust 会自动记录这些请求的响应时间、成功与否。
断言与失败标记 ：在性能测试中，我们不仅关心快慢，更关心正确性。通过 response.failure() 方法可以手动标记一个请求为失败，这会在 Locust 的统计中计入错误率。这是定位接口逻辑错误或数据问题的重要手段。

4. 设计并执行一个完整的性能测试场景

一个简单的脚本跑起来不难，但一个 有价值 的性能测试，关键在于场景设计。我们不能只是傻傻地压一个接口，而要模拟真实的用户操作流。

4.1 设计一个真实的用户场景：登录-浏览-下单

假设我们测试一个电商系统的核心链路。一个典型用户的行为可能是：先登录，然后浏览商品列表，查看某个商品详情，最后下单。

# locustfile_complex.py
from locust import HttpUser, task, between, TaskSet
import random

class UserBehavior(TaskSet):
    """
    定义一个任务集，封装一系列相关的任务。
    这里模拟登录后的用户操作。
    """
    # 类变量，用于在任务间传递数据，如登录后的token
    access_token = None

    def on_start(self):
        """
        当虚拟用户开始执行这个TaskSet时，会首先调用on_start方法。
        非常适合在这里执行登录操作。
        """
        self.login()

    def login(self):
        """
        登录任务，获取访问令牌。
        """
        login_data = {
            "username": "test_user",
            "password": "test_pass123"
        }
        with self.client.post("/api/auth/login", json=login_data, catch_response=True) as response:
            if response.status_code == 200:
                resp_json = response.json()
                # 假设返回的token在 `data.token` 字段
                self.access_token = resp_json.get("data", {}).get("token")
                if self.access_token:
                    response.success()
                else:
                    response.failure("Login succeeded but no token found.")
            else:
                response.failure(f"Login failed with status code: {response.status_code}")

    @task(5) # 浏览商品列表频率最高
    def browse_product_list(self):
        """浏览商品列表"""
        headers = {"Authorization": f"Bearer {self.access_token}"} if self.access_token else {}
        # 模拟翻页，随机请求第1-5页
        page = random.randint(1, 5)
        self.client.get(f"/api/products?page={page}&size=20", headers=headers, name="/api/products?page=[page]")
        # 使用 `name` 参数对类似的URL进行分组统计，否则每个不同page的URL会被单独统计，图表会非常乱。

    @task(3)
    def view_product_detail(self):
        """查看商品详情"""
        headers = {"Authorization": f"Bearer {self.access_token}"} if self.access_token else {}
        # 假设商品ID范围是 1000-2000
        product_id = random.randint(1000, 2000)
        self.client.get(f"/api/products/{product_id}", headers=headers, name="/api/products/[id]")

    @task(1) # 下单频率最低
    def create_order(self):
        """创建订单"""
        if not self.access_token:
            self.login() # 如果token丢失，重新登录
            return

        headers = {"Authorization": f"Bearer {self.access_token}"}
        order_data = {
            "productId": random.randint(1000, 2000),
            "quantity": random.randint(1, 3)
        }
        with self.client.post("/api/orders", json=order_data, headers=headers, catch_response=True) as response:
            if response.status_code == 201: # 假设创建成功返回201
                response.success()
            else:
                response.failure(f"Create order failed: {response.status_code}")

class WebsiteUser(HttpUser):
    """
    主用户类，指定任务集和等待时间。
    """
    tasks = [UserBehavior] # 指定使用上面定义的任务集
    wait_time = between(2, 5) # 电商用户操作间隔稍长

场景设计核心要点：

任务集（TaskSet） ：将一系列有逻辑关联的任务（登录、浏览、下单）组织在一起，使代码结构更清晰。
on_start 方法：每个虚拟用户实例在开始执行 TaskSet 内的任务前，都会先执行一次 on_start 。这是执行 前置操作 （如登录、获取初始数据）的黄金位置。
状态保持 ：通过实例变量（如 self.access_token ）在同一个虚拟用户的不同任务间传递状态（如登录态）。这是模拟有状态业务的核心。
参数化与动态数据 ：使用 random 模块生成随机的用户ID、商品ID、页码等，避免所有请求都打向同一个资源，更能模拟真实流量分布，也更容易发现一些边界问题。
请求命名（ name 参数） ：对于带参数的URL（如 /api/products/1001 和 /api/products/1002 ），如果不加 name 参数，Locust 会将其视为两个不同的请求进行统计，导致图表无法阅读。通过 name 将其统一为 /api/products/[id] ，统计信息就聚合了，分析起来一目了然。
权重分配 ：通过 @task(weight) 合理分配任务执行比例。通常，浏览（5）比下单（1）频繁得多，这更符合真实用户行为。

4.2 启动测试与 Web UI 监控

脚本写好了，现在让我们启动它。

# 在脚本所在目录下执行
locust -f locustfile_complex.py

启动后，Locust 会提示你访问 Web 界面，通常是 http://localhost:8089 。打开浏览器，你会看到如下界面：

Number of users ：要模拟的总用户数（峰值）。
Spawn rate ：每秒启动多少个用户（控制压力爬升速度）。
Host ：被测试系统的根地址（如 http://your-api-server.com ）。

执行策略建议（Ramp-up 模式） ：不要一开始就上最大并发数。一个科学的压测应该是阶梯式增加压力，观察系统指标的变化曲线。

第一轮 ：用户数 50，孵化率 5。用 10 秒时间慢慢增加到 50 个用户，持续运行 2-3 分钟。观察系统在低负载下的基线性能。
第二轮 ：用户数 200，孵化率 10。压力逐步增加，持续 5 分钟。观察响应时间和吞吐量的变化趋势。
第三轮 ：用户数 1000，孵化率 20。进行高负载压力测试，持续 5-10 分钟。目标是找到系统的性能拐点（吞吐量不再增长，响应时间急剧上升，错误率开始出现）。

在 Web UI 的 “Charts” 标签页，你可以实时看到 RPS 和响应时间的变化曲线。在 “Statistics” 标签页，可以看到每个接口的详细数据。

5. 分布式压测与高级配置

当单台压测机无法模拟足够多的用户，或者想避免压测机成为瓶颈时，就需要用到分布式压测。

5.1 搭建分布式压测集群

分布式压测需要一个 Master 节点和多个 Worker 节点。Master 负责协调和收集数据，Worker 负责实际产生负载。

步骤：

在 Master 机器上启动 Master 节点：
```
locust -f locustfile.py --master --web-host=0.0.0.0
```
--web-host=0.0.0.0 允许其他机器访问 Web UI。
在每台 Worker 机器上启动 Worker 节点，并指向 Master 的 IP：
```
locust -f locustfile.py --worker --master-host=<MASTER_IP>
```
在 Master 的 Web UI 上，你会看到连接的 Worker 数量。此时，你从 Master UI 启动测试，压力会分发到所有 Worker 上。

实操心得：

网络与防火墙 ：确保 Master 和 Worker 之间网络通畅，且 Master 的 8089（Web端口）和 5557（Worker通信端口）对 Worker 开放。
Worker 资源均等 ：尽量保证 Worker 机器的配置和网络环境相近，避免某个 Worker 成为短板。
数据一致性 ：如果测试脚本中涉及读取外部测试数据文件（如 CSV），需要确保该文件在所有 Worker 机器上的路径一致且内容相同。

5.2 无头模式与自动化集成

对于 CI/CD 流水线，我们不需要 Web UI，而是希望自动化执行并获取结果。Locust 支持 无头（headless）模式 。

locust -f locustfile.py --headless --users 1000 --spawn-rate 100 --run-time 5m --host=http://your-target.com

--headless ：启用无头模式。
--users ：总用户数。
--spawn-rate ：孵化率。
--run-time ：测试运行时间（例如 5m 表示5分钟）。
--csv=prefix ：可以将结果导出为 CSV 文件，便于后续分析。

你可以将此命令写入 Jenkins Pipeline、GitLab CI 或 GitHub Actions 的脚本中，在每次重要版本发布前自动执行性能回归测试。

6. 性能测试结果分析与瓶颈定位

压测跑完了，图表也生成了，但更重要的是 看懂数据，定位问题 。Locust 的 Web UI 提供了基础数据，但深度分析往往需要结合系统监控。

6.1 如何解读 Locust 的统计数据？

响应时间百分比（如 P95） ：比平均响应时间更有价值。如果 P95 响应时间是 2 秒，意味着 95% 的用户体验尚可，但还有 5% 的用户体验很差。你需要重点关注 P99 甚至 P99.9，优化“长尾请求”。
失败率（Fails） ：一旦出现失败，必须立刻关注。点击失败请求，查看具体的失败原因（状态码、超时、连接错误等）。这往往是系统崩溃的前兆。
RPS 曲线 ：随着并发用户数增加，健康的系统 RPS 应该稳步上升后趋于平稳。如果 RPS 到达一个峰值后不再增长甚至下降，而响应时间飙升，说明系统遇到了 硬瓶颈 。

6.2 结合系统监控定位瓶颈

性能瓶颈通常出现在以下几个地方，需要结合服务器监控工具（如 top , vmstat , nmon ，或云平台的监控控制台）来定位：

CPU 瓶颈 ：如果压测期间 CPU 使用率持续高于 80%（尤其是用户态 %us 和系统态 %sy ），可能是应用代码逻辑复杂或计算密集，也可能是线程/进程上下文切换过多。
- 排查：使用 perf 、 py-spy （对于 Python）等工具分析热点函数。
内存瓶颈 ：观察内存使用率和 Swap 交换分区使用情况。如果 Swap 被频繁使用，会导致性能急剧下降（内存颠簸）。
- 排查：检查是否有内存泄漏（压测后内存不释放），或应用本身配置的堆内存是否不足。
磁盘 I/O 瓶颈 ：如果应用涉及大量读写（如日志、文件上传、数据库未命中缓存），观察 iowait 指标和磁盘使用率。
- 排查：考虑使用更快的 SSD，或将日志写入独立磁盘，或优化数据库查询。
网络瓶颈 ：检查网络带宽是否打满，以及连接数是否达到上限（如 netstat 查看 TIME_WAIT 状态连接数）。
- 排查：优化 TCP 内核参数，或考虑增加带宽、使用负载均衡。
外部依赖瓶颈 ：你的应用响应慢，可能是它调用的数据库、缓存（Redis）、第三方 API 慢。
- 排查：在应用代码中打点，记录每个外部调用的耗时。或者直接监控这些中间件的性能指标（如数据库的慢查询日志、Redis 的响应时间）。

一个典型的分析流程：

观察 Locust 图表，发现 /api/orders 接口的 P99 响应时间在并发 500 时突然从 200ms 跳到 2000ms。
登录服务器，使用 top 命令发现 CPU 使用率正常，但 iowait 很高。
使用 iotop 命令发现是 MySQL 进程在大量读写磁盘。
登录 MySQL，执行 SHOW PROCESSLIST; 或查看慢查询日志，发现一条没有用索引的 SELECT ... JOIN 语句在订单创建时被频繁执行。
瓶颈定位 ：数据库查询是性能瓶颈。解决方案：为相关字段添加索引，或优化该 SQL 语句。

7. 常见问题、避坑指南与进阶技巧

在实际操作中，你会遇到各种各样的问题。这里记录一些我踩过的坑和总结的技巧。

7.1 常见问题速查表

问题现象	可能原因	排查与解决思路
Locust 启动报错 `Address already in use`	8089 端口被占用	使用 `locust --web-port=8090` 指定其他端口，或找出占用进程 `lsof -i:8089` 。
Worker 无法连接到 Master	网络不通或防火墙阻止	检查 Master 机器 IP 是否正确，确保 5557 和 8089 端口对 Worker 开放。在 Master 上使用 `nc -zv <MASTER_IP> 5557` 测试。
模拟的用户数远达不到设定值	单台压测机资源（CPU/内存/端口）成为瓶颈	1. 使用分布式压测。2. 检查压测机本身的资源使用率。3. 调整 `ulimit -n` 提高单进程文件描述符限制。
响应时间非常稳定，但 RPS 很低	很可能在脚本中设置了固定的、过长的 `wait_time` 。	检查 `wait_time` 设置。压测目的是施压， `wait_time` 应设置得较短（如 `between(0.1, 0.5)` ），或者使用 `constant` 模式。思考时间测试是另一种场景。
大量 `ConnectionResetError` 或超时错误	1. 被压测服务扛不住了，主动断开连接。2. 压测机本地端口耗尽。	1. 先降低负载，确认是否是服务端问题。2. 压测机上执行 `sysctl -w net.ipv4.ip_local_port_range="1024 65535"` 扩大临时端口范围。
Locust Web UI 图表不更新或卡住	数据量太大，浏览器前端处理不过来。	1. 停止测试，重新开始。2. 在“Statistics”页点击“Download Data”获取CSV进行离线分析。3. 考虑使用更专业的监控系统（如 Grafana+Prometheus）对接。

7.2 进阶技巧与最佳实践

使用事件钩子（Event Hooks） ：Locust 提供了丰富的事件钩子，如 init 、 test_start 、 test_stop 。你可以在测试开始前初始化全局数据（如从文件读取测试账号），在测试结束后清理资源或发送聚合报告。

from locust import events

@events.test_start.add_listener
def on_test_start(environment, **kwargs):
    print("测试开始，初始化数据...")
    # 例如，读取CSV文件到全局队列

@events.test_stop.add_listener
def on_test_stop(environment, **kwargs):
    print("测试结束，生成自定义报告...")

结构化你的测试代码 ：当脚本变得庞大时，不要把所有代码都塞进一个 locustfile.py 。可以分模块：
- locustfile.py ：主入口，定义 HttpUser 。
- tasks/ 目录：存放不同的 TaskSet 类文件，如 auth_tasks.py 、 order_tasks.py 。
- utils/ 目录：存放辅助函数，如数据生成器、加密工具等。
- 通过 import 语句组织起来，使代码清晰易维护。
参数化数据源 ：不要用硬编码的测试数据。可以从 CSV、JSON 文件或数据库中读取数据，并使用队列（ queue.Queue ）确保每个虚拟用户获取的数据不重复。
模拟更复杂的协议 ：Locust 不仅支持 HTTP/S，通过安装第三方库或自定义客户端，可以测试 WebSocket、gRPC、TCP 自定义协议等。这需要你继承 User 类并实现自己的 client 。
设定合理的断言与停止条件 ：除了在任务中用 catch_response 做断言，还可以通过 --stop-timeout 参数或 self.environment.runner.quit() 在代码中根据错误率阈值自动停止测试，防止压垮服务。

性能测试是一个“测-调-测”的循环过程。Locust 给了我们一把锋利且灵活的尺子，去度量系统的能力边界。但更重要的是测试背后的分析思维和工程实践。记住，压测的最终目的不是得到一个漂亮的数字，而是发现系统的薄弱点，推动其变得更强健。每次压测报告，都应该带着明确的结论和改进建议，这才是测试开发工程师价值的体现。

亚马逊云科技技术品牌专区

更多推荐

Kiro Editor 开发实战：使用 Cargo 构建、测试与性能优化指南

欢迎来到这篇终极指南，我们将深入探索如何使用Rust构建高性能的终端文本编辑器Kiro Editor。无论你是Rust新手还是经验丰富的开发者，这篇完整教程将带你了解如何利用Cargo工具链进行高效的开发、测试和性能优化，打造一款快速、轻量且功能强大的UTF-8文本编辑器。## 什么是Kiro Editor？Kiro Editor是一款使用Rust编写的极简终端文本编辑器，它最初是著名编辑