Python Playwright自动化测试：从环境搭建到实战技巧全解析

295人浏览 · 2026-06-22 14:55:01

· 2026-06-22 14:55:01 发布

1. 项目概述：为什么选择Playwright？

如果你正在为Web自动化测试选型而头疼，或者厌倦了Selenium的“玄学”稳定性问题，那么今天聊的Playwright，很可能就是你的下一个主力工具。我最初接触它，是因为一个跨浏览器（Chrome、Firefox、Safari）的复杂表单流程测试需求，当时用Selenium写出来的脚本，在Firefox上总有几个元素定位不到，调试起来非常痛苦。后来团队里有人推荐了Playwright，抱着试试看的心态上手后，发现它在稳定性、执行速度和功能丰富度上，确实带来了不少惊喜。

简单来说，Playwright是一个由微软开源的现代化Web自动化测试和浏览器自动化库。它支持多种编程语言，而我们今天聚焦的Python版本，凭借其简洁的API和强大的异步支持，成为了构建可靠自动化测试套件的利器。与Selenium相比，它的核心优势在于其架构：Playwright直接通过DevTools协议与浏览器内核通信，绕过了WebDriver这一中间层，这意味着更少的通信开销、更快的执行速度，以及从根本上减少了因WebDriver与浏览器版本不匹配导致的“诡异”问题。对于需要快速搭建稳定测试环境，并希望脚本能“一次编写，处处运行”的测试工程师和开发者而言，这是一个非常务实的选择。

2. 环境搭建：一步到位的配置指南

搭建环境是万事开头难的第一步，一个干净、隔离的环境能避免后续无数依赖冲突的坑。我强烈推荐使用虚拟环境，这是Python项目管理的基石。

2.1 创建并激活虚拟环境

无论你使用 venv 还是 conda ，核心思想都是为Playwright项目创建一个独立的空间。这里以 venv 为例，因为它轻量且是Python标准库的一部分。

# 在项目目录下创建虚拟环境，命名为 `venv`（名字可自定义）
python -m venv venv

# 激活虚拟环境
# 在 Windows 上：
venv\Scripts\activate
# 在 macOS/Linux 上：
source venv/bin/activate

激活后，你的命令行提示符前通常会显示 (venv) ，这表示你已进入该虚拟环境，后续所有 pip 安装的包都将局限于这个环境内。

注意：很多新手会忘记激活虚拟环境，导致包安装到了全局Python中，造成版本污染。养成“进目录，先激活”的习惯。

2.2 安装Playwright Python包

在激活的虚拟环境中，使用pip进行安装。建议直接安装最新稳定版。

pip install playwright

这个命令会安装Playwright的核心Python库。安装完成后，你还需要安装Playwright所需的浏览器驱动。这是Playwright设计上的一个亮点：它自带经过严格测试的浏览器版本，确保了API行为的绝对一致性。

2.3 安装浏览器二进制文件

Playwright不会使用你系统上已安装的Chrome或Firefox。相反，它会下载自己管理的、版本确定的浏览器。执行以下命令：

playwright install

这个命令会下载Chromium、Firefox和WebKit（Safari的开源核心）的可用版本。下载可能需要一些时间，取决于你的网络。我建议首次安装时保持网络通畅，一次性完成。如果你只需要特定浏览器，可以使用 playwright install chromium 或 playwright install firefox 等命令。

这里有一个关键细节 ： playwright install 下载的浏览器位于用户主目录下的缓存目录中（例如 ~/Library/Caches/ms-playwright on macOS）。这意味着，即使你切换了虚拟环境，只要在同一用户下，这些浏览器二进制文件是可以共享的，避免了重复下载。但每个虚拟环境中的 playwright Python包版本最好与浏览器版本匹配，所以升级Python包后，有时需要重新运行 playwright install 来更新浏览器。

2.4 验证安装

创建一个最简单的脚本来验证一切是否就绪。新建一个文件 test_demo.py ：

import asyncio
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        # 启动Chromium浏览器，headless=False表示显示界面
        browser = await p.chromium.launch(headless=False)
        page = await browser.new_page()
        await page.goto('https://www.example.com')
        print(await page.title()) # 应打印出 "Example Domain"
        await page.screenshot(path='example.png')
        await browser.close()

asyncio.run(main())

运行这个脚本 python test_demo.py 。如果能看到浏览器打开、访问网页、控制台打印标题并截图保存，那么恭喜你，Playwright环境已经成功搭建。

3. 核心概念与API快速上手

Playwright的API设计非常直观，核心对象只有几个： Browser 、 BrowserContext 、 Page 、 Frame 和 Locator 。理解它们的关系，是编写高效脚本的关键。

3.1 浏览器、上下文与页面

你可以把这三者的关系想象成：

Browser ：一个具体的浏览器程序实例，比如你启动了一个Chrome.exe。
BrowserContext ：一个独立的“隐身会话”。每个上下文拥有独立的cookie、本地存储和缓存，互不干扰。这非常有用，比如你可以一个上下文模拟登录用户A，另一个上下文模拟未登录用户B，在同一浏览器实例中并行测试。
Page ：一个标签页。一个上下文可以包含多个页面。

这种层级关系提供了极大的灵活性。通常的启动流程如下：

import asyncio
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        # 1. 启动浏览器
        browser = await p.chromium.launch(headless=True) # 无头模式，适合CI环境
        # 2. 创建一个上下文（可配置视窗、用户代理等）
        context = await browser.new_context(
            viewport={'width': 1920, 'height': 1080},
            user_agent='My Test Agent'
        )
        # 3. 在上下文中打开一个新页面
        page = await context.new_page()
        # ... 在page上进行各种操作
        await context.close()
        await browser.close()

asyncio.run(main())

3.2 元素定位器（Locator）：新一代的定位哲学

这是Playwright相比Selenium最革命性的改进之一。 Locator 代表一个随时查找元素的策略，而不是一个瞬间找到的WebElement对象。这带来了两大好处： 自动等待 和 抗动态DOM变化 。

# 传统Selenium方式（可能因元素未加载而立即抛出异常）
element = driver.find_element(By.ID, 'submit-btn')
element.click()

# Playwright Locator方式
submit_btn = page.locator('#submit-btn')
await submit_btn.click()

在Playwright中， page.locator('#submit-btn') 并没有立即去查找DOM。当你执行 click() 、 fill() 等操作时，Locator会自动执行以下步骤：

根据选择器（如 #submit-btn ）在DOM中查找元素。
如果没找到，会等待一段时间（默认30秒，可配置），期间不断重试查找。
找到后，确保元素是 可见的 、 可交互的 （例如未被遮挡、未禁用）。
然后才执行点击操作。

这几乎消除了在自动化脚本中手动编写 time.sleep 或复杂显式等待的需求，脚本稳定性直线上升。

定位策略推荐 ：

优先使用Role-based定位 ：这是最健壮的方式，模拟真实用户视角。

await page.get_by_role('button', name='Submit').click()
await page.get_by_role('textbox', name='Username').fill('testuser')

使用Text定位 ：对于有明确文本的元素。

await page.get_by_text('Login').click()
await page.get_by_text('Welcome', exact=True).click() # 精确匹配

使用CSS选择器或XPath ：当以上方法不适用时。
```
await page.locator('.primary-btn.submit').click()
await page.locator('//button[contains(@class, "confirm")]').click()
```
实操心得 ：尽量避免使用复杂的XPath，特别是包含索引（如 div[3]/button[2] ）的路径，因为页面结构微调就可能导致失败。CSS选择器通常更简洁、性能更好。

3.3 等待与超时

Playwright内置了智能等待，但理解其机制能让你更好地处理边界情况。

自动等待 ：如上述所述，Locator的每个动作（ click , fill , hover ）都内置了等待。
导航等待 ： page.goto() 和 page.click() （如果会触发导航）会等待页面 load 事件触发。
自定义等待 ：使用 page.wait_for_selector() 、 page.wait_for_function() 等。

# 等待某个元素出现
await page.wait_for_selector('.success-message', state='visible')

# 等待网络请求完成
async with page.expect_response('**/api/user/profile') as response_info:
    await page.click('#fetch-profile')
response = await response_info.value

# 等待超时设置：可以全局设置，也可以单独设置
browser = await p.chromium.launch(timeout=60000) # 全局60秒
await page.click('#slow-btn', timeout=10000) # 该点击操作单独10秒超时

4. 实战技巧：编写健壮的测试脚本

掌握了基础API，我们来探讨如何组织代码，使其更健壮、易维护。

4.1 使用Pytest集成

虽然你可以用纯脚本写测试，但集成测试框架（如pytest）能提供固件（fixture）、参数化、断言和报告等强大功能。Playwright官方提供了 pytest-playwright 插件，让集成变得非常简单。

首先，安装插件：

pip install pytest pytest-playwright

然后，在 conftest.py 或测试文件中使用固件：

# test_login.py
import pytest
from playwright.sync_api import Page, expect

@pytest.fixture(scope='function')
def login_page(page: Page):
    """每个测试函数前，跳转到登录页"""
    page.goto('https://example.com/login')
    yield page

def test_successful_login(login_page: Page):
    """测试成功登录"""
    login_page.get_by_label('Username').fill('valid_user')
    login_page.get_by_label('Password').fill('valid_pass')
    login_page.get_by_role('button', name='Sign In').click()

    # 使用Playwright的expect断言，它也内置了等待
    expect(login_page).to_have_url('https://example.com/dashboard')
    expect(login_page.locator('.welcome-msg')).to_contain_text('Welcome, valid_user')

def test_login_with_invalid_password(login_page: Page):
    """测试密码错误"""
    login_page.get_by_label('Username').fill('valid_user')
    login_page.get_by_label('Password').fill('wrong_pass')
    login_page.get_by_role('button', name='Sign In').click()

    expect(login_page.locator('.error-toast')).to_be_visible()
    expect(login_page.locator('.error-toast')).to_contain_text('Invalid credentials')

使用 pytest 运行测试： pytest test_login.py -v 。 pytest-playwright 插件会自动管理浏览器的启动和关闭。

4.2 页面对象模型（Page Object Model, POM）

这是UI自动化测试中最重要的设计模式，将页面元素和操作封装成类，实现业务逻辑与定位细节的分离。

# pages/login_page.py
from playwright.sync_api import Page

class LoginPage:
    def __init__(self, page: Page):
        self.page = page
        self.username_input = page.get_by_label('Username')
        self.password_input = page.get_by_label('Password')
        self.submit_button = page.get_by_role('button', name='Sign In')
        self.error_message = page.locator('.error-toast')

    def navigate(self):
        self.page.goto('https://example.com/login')

    def login(self, username: str, password: str):
        self.username_input.fill(username)
        self.password_input.fill(password)
        self.submit_button.click()

    def get_error_text(self) -> str:
        return self.error_message.text_content()

# tests/test_login_pom.py
import pytest
from pages.login_page import LoginPage

def test_login_with_pom(page):
    login_page = LoginPage(page)
    login_page.navigate()
    login_page.login('valid_user', 'valid_pass')
    # ... 断言

POM模式让测试用例变得极其清晰，当登录页面的HTML结构发生变化时，你只需要修改 LoginPage 类中的定位器，而不需要修改所有测试用例。

4.3 处理复杂场景

1. 文件上传： Playwright处理文件上传非常优雅，不需要像Selenium那样模拟键盘操作。

# 对于 <input type="file">
await page.locator('input[type="file"]').set_input_files('path/to/my/file.pdf')

# 上传多个文件
await page.locator('input[type="file"]').set_input_files(['file1.pdf', 'file2.jpg'])

# 模拟拖放上传（如果页面是拖放区域）
await page.locator('.drop-zone').dispatch_event('drop', {
    'dataTransfer': {'files': [file] }
})

2. 下拉选择框：

# 通过value选择
await page.locator('select#country').select_option('cn')

# 通过label文本选择
await page.locator('select#country').select_option(label='China')

# 多选
await page.locator('select#skills').select_option(['python', 'javascript'])

3. 模拟键盘与鼠标：

await page.keyboard.type('Hello World!')
await page.keyboard.press('Enter')
await page.keyboard.down('Shift')
# ... 组合键操作

await page.mouse.move(x, y)
await page.mouse.down()
await page.mouse.up()
await page.mouse.click(x, y, button='right') # 右键点击

4. 拦截和修改网络请求： 这在测试中非常强大，可以模拟后端响应或验证API调用。

# 拦截所有请求，并修改某个特定请求
await page.route('**/api/user', lambda route: route.fulfill(
    status=200,
    content_type='application/json',
    body=json.dumps({'name': 'Mock User', 'id': 123})
))

# 继续请求，但可以记录或断言
async def handle_request(route, request):
    print(f'Request: {request.method} {request.url}')
    # 可以在这里对request进行修改，如添加header
    # request.headers['x-test'] = 'foo'
    await route.continue_()
await page.route('**/*', handle_request)

5. 高级配置与调试技巧

5.1 浏览器启动参数配置

通过 launch 或 new_context 可以传递大量配置，以适应不同测试场景。

browser = await p.chromium.launch(
    headless=False, # 显示浏览器窗口，便于调试
    slow_mo=500, # 将每个操作放慢500毫秒，像慢动作，调试神器
    args=['--start-maximized', '--disable-blink-features=AutomationControlled'], # 启动参数
    downloads_path='/path/to/downloads' # 设置下载路径
)

context = await browser.new_context(
    ignore_https_errors=True, # 忽略HTTPS证书错误（用于测试环境）
    java_script_enabled=True, # 是否启用JS，默认为True
    locale='zh-CN', # 设置浏览器语言环境
    timezone_id='Asia/Shanghai', # 设置时区
    geolocation={'longitude': 121.47, 'latitude': 31.23}, # 设置地理位置
    permissions=['notifications'] # 授予通知权限
)

5.2 录制与代码生成

Playwright提供了一个强大的命令行工具 playwright codegen ，用于录制用户操作并生成脚本。这是快速创建测试脚本原型的绝佳方式。

# 启动录制工具，打开浏览器
playwright codegen https://example.com

在弹出的浏览器中操作，右侧窗口会实时生成对应的Python（或其他语言）代码。你可以将这些代码复制到你的项目中作为起点。但请注意，生成的代码通常比较冗长，定位器可能不够优化（例如大量使用XPath），需要你后续进行重构和封装。

5.3 调试与问题排查

1. 启用调试日志： 运行测试时设置环境变量，可以输出详细的通信日志。

# Bash
DEBUG=pw:api pytest test_file.py
# Windows CMD
set DEBUG=pw:api && pytest test_file.py
# Windows PowerShell
$env:DEBUG='pw:api'; pytest test_file.py

2. 利用Trace Viewer： Playwright可以录制测试过程的完整跟踪信息（Trace），包括DOM快照、网络请求、控制台日志等，并以可视化形式回放。这对于调试那些“在我机器上好好的，在CI上就失败”的偶发性问题至关重要。

# 在测试开始时启动追踪
context = await browser.new_context()
await context.tracing.start(screenshots=True, snapshots=True, sources=True)

# ... 执行测试操作 ...

# 测试结束后停止追踪并保存文件
await context.tracing.stop(path='trace.zip')

使用命令 playwright show-trace trace.zip 打开这个zip文件，一个强大的图形化调试器就会出现，你可以逐帧查看测试执行过程。

3. 截图与录屏： 在测试失败时自动截图或录屏，是定位问题的直接手段。

# 页面截图
await page.screenshot(path='screenshot.png', full_page=True) # 截取整个页面

# 元素截图
await page.locator('.header').screenshot(path='header.png')

# 录屏（需要在new_context时开启）
context = await browser.new_context(record_video_dir='videos/')
# 测试结束后，视频会自动保存在指定目录

6. 集成到CI/CD与最佳实践

6.1 在CI环境中运行

在GitHub Actions、GitLab CI、Jenkins等持续集成环境中，通常使用无头模式（ headless=True ）运行。你需要确保CI机器上已安装所有依赖。

一个典型的GitHub Actions工作流步骤可能如下：

- name: Install Playwright Browsers
  run: playwright install --with-deps chromium # 只安装Chromium及其系统依赖
- name: Run Tests
  run: pytest --browser chromium --headless

踩坑记录 ：在Linux CI环境中（如Ubuntu），首次运行 playwright install 可能会失败，因为缺少一些系统库（如libwoff等）。使用 playwright install --with-deps 或 playwright install-deps 命令可以自动安装这些依赖。对于Docker镜像，微软也提供了预装好所有依赖的官方镜像 mcr.microsoft.com/playwright/python 。

6.2 测试数据管理

隔离数据 ：每个测试应该使用独立的数据，避免测试间相互影响。可以通过在测试开始前通过API创建测试用户，测试结束后清理来实现。
使用工厂模式 ：创建辅助函数来生成测试数据，例如 create_test_user(role='admin') 。
预置数据 ：对于复杂的初始状态，考虑使用数据库迁移工具或调用后端设置接口来准备数据。

6.3 测试稳定性提升

选择稳定的定位器 ：优先使用 get_by_role 、 get_by_text 和 data-testid 属性。与开发团队约定，为关键测试元素添加 data-testid 属性（如 data-testid="login-submit" ），这是最稳定的定位方式。
避免硬性等待 ：坚决不用 time.sleep() ，依赖Playwright的内置等待和 expect 断言。
重试机制 ：对于非功能性的偶发失败（如网络波动），可以在测试框架层面配置重试。Pytest可以使用 pytest-rerunfailures 插件。
```
pip install pytest-rerunfailures
pytest --reruns 3 --reruns-delay 1 # 失败后重试3次，每次间隔1秒
```
并行执行 ：利用 pytest-xdist 进行测试并行化，大幅缩短测试套件执行时间。
```
pip install pytest-xdist
pytest -n auto # 自动检测CPU核心数并行
```

6.4 报告生成

结合 pytest-html 和 playwright 的追踪、截图功能，可以生成丰富的测试报告。

pip install pytest-html
pytest --html=report.html --self-contained-html

对于更美观的报告，可以集成Allure Report，它支持附加截图、录屏和Trace文件。

从环境搭建到核心概念，从基础操作到实战技巧与高级调试，我们系统地梳理了使用Playwright for Python进行自动化测试的完整路径。工具本身在不断进化，但构建稳定、可维护的自动化测试套件的核心思想是不变的：理解业务、设计良好的模式、编写健壮的定位器、善用工具提供的调试能力。

亚马逊云科技技术品牌专区

更多推荐

2026年量化工具选择，要跟着能力基础走

读者应理解，选择工具前要先判断自己的能力基础和当前任务。工具应该帮助自己补上当前最关键的缺口，而不是替代学习顺序本身。

亚马逊云科技技术品牌专区

近期零基础学量化，先按基础差异拆学习顺序

读者应明白，拆解学习顺序时要先看自己的基础缺口，再决定哪一段需要放慢。不同流程阶段都有不同检查任务，学习路线要能反映这些差异。

亚马逊云科技技术品牌专区

加州理工 CS367 C 语言系统编程笔记（一）

C语言是一种强大且广泛使用的编程语言，尤其在系统编程领域。本节课我们将学习C语言的基础语法，包括如何编写“Hello, World!”程序、声明变量以及使用基本数据类型。我们将通过实际的代码示例来加深理解。本节课中我们一起学习了C语言的基础语法，包括如何编写和运行一个简单的C程序、声明变量以及使用基本数据类型。我们还介绍了如何使用Shell环境来编译和运行程序。通过对比Java，你可以看到C语言在