Selenium与Python实战：构建稳定可维护的UI自动化测试框架

天才娜娜ln

338人浏览 · 2026-06-28 12:26:32

天才娜娜ln · 2026-06-28 12:26:32 发布

1. 项目概述：为什么UI自动化测试是每个测试工程师的必修课？

如果你是一名测试工程师，或者正在向这个方向发展，那么“UI自动化测试”这个词你一定不陌生。它听起来很高大上，似乎充满了复杂的框架和难以理解的脚本。但今天，我想和你分享的，是如何用最接地气的方式，使用 Selenium 和 Python 这套黄金组合，真正把UI自动化测试做起来，让它不再是简历上的一句空话，而是你日常工作中实实在在能提效、能保质的利器。我见过太多团队，自动化测试项目轰轰烈烈地启动，最后却因为维护成本高、脚本脆弱、无人会用而不了了之。究其原因，往往是从一开始就走错了路，把自动化想得太复杂，或者太轻视。这个教程的目的，就是带你避开那些坑，从零开始，构建一套稳定、可维护、且真正有用的UI自动化测试体系。

Selenium之所以能成为Web UI自动化测试领域事实上的标准，不是没有道理的。它开源、免费，支持几乎所有主流浏览器，并且拥有一个庞大而活跃的社区。而Python，以其简洁优雅的语法和丰富的生态库，成为了自动化测试脚本开发的绝佳语言。两者结合，让编写自动化测试用例变得像写一段清晰的业务逻辑描述一样自然。这个教程将围绕“实用”二字展开，我不会过多纠缠于深奥的底层原理，而是聚焦于“如何做”以及“为什么这么做”，分享我这些年从零搭建、维护大型自动化测试项目过程中积累的一手经验和教训。无论你是刚入门的新手，还是想优化现有框架的老手，相信都能从中找到对你有价值的内容。

2. 环境搭建与核心工具链选型

工欲善其事，必先利其器。一个稳定、高效的开发环境是自动化项目成功的基石。这一部分，我们将一步步搭建起属于你的自动化测试工作台。

2.1 Python环境安装与配置：告别版本混乱

很多新手卡在第一步：Python环境安装。网络上教程五花八门，装错了版本或者搞乱了环境，后续问题层出不穷。我的建议是，在Windows系统上，直接使用官方安装包，但务必勾选“Add Python to PATH”这个选项，这能省去后续手动配置环境变量的麻烦。对于macOS和Linux用户，虽然系统可能自带Python，但我强烈建议使用 pyenv 这类工具来管理多个Python版本，避免影响系统自带的Python环境。

安装完成后，打开你的命令行（Windows上是CMD或PowerShell，macOS/Linux上是Terminal），输入 python --version 来验证安装。这里有一个关键点：随着Python 2在2020年正式停止支持，我们所有的项目都应该基于 Python 3.7及以上版本 。我目前主力使用的是Python 3.9或3.10，它们在稳定性和新特性支持上取得了很好的平衡。

接下来是包管理工具 pip 的配置。由于网络原因，直接使用官方源安装包速度可能很慢。一个实用的技巧是配置国内镜像源。你可以通过以下命令一次性配置清华源（以Windows为例，在用户目录下创建 pip 文件夹和 pip.ini 文件）：

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn

配置好后，后续安装任何Python包，速度都会快上不少。

注意：绝对不要使用任何非法的网络访问工具来“加速”你的开发环境配置。使用正规的国内镜像源是完全合法、安全且高效的解决方案，这应该成为你的标准操作。

2.2 集成开发环境（IDE）的选择：VSCode vs. PyCharm

写Python代码，一个好用的IDE能极大提升效率。主流选择有两个： Visual Studio Code (VSCode) 和 PyCharm 。

VSCode ：轻量、免费、插件生态极其丰富。通过安装Python、Pylance、Test Explorer等插件，你可以获得不输于专业IDE的代码补全、调试和测试管理功能。它的配置稍微需要花点时间，但一旦配置好，非常灵活。适合喜欢折腾、追求轻快启动速度的开发者。
PyCharm (Community Edition) ：JetBrains出品，专为Python开发而生。开源的社区版功能已经非常强大，开箱即用，对Python的支持（如代码分析、重构、调试）是顶级的。它更“重”一些，但能帮你处理好很多项目结构、依赖管理的事情，适合新手和追求“一站式”体验的团队。

我个人在早期更喜欢PyCharm的“无脑”高效，现在则更偏爱VSCode的轻便与定制化。对于自动化测试项目，两者皆可。如果你是零基础，我建议从PyCharm社区版开始，减少环境配置的挫败感。

2.3 Selenium与浏览器驱动的安装

这是核心环节。Selenium本身是一个控制浏览器的库，它需要通过一个名为“WebDriver”的桥梁来与具体的浏览器对话。

第一步：安装Selenium库。 在配置好pip镜像源后，安装非常简单。在你的项目目录下打开终端，运行：

pip install selenium

这条命令会安装最新稳定版的Selenium。

第二步：下载并配置浏览器驱动。 这是最容易出错的一步。你必须确保驱动的版本与你的 浏览器版本 完全匹配。

Chrome/Edge（Chromium内核） ：驱动叫 ChromeDriver 。去 ChromeDriver官网或国内镜像站下载。最稳妥的方法是，先打开你的Chrome浏览器，在地址栏输入 chrome://version/ ，查看第一行的“Google Chrome”版本号，然后下载对应版本的驱动。
Firefox ：驱动叫 geckodriver 。去 Mozilla的GitHub发布页下载。

下载后，你需要让Selenium能找到这个驱动。有三种常见方法：

放入系统PATH ：将下载的驱动文件（如 chromedriver.exe ）放在系统环境变量PATH包含的任意目录下，比如Python的安装目录（ C:\Python39\Scripts\ ）或 C:\Windows\ 。
指定路径 ：在代码中初始化浏览器时，通过 executable_path 参数指定驱动的绝对路径。
使用第三方工具管理 ：安装 webdriver-manager 库（ pip install webdriver-manager ），它可以在运行时自动下载和匹配正确版本的驱动，非常省心，强烈推荐。

一个使用 webdriver-manager 的示例代码片段：

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

# 自动管理ChromeDriver
service = Service(ChromeDriverManager().install())
driver = webdriver.Chrome(service=service)
driver.get("https://www.baidu.com")

2.4 构建你的第一个自动化脚本：验证环境

让我们写一个最简单的脚本来验证一切是否就绪。创建一个名为 first_test.py 的文件，输入以下内容：

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

# 初始化浏览器驱动，这里假设已将chromedriver放入PATH
driver = webdriver.Chrome()

try:
    # 打开百度首页
    driver.get("https://www.baidu.com")
    # 等待页面加载一下
    time.sleep(2)
    # 找到搜索输入框，输入“Selenium”
    search_box = driver.find_element(By.ID, 'kw')
    search_box.send_keys('Selenium')
    # 找到“百度一下”按钮并点击
    search_button = driver.find_element(By.ID, 'su')
    search_button.click()
    # 等待结果加载
    time.sleep(3)
    # 在控制台打印当前页面标题
    print("当前页面标题是：", driver.title)
finally:
    # 等待几秒后关闭浏览器
    time.sleep(5)
    driver.quit()

运行这个脚本（在终端进入文件所在目录，执行 python first_test.py ），你应该能看到一个Chrome浏览器自动打开，完成搜索操作，然后在控制台打印出标题，最后关闭。如果成功，恭喜你，你的Selenium+Python环境已经搭建成功！

3. Selenium核心API与最佳实践详解

环境搭好了，我们来深入Selenium的核心。很多人学Selenium只学 find_element 和 click ，写出来的脚本脆弱不堪。要写出健壮的自动化脚本，必须理解并善用以下几组核心API和设计理念。

3.1 元素定位：八种武器与优先级策略

定位页面元素是自动化操作的基础。Selenium提供了8种主要的定位方式（通过 By 类调用）：

ID ( By.ID ): 最优先选择。通常唯一且稳定。
Name ( By.NAME ): 次优先。常用于表单元素。
XPath ( By.XPATH ): 功能最强大，可以定位任何元素，但可能随页面结构变化而失效。 慎用绝对路径 （以 / 开头），多用相对路径和属性组合。
CSS Selector ( By.CSS_SELECTOR ): 性能通常优于XPath，语法简洁，是前端开发熟悉的方式。
Class Name ( By.CLASS_NAME ): 定位拥有特定CSS类的元素。注意类名可能有多个，用空格分隔。
Tag Name ( By.TAG_NAME ): 按标签名定位，如 input , div 。
Link Text ( By.LINK_TEXT ): 精确匹配超链接的文本。
Partial Link Text ( By.PARTIAL_LINK_TEXT ): 匹配超链接文本的一部分。

定位策略优先级（我的经验之谈） ：

ID > Name > CSS Selector > XPath > 其他

为什么？ID和Name通常由后端开发或框架生成，相对稳定。CSS Selector在性能和可读性上平衡得很好。XPath虽然强大，但一旦前端DOM结构有细微调整（比如多嵌套了一层 div ），基于路径的XPath就容易失效。一个编写良好的CSS Selector往往更抗变化，例如 #login-form .btn-submit 就比 //*[@id=\"login-form\"]/div[3]/button 要稳健得多。

实操心得 ：多利用浏览器的开发者工具（F12）。在Elements面板，右键点击元素，选择“Copy” -> “Copy selector” 或 “Copy XPath”，可以快速获取定位表达式，但 一定要审查和优化 自动生成的表达式，它们往往又长又脆弱。

3.2 等待机制：告别“NoSuchElementException”的噩梦

脚本运行时，页面元素加载需要时间。直接操作而元素还未出现，就会抛出 NoSuchElementException 。这是UI自动化中最常见的问题之一。Selenium提供了三种等待方式：

强制等待 ( time.sleep )：傻瓜式等待，指定固定秒数。 不推荐在正式脚本中使用 ，因为它会无条件等待，浪费执行时间，且无法适应网络或性能波动。
隐式等待 ( driver.implicitly_wait )：为整个WebDriver实例设置一个全局等待时间。在查找任何元素时，如果没立即找到，WebDriver会轮询DOM直到超时。它是一把“双刃剑”，设置后对所有 find_element 操作生效，可能会掩盖一些真正的页面加载问题，并且不适用于等待元素的特定状态（如可点击、可见）。
显式等待 ( WebDriverWait + expected_conditions )： 这是最佳实践，必须掌握 。它允许你为某个特定条件设置等待，条件满足则立即继续，超时则抛出异常。它更智能，更节省时间。

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

# 设置一个最长等待10秒的WebDriverWait对象
wait = WebDriverWait(driver, 10)

# 等待直到ID为‘submit-button’的元素可被点击
submit_btn = wait.until(EC.element_to_be_clickable((By.ID, 'submit-button')))
submit_btn.click()

# 等待直到ID为‘result’的元素内部出现特定文本
wait.until(EC.text_to_be_present_in_element((By.ID, 'result'), '操作成功'))

核心技巧 ：在你的自动化框架中，应将所有的元素查找操作（特别是点击、输入前）封装在显式等待中。可以自定义一个 find 方法来替代原生的 find_element ，内部集成显式等待，这样能极大提升脚本的稳定性。

3.3 页面操作模拟：不仅仅是点击和输入

掌握了定位和等待，我们就可以模拟用户行为了。

点击与输入 ： click() , send_keys() 是最基本的。
清除内容 ：在输入前，有时需要 clear() 输入框。
提交表单 ：对于 form 元素，可以 submit() 。
获取元素信息 ： text 属性获取可见文本， get_attribute(‘attrName’) 获取任意属性值（如 href , value ）， is_displayed() , is_enabled() , is_selected() 判断元素状态。

鼠标与键盘高级操作 ：需要导入 ActionChains 和 Keys 类。

from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys

# 鼠标悬停
element = driver.find_element(By.ID, ‘menu’)
ActionChains(driver).move_to_element(element).perform()

# 双击、右击、拖拽
ActionChains(driver).double_click(element).perform()
ActionChains(driver).context_click(element).perform()

# 键盘操作，如全选（Ctrl+A）
search_box.send_keys(Keys.CONTROL, ‘a’)

处理弹窗/Alert ：

# 切换到alert并接受（确定）或解散（取消）
alert = driver.switch_to.alert
print(alert.text) # 获取提示文本
alert.accept() # 点击确定
# alert.dismiss() # 点击取消

切换窗口/iframe ：

# 切换到新窗口
original_window = driver.current_window_handle
for window_handle in driver.window_handles:
    if window_handle != original_window:
        driver.switch_to.window(window_handle)
        break

# 切换回原窗口
driver.switch_to.window(original_window)

# 切换到iframe
driver.switch_to.frame(‘iframe_name_or_id’)
# 操作iframe内元素...
driver.switch_to.default_content() # 切回主文档

4. 构建可维护的自动化测试框架

当你的测试用例超过十几个，你就会发现，如果还把所有代码堆在一个个脚本文件里，维护将是一场灾难。我们需要一个框架来组织代码、数据和用例。这里我介绍一个简单但足够实用的 Page Object Model (POM，页面对象模型) 框架结构。

4.1 页面对象模型（POM）设计模式

POM的核心思想是将页面抽象成一个类，将页面上的元素定义为类的属性，将页面上的操作定义为类的方法。测试用例则通过调用这些页面对象的方法来完成，而不直接操作WebDriver API。

这样做的好处巨大 ：

高复用性 ：页面元素定位和基础操作逻辑只写一次，多处调用。
低维护成本 ：当页面UI发生变化时，通常只需要修改对应的页面对象类，所有测试用例无需改动。
高可读性 ：测试用例读起来就像业务描述，例如 login_page.login(“username”, “password”) 。

4.2 项目目录结构实战

一个典型的POM项目目录可能如下所示：

your_automation_project/
├── config/
│   ├── __init__.py
│   └── settings.py        # 存放配置常量，如URL、超时时间、浏览器类型
├── pages/
│   ├── __init__.py
│   ├── base_page.py       # 所有页面对象的基类，封装公共方法
│   ├── login_page.py      # 登录页面对象
│   └── home_page.py       # 首页页面对象
├── tests/
│   ├── __init__.py
│   ├── conftest.py        # Pytest的配置文件，定义fixture
│   └── test_login.py      # 具体的测试用例
├── utils/
│   ├── __init__.py
│   └── driver_manager.py  # 浏览器驱动的单例管理
├── reports/               # 存放测试报告
├── logs/                  # 存放日志
├── requirements.txt       # 项目依赖包列表
└── run_tests.py          # 测试执行入口脚本

4.3 核心模块代码拆解

1. 基础页面类 ( base_page.py ) ：这个类是所有页面对象的父类，封装了最通用的方法，比如初始化、元素查找（集成显式等待）、截图等。

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

class BasePage:
    def __init__(self, driver):
        self.driver = driver
        self.wait = WebDriverWait(driver, 10) # 全局显式等待

    def find_element(self, by, locator):
        """查找单个元素，集成显式等待"""
        return self.wait.until(EC.presence_of_element_located((by, locator)))

    def find_elements(self, by, locator):
        """查找多个元素"""
        return self.wait.until(EC.presence_of_all_elements_located((by, locator)))

    def click(self, by, locator):
        """点击元素，等待其可点击"""
        element = self.wait.until(EC.element_to_be_clickable((by, locator)))
        element.click()

    def input_text(self, by, locator, text):
        """向元素输入文本，先清空"""
        element = self.find_element(by, locator)
        element.clear()
        element.send_keys(text)

    def get_title(self):
        """获取页面标题"""
        return self.driver.title

2. 具体页面类 ( login_page.py ) ：继承 BasePage ，定义特定页面的元素和操作。

from selenium.webdriver.common.by import By
from .base_page import BasePage

class LoginPage(BasePage):
    # 元素定位器
    USERNAME_INPUT = (By.ID, ‘username’)
    PASSWORD_INPUT = (By.ID, ‘password’)
    LOGIN_BUTTON = (By.ID, ‘login-btn’)
    ERROR_MSG = (By.CLASS_NAME, ‘error-message’)

    def __init__(self, driver):
        super().__init__(driver)
        self.driver = driver

    def login(self, username, password):
        """登录操作"""
        self.input_text(*self.USERNAME_INPUT, username) # 解包元组
        self.input_text(*self.PASSWORD_INPUT, password)
        self.click(*self.LOGIN_BUTTON)

    def get_error_message(self):
        """获取错误提示信息"""
        try:
            return self.find_element(*self.ERROR_MSG).text
        except:
            return None

3. 测试用例 ( test_login.py ) ：使用 pytest 框架编写，清晰简洁。

import pytest
from pages.login_page import LoginPage
from config.settings import BASE_URL

class TestLogin:
    @pytest.fixture(autouse=True)
    def setup(self, driver): # driver是一个在conftest.py中定义的fixture
        self.driver = driver
        self.login_page = LoginPage(driver)
        self.driver.get(BASE_URL + “/login”)
        yield
        # 每个测试方法后的清理工作，例如清除cookies
        self.driver.delete_all_cookies()

    def test_login_success(self):
        """测试正常登录"""
        self.login_page.login(“valid_user”, “valid_pass”)
        # 断言登录后跳转到了首页，或出现了登录成功的元素
        assert “dashboard” in self.driver.current_url
        # 或者使用页面对象断言
        # home_page = HomePage(self.driver)
        # assert home_page.is_welcome_message_displayed()

    def test_login_failure_with_wrong_password(self):
        """测试密码错误"""
        self.login_page.login(“valid_user”, “wrong_pass”)
        error_msg = self.login_page.get_error_message()
        assert error_msg is not None
        assert “密码错误” in error_msg

4. 驱动管理 ( driver_manager.py ) ：使用单例模式确保整个测试过程中只有一个driver实例，并妥善处理资源的创建和销毁。

from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service

class DriverManager:
    _instance = None

    def __new__(cls):
        if cls._instance is None:
            cls._instance = super(DriverManager, cls).__new__(cls)
            cls._instance._init_driver()
        return cls._instance

    def _init_driver(self):
        # 这里可以扩展为根据配置选择不同浏览器
        service = Service(ChromeDriverManager().install())
        options = webdriver.ChromeOptions()
        # 添加常用选项，如无头模式、忽略证书错误等
        # options.add_argument(‘--headless’) # 无头模式，不打开浏览器窗口
        options.add_argument(‘--ignore-certificate-errors’)
        options.add_argument(‘--disable-gpu’)
        options.add_argument(‘--no-sandbox’)
        options.add_argument(‘--disable-dev-shm-usage’)
        self.driver = webdriver.Chrome(service=service, options=options)
        self.driver.implicitly_wait(5) # 设置一个全局隐式等待作为兜底

    def get_driver(self):
        return self.driver

    def quit_driver(self):
        if self.driver:
            self.driver.quit()
            self._instance = None

5. Pytest配置 ( conftest.py ) ：定义全局的fixture，供所有测试用例使用。

import pytest
from utils.driver_manager import DriverManager

@pytest.fixture(scope=“session”) # 整个测试会话只执行一次
def driver():
    dm = DriverManager()
    driver_instance = dm.get_driver()
    yield driver_instance
    dm.quit_driver()

@pytest.fixture(scope=“function”) # 每个测试函数执行一次
def clean_driver(driver):
    yield driver
    # 每个测试后清理浏览器状态，保持用例独立
    driver.delete_all_cookies()
    driver.execute_script(“window.localStorage.clear();”)
    driver.execute_script(“window.sessionStorage.clear();”)

4.4 测试数据管理

不要将测试数据硬编码在测试用例中。推荐使用外部文件管理，如 JSON 、 YAML 或 Excel 。对于简单数据， JSON 是个好选择。创建一个 test_data/login_data.json ：

{
  “valid_credentials”: {
    “username”: “standard_user”,
    “password”: “secret_sauce”
  },
  “invalid_credentials”: [
    {“username”: “locked_out_user”, “password”: “secret_sauce”, “expected_error”: “此用户已被锁定”},
    {“username”: “”, “password”: “secret_sauce”, “expected_error”: “用户名不能为空”}
  ]
}

在测试用例中读取并使用：

import json
import pytest

def load_login_data():
    with open(‘test_data/login_data.json’, ‘r’, encoding=‘utf-8’) as f:
        return json.load(f)

class TestLoginDataDriven:
    @pytest.mark.parametrize(“data”, load_login_data()[“invalid_credentials”])
    def test_login_with_data(self, driver, data):
        login_page = LoginPage(driver)
        driver.get(BASE_URL + “/login”)
        login_page.login(data[“username”], data[“password”])
        assert data[“expected_error”] in login_page.get_error_message()

5. 高级技巧、问题排查与持续集成

掌握了基础框架，我们来看看如何让自动化测试更强大、更智能，以及如何融入开发流程。

5.1 处理复杂场景与反爬机制

现代Web应用充满了动态内容、iframe、弹窗和反爬措施。

处理动态加载/无限滚动 ：需要结合显式等待和JavaScript执行。

# 模拟滚动到底部
driver.execute_script(“window.scrollTo(0, document.body.scrollHeight);”)
# 等待新内容加载
wait.until(EC.presence_of_element_located((By.CLASS_NAME, “new-item”)))

处理Canvas/滑块验证 ：这是难点。纯Selenium无法直接操作Canvas像素。通常需要分析其背后的逻辑：
1. 简单滑块 ：计算滑块轨道长度和滑块大小，用 ActionChains 模拟拖拽。
2. 复杂图形验证 ：可能需要借助图像识别库（如 pytesseract 进行OCR， opencv 进行图像匹配），但这会大大增加复杂度和维护成本。 在实际工作中，通常建议与开发团队协商，在测试环境关闭此类验证，或提供后门接口。

应对“被网站识别为自动化工具” ：一些网站会检测 navigator.webdriver 属性。可以通过 ChromeOptions 添加参数来尝试隐藏特征：

options = webdriver.ChromeOptions()
options.add_experimental_option(“excludeSwitches”, [“enable-automation”])
options.add_experimental_option(‘useAutomationExtension’, False)
# 更彻底的隐藏（可能随浏览器版本失效）
driver.execute_cdp_cmd(‘Page.addScriptToEvaluateOnNewDocument’, {
    ‘source’: ‘Object.defineProperty(navigator, “webdriver”, {get: () => undefined})‘
})

重要提示 ：这些方法主要用于应对测试环境的反爬，用于生产环境数据抓取可能违反网站服务条款。自动化测试的首要目标应是功能验证，而非绕过安全措施。

5.2 测试报告与日志记录

没有报告和日志的自动化是没有灵魂的。 pytest 本身可以生成简单的文本报告，但更推荐使用 pytest-html 或 Allure 生成美观的HTML报告。

安装与使用pytest-html ：

pip install pytest-html
pytest tests/ --html=reports/report.html --self-contained-html

日志记录 ：使用Python内置的 logging 模块，在框架的关键节点（如启动浏览器、执行操作、断言失败）记录信息，便于调试。

import logging
logging.basicConfig(level=logging.INFO,
                    format=‘%(asctime)s - %(name)s - %(levelname)s - %(message)s’,
                    handlers=[logging.FileHandler(“automation.log”), logging.StreamHandler()])
logger = logging.getLogger(__name__)

logger.info(“开始执行登录测试...”)
try:
    login_page.login(“user”, “pass”)
    logger.info(“登录操作执行完毕”)
except Exception as e:
    logger.error(f“登录过程中发生异常：{e}”)
    driver.save_screenshot(“error_screenshot.png”) # 出错时截图
    raise

5.3 常见问题排查手册（QA速查表）

以下是我在多年实践中总结的一些典型问题及解决方案：

问题现象	可能原因	排查步骤与解决方案
`NoSuchElementException`	1. 元素定位器错误/过期。 2. 页面未加载完成。 3. 元素在iframe或shadow DOM内。 4. 页面有弹窗遮挡。	1. 用浏览器开发者工具重新检查定位器。 2. 添加显式等待（ `presence_of_element_located` 或 `visibility_of_element_located` ）。 3. 使用 `driver.switch_to.frame()` 或 `driver.execute_script` 进入iframe/shadow root。 4. 先处理弹窗。
`ElementNotInteractableException`	1. 元素不可见或被覆盖。 2. 元素未启用（disabled）。 3. 等待状态错误（用了presence等待，但元素不可交互）。	1. 滚动元素到视口（ `element.location_once_scrolled_into_view` ）。 2. 检查元素 `disabled` 属性。 3. 使用 `element_to_be_clickable` 进行等待。
脚本在本地运行成功，在CI服务器失败	1. CI服务器无图形界面（headless）。 2. 浏览器/驱动版本不匹配。 3. 环境依赖缺失。 4. 网络或资源加载超时。	1. 为无头模式添加相应Options参数（ `--headless` , `--disable-gpu` 等）。 2. 使用 `webdriver-manager` 确保版本匹配。 3. 在CI配置中安装所有依赖（如字体）。 4. 增加全局等待时间，优化网络环境。
执行速度慢	1. 过多 `time.sleep` 。 2. 隐式等待时间设置过长。 3. 网络或应用本身慢。	1. 用显式等待替代所有固定等待。 2. 合理设置隐式等待时间（如3-5秒）。 3. 分析网络请求，考虑禁用图片加载（ `options.add_argument(‘blink-settings=imagesEnabled=false’)` ）以加速。
浏览器被检测为自动化工具	网站JS检测了 `navigator.webdriver` 等属性。	1. 添加 `excludeSwitches` 和 `useAutomationExtension` 选项。 2. 通过CDP命令覆盖属性（见5.1节）。 3. 终极方案：与开发沟通，在测试环境禁用检测。

5.4 迈向持续集成（CI）

自动化测试只有集成到CI/CD流水线中，才能最大化其价值。主流CI工具如 Jenkins , GitLab CI , GitHub Actions 都支持运行Python脚本。

一个简单的 GitHub Actions 工作流示例 ( .github/workflows/run-tests.yml )：

name: UI Automation Tests

on: [push, pull_request]

jobs:
  test:
    runs-on: ubuntu-latest
    steps:
    - uses: actions/checkout@v3
    - name: Set up Python
      uses: actions/setup-python@v4
      with:
        python-version: ‘3.10’
    - name: Install dependencies
      run: |
        pip install -r requirements.txt
    - name: Install Chrome and ChromeDriver
      run: |
        sudo apt-get update
        sudo apt-get install -y google-chrome-stable
        pip install webdriver-manager
    - name: Run tests with pytest
      run: |
        python -m pytest tests/ -v --html=reports/report.html --self-contained-html
    - name: Upload test report
      uses: actions/upload-artifact@v3
      if: always()
      with:
        name: html-report
        path: reports/

这个工作流会在每次代码推送或拉取请求时，自动在一个干净的Ubuntu环境中安装依赖、浏览器，运行测试，并将HTML报告保存为制品，供你下载查看。

6. 从入门到精进：学习路径与资源推荐

UI自动化测试是一个需要持续学习和实践的领域。最后，我想分享一些我认为非常宝贵的学习资源和进阶方向。

官方文档永远是第一手资料 ：

Selenium Python Bindings : https://www.selenium.dev/documentation/webdriver/
Pytest : https://docs.pytest.org/en/stable/

值得深入学习的第三方库 ：

Pytest ：不仅仅是运行测试，学习它的fixture、参数化、插件（如pytest-html, pytest-xdist分布式运行）。
Page Object Model ：深入理解其变体，如Page Factory，或配合 selenium-page-factory 库使用。
Allure Report ：生成比pytest-html更强大、更美观的交互式测试报告。
Selenium Grid ：当你需要在不同浏览器、不同操作系统上并行运行测试时，它是分布式执行的解决方案。

保持脚本健壮性的心法 ：

定位器是根 ：花时间编写稳定、有意义的定位器。优先使用开发团队约定的、有测试ID（如 data-testid ）的元素。
等待是魂 ：彻底抛弃 time.sleep ，拥抱显式等待。理解各种 expected_conditions 的适用场景。
框架是骨 ：尽早采用POM等设计模式组织代码。好的框架能让你在项目规模扩大时依然从容。
日志和报告是眼 ：详细的日志和清晰的报告能让你快速定位问题，向团队展示自动化测试的价值。
持续运行是检验真理的唯一标准 ：将自动化测试集成到CI中，让它定期运行。不经常运行的自动化测试会很快腐坏。

UI自动化测试之路，始于一行 find_element 的代码，但成于对稳定性、可维护性和工程化的不懈追求。希望这篇长文能为你扫清一些障碍，提供一套可以立刻上手实践的思路。记住，最好的学习方式就是动手去做，从一个简单的登录测试开始，逐步扩展，遇到问题解决问题，你会发现自己成长的速度超乎想象。

亚马逊云科技技术品牌专区

更多推荐

Kiro Editor 开发实战：使用 Cargo 构建、测试与性能优化指南

欢迎来到这篇终极指南，我们将深入探索如何使用Rust构建高性能的终端文本编辑器Kiro Editor。无论你是Rust新手还是经验丰富的开发者，这篇完整教程将带你了解如何利用Cargo工具链进行高效的开发、测试和性能优化，打造一款快速、轻量且功能强大的UTF-8文本编辑器。## 什么是Kiro Editor？Kiro Editor是一款使用Rust编写的极简终端文本编辑器，它最初是著名编辑