Node.js Selenium WebDriver自动化测试：从环境搭建到实战技巧

甘剑平

250人浏览 · 2026-06-27 12:17:18

甘剑平 · 2026-06-27 12:17:18 发布

1. 项目概述：为什么选择Node.js来驱动Selenium WebDriver？

如果你正在寻找一种高效、现代化的方式来编写Web自动化测试脚本，或者想用JavaScript来模拟用户操作浏览器，那么Node.js版的Selenium WebDriver绝对值得你投入时间。作为一个长期混迹于前后端开发和自动化测试领域的从业者，我经历过从Python的 selenium 库到Java的 WebDriver ，最终在Node.js生态里找到了一个平衡点：开发效率高、异步处理能力强，并且能和前端技术栈无缝集成。很多新手，甚至一些有经验的开发者，在面对Selenium时，第一反应往往是Python。这没错，Python的Selenium生态非常成熟。但当你身处一个以Node.js为核心的技术栈中，或者你本身就是一个JavaScript/TypeScript开发者时，强迫自己切换语言上下文去写自动化脚本，无疑是一种内耗。

Node.js版的Selenium WebDriver，核心是通过 selenium-webdriver 这个npm包来实现的。它不是一个简单的封装，而是官方维护的、遵循W3C WebDriver协议的标准实现。这意味着你可以用你熟悉的 async/await 语法来优雅地处理所有异步的浏览器操作，从打开页面、查找元素、点击输入，到执行JavaScript、处理弹窗和等待条件。整个过程就像在写一个普通的Node.js应用一样自然。我选择它，不仅仅是为了统一技术栈，更是看中了它在处理复杂异步流程和与现代前端构建工具（如Webpack、Babel）集成时的便利性。接下来，我会带你从零开始，搭建环境、编写第一个脚本，并深入到那些官方文档不会告诉你的实战技巧和避坑指南中。

2. 环境准备与核心依赖安装

万事开头难，但把环境搭对了，后面就成功了一半。Node.js环境的Selenium配置，核心在于“配对”：Node.js版本、 selenium-webdriver 包版本、浏览器版本以及对应的WebDriver驱动版本，四者必须兼容。很多初学者遇到的诡异问题，十有八九是版本错配导致的。

2.1 Node.js与npm的安装与版本管理

首先，你需要一个Node.js运行环境。我强烈建议不要直接从官网下载安装包一装了之，而是使用版本管理工具，比如 nvm （Windows用户可以用 nvm-windows ）。原因很简单，自动化测试项目可能会依赖特定版本的Node.js，而你的其他项目可能需要另一个版本。用版本管理器可以让你在不同项目间无缝切换。

以 nvm-windows 为例，从GitHub发布页下载安装包，安装完成后，在命令行中就可以轻松安装和管理多个Node.js版本。对于Selenium WebDriver，我推荐使用Node.js的LTS（长期支持）版本，比如18.x或20.x。它们更稳定，社区支持更好。安装命令类似于 nvm install 18.19.0 ，然后使用 nvm use 18.19.0 切换到该版本。

安装好Node.js后， npm （Node包管理器）会随之安装。你可以通过 node -v 和 npm -v 来验证安装是否成功。一个常见的坑是Windows系统的执行策略可能会阻止npm脚本运行，如果你看到“无法加载文件...因为在此系统上禁止运行脚本”这样的错误，需要以管理员身份打开PowerShell，执行 Set-ExecutionPolicy RemoteSigned 来修改策略，记得用完后再改回去以保证安全。

2.2 初始化项目与安装selenium-webdriver

环境就绪后，我们创建一个专门的项目目录。我不推荐在全局安装 selenium-webdriver ，因为不同项目可能需要不同的版本。为每个自动化项目创建独立的目录并初始化，是更专业和可持续的做法。

打开终端，进入你的工作目录，执行以下命令：

mkdir my-webdriver-project
cd my-webdriver-project
npm init -y

这会生成一个 package.json 文件，记录项目依赖。接下来，安装核心包：

npm install selenium-webdriver

这里有一个关键点：默认安装的是最新版本。但为了稳定性，我建议查阅一下 selenium-webdriver 的npm页面，选择一个经过广泛验证的稳定版本。例如，你可以使用 npm install selenium-webdriver@4.16.0 来安装特定版本。同时，我们还需要安装浏览器驱动，但 selenium-webdriver 从4.6.0版本开始，引入了一个非常棒的特性： selenium-manager 。这是一个内置的工具，可以自动为你下载和匹配正确版本的浏览器驱动（如ChromeDriver、geckodriver）。在大多数情况下，你不再需要手动下载和配置驱动路径了，这极大地简化了入门流程。

2.3 浏览器选择与驱动配置

虽然 selenium-manager 能解决大部分问题，但理解其背后的机制和手动配置的备选方案，对于排查问题至关重要。Selenium支持多种浏览器，最常用的是Chrome和Firefox。

对于Chrome： selenium-webdriver 会通过 selenium-manager 自动检测你系统安装的Chrome版本，并下载对应的 chromedriver 。你几乎不需要做任何事。但如果你遇到问题，或者公司内网环境特殊，可能需要手动下载。这时，你需要去ChromeDriver官网，下载与你的Chrome浏览器主版本号完全一致的驱动。将下载的 chromedriver.exe （Windows）或 chromedriver （macOS/Linux）放在一个目录下，并在代码中通过 service 选项指定其路径。

对于Firefox： Firefox的驱动叫 geckodriver 。同样， selenium-manager 在大多数情况下能自动处理。手动备份方案是去Mozilla的GitHub发布页下载，并同样指定路径。

注意： 浏览器的自动更新有时会跑在驱动更新前面。如果某天你的脚本突然报错，提示“无法启动会话”或版本不匹配，第一个要检查的就是浏览器版本和驱动版本是否一致。使用 selenium-manager 能最大程度避免这个问题，因为它会在每次运行时尝试匹配最新版本。

3. 第一个自动化脚本：从“Hello World”到真实操作

理论说再多，不如动手跑一遍。让我们编写一个最简单的脚本，打开百度，搜索一个关键词，然后验证结果。这个流程涵盖了Web自动化的几个核心操作：启动浏览器、导航、查找元素、交互和断言。

3.1 基础脚本结构与浏览器启动

创建一个名为 first-test.js 的文件。我们将使用ES模块语法和 async/await 。

import { Builder, By, Key, until } from 'selenium-webdriver';
import chrome from 'selenium-webdriver/chrome.js';

async function example() {
  // 1. 创建浏览器选项（以Chrome为例）
  let options = new chrome.Options();
  // 可以添加各种选项，例如无头模式、禁用沙箱等
  // options.addArguments('--headless'); // 无头模式，不显示浏览器界面
  // options.addArguments('--no-sandbox'); // 在CI环境（如Docker）中可能需要

  // 2. 构建WebDriver实例
  let driver = await new Builder()
    .forBrowser('chrome')
    .setChromeOptions(options)
    .build();

  try {
    // 3. 导航到目标网址
    await driver.get('https://www.baidu.com');

    // 4. 等待页面标题包含“百度”
    await driver.wait(until.titleContains('百度'), 5000);

    // 5. 找到搜索框，输入关键词并回车
    let searchBox = await driver.findElement(By.id('kw'));
    await searchBox.sendKeys('Selenium WebDriver', Key.RETURN);

    // 6. 等待搜索结果页面加载
    await driver.wait(until.titleContains('Selenium WebDriver'), 5000);

    // 7. 获取第一个搜索结果的标题文本
    let firstResult = await driver.findElement(By.css('#content_left .result h3 a'));
    let titleText = await firstResult.getText();
    console.log('第一个搜索结果标题：', titleText);

    // 8. 简单的断言（这里只是打印，实际测试中会用断言库）
    if (titleText.includes('Selenium')) {
      console.log('✅ 测试通过！搜索结果包含“Selenium”。');
    } else {
      console.log('❌ 测试失败！');
    }

  } finally {
    // 9. 无论如何，最后都要关闭浏览器，释放资源
    await driver.quit();
  }
}

// 执行函数
example().catch(console.error);

逐行解析一下关键点：

Builder ：用于构造WebDriver实例的工厂类。
forBrowser(‘chrome’) ：指定浏览器类型。也可以是 ‘firefox’ 。
setChromeOptions(options) ：传入我们设置的浏览器选项对象。这是进行浏览器定制（如无头模式、用户数据目录、代理设置）的主要入口。
driver.get(url) ：导航到指定URL。这会阻塞直到页面 load 事件触发。
driver.wait(condition, timeout) ：这是Selenium中 极其重要 的一环。它用于等待某个条件成立。上面的 until.titleContains 是一个内置条件。自动化脚本失败的大部分原因，都是因为没有正确等待元素出现或状态改变。永远不要假设页面是瞬间加载完成的。
By ：定位器策略。 By.id 、 By.cssSelector 、 By.xpath 是最常用的。优先使用ID和CSS选择器，它们更稳定、性能更好。XPath虽然强大，但容易受页面结构微小变动的影响。
findElement ：查找单个元素。如果找不到，会抛出 NoSuchElementError 。对应的 findElements 会返回一个元素数组（找不到则返回空数组）。
sendKeys(‘text’, Key.RETURN) ：向输入框输入文本。 Key 对象提供了特殊的键盘按键，如 RETURN （回车）、 TAB 、 CONTROL 等。
getText() ：获取元素的可见文本内容。
driver.quit() ：关闭浏览器窗口并结束WebDriver会话。 务必在 finally 块中调用 ，以确保即使脚本出错，浏览器也能被正确关闭，避免残留进程占用资源。

运行这个脚本： node first-test.js 。你会看到Chrome浏览器自动打开，执行搜索，然后在控制台输出结果。恭喜你，你已经完成了第一个Node.js Selenium自动化脚本！

3.2 元素定位的深入：策略与最佳实践

元素定位是Web自动化的基石。定位不准，一切操作都无从谈起。 selenium-webdriver 提供了多种定位策略，你需要根据实际情况选择最稳健的一种。

1. 优先级建议：

首选ID ： By.id(‘kw’) 。ID通常是唯一的，定位最快、最准。
次选CSS选择器 ： By.cssSelector(‘input.s_ipt’) 。CSS选择器非常灵活，且性能优于XPath。可以通过类名、属性、父子关系等进行组合定位。
谨慎使用XPath ： By.xpath(‘//input[@name=“wd”]’) 。XPath功能强大，可以处理非常复杂的定位逻辑（如根据文本内容定位）。但其缺点是性能相对较差，且表达式容易因页面结构调整而失效。如果必须用XPath，尽量使用相对路径和非索引依赖的表达式。

2. 等待策略： 直接使用 findElement 而不等待，是新手最常见的错误。元素可能因为网络、JS加载而延迟出现。 driver.wait 是你的好朋友。

显式等待 ：上面例子用的就是显式等待。它允许你设置一个超时时间，并轮询检查某个条件是否成立。 until 模块提供了很多内置条件：
- until.elementLocated(By…) ：等待元素出现在DOM中。
- until.elementIsVisible(element) ：等待元素不仅存在，而且可见。
- until.titleIs(‘title’) ：等待标题完全匹配。
- 你也可以自定义等待条件，传入一个返回Promise的函数。
隐式等待 ：通过 driver.manage().setTimeouts({ implicit: 10000 }) 设置。它会在查找任何元素时，如果没立即找到，会全局性地等待一段时间再抛出错误。 我不推荐广泛使用隐式等待 ，因为它会影响所有 findElement 操作，可能导致脚本在不需要等待的地方无谓等待，从而拖慢整体执行速度。更精细的控制应该交给显式等待。

3. 处理iframe和Shadow DOM： 如果元素位于iframe内，你必须先切换到对应的iframe上下文，才能定位其中的元素。

// 通过ID或索引切换到iframe
await driver.switchTo().frame(‘iframe-id’);
// 操作iframe内的元素...
// 操作完毕后切换回主文档
await driver.switchTo().defaultContent();

对于Shadow DOM，需要使用 executeScript 执行JavaScript来穿透影子根。

4. 高级特性与实战技巧

掌握了基础操作后，我们来探讨一些能让你脚本更健壮、更高效的高级特性和实战中积累的技巧。

4.1 浏览器选项与能力的深度配置

通过 ChromeOptions 或 FirefoxOptions ，你可以对浏览器实例进行深度定制，这对于模拟真实用户、绕过检测或适配测试环境至关重要。

import chrome from 'selenium-webdriver/chrome.js';

let options = new chrome.Options();

// 常用配置示例
options.addArguments(
  ‘--disable-blink-features=AutomationControlled‘, // 隐藏自动化控制标志，有助于防反爬
  ‘--no-sandbox‘, // 在Linux CI环境（如Docker）中通常需要
  ‘--disable-dev-shm-usage‘, // 解决Docker中共享内存问题
  ‘--disable-gpu‘, // 某些无头环境需要
  ‘--window-size=1920,1080‘ // 设置初始窗口大小
);

// 设置用户数据目录，可以保存登录状态（用于需要登录的测试）
// options.addArguments(‘user-data-dir=/path/to/your/profile’);

// 设置实验性选项（通过Chrome DevTools Protocol）
let prefs = new chrome.Options().experimentalOptions.prefs;
prefs[‘download.default_directory’] = ‘/path/to/downloads‘; // 设置默认下载目录
options.setExperimentalOption(‘prefs‘, prefs);

// 设置无头模式（不显示UI，适合CI/CD）
options.addArguments(‘--headless=new‘); // Chrome 112+ 推荐使用new headless模式

// 禁用自动化提示栏（Chrome中“正受到自动测试软件控制”的提示）
options.setExperimentalOption(‘excludeSwitches‘, [‘enable-automation‘]);
options.setExperimentalOption(‘useAutomationExtension‘, false);

实操心得 ：关于“隐藏自动化特征”，这是一个猫鼠游戏。一些网站会检测 navigator.webdriver 属性或特定的CDP（Chrome DevTools Protocol）痕迹。上述的 --disable-blink-features=AutomationControlled 和 excludeSwitches 选项可以移除一部分特征。但对于高级反爬，可能需要更复杂的CDP覆盖（如 Page.addScriptToEvaluateOnNewDocument 来覆盖 webdriver 属性）。记住，完全模拟人类行为几乎不可能，我们的目标是让脚本足够“低调”以完成工作。对于重要的生产环境测试，最好与开发团队沟通，为测试环境禁用或放宽反自动化检测。

4.2 执行JavaScript与处理复杂交互

WebDriver 的 executeScript 方法是一个强大的瑞士军刀，它可以让你在页面上下文中执行任意JavaScript代码。这常用于：

获取或修改页面属性。
执行原生DOM操作。
模拟一些WebDriver API不直接支持的复杂交互（如拖放、滚动到特定位置）。
注入脚本以绕过某些限制。

// 示例：滚动到页面底部
await driver.executeScript(‘window.scrollTo(0, document.body.scrollHeight)‘);

// 示例：获取页面性能指标
let perfData = await driver.executeScript(‘return window.performance.timing‘);
console.log(‘页面加载耗时：‘, perfData.loadEventEnd - perfData.navigationStart);

// 示例：修改元素样式（高亮显示）
let element = await driver.findElement(By.id(‘some-id‘));
await driver.executeScript(“arguments[0].style.border = ‘3px solid red’“, element);

// 示例：处理通过WebDriver难以触发的点击（例如被遮挡的元素）
await driver.executeScript(“arguments[0].click();“, element);

处理弹窗和浏览器对话框：

Alert/Confirm/Prompt ：使用 driver.switchTo().alert() 来获取警报对象，然后可以 accept() 、 dismiss() 或 sendKeys() 。

// 等待alert出现并接受
await driver.wait(until.alertIsPresent(), 3000);
let alert = await driver.switchTo().alert();
console.log(‘弹窗文本：‘, await alert.getText());
await alert.accept();

新窗口/标签页 ：获取所有窗口句柄，然后切换。

let originalWindow = await driver.getWindowHandle();
// 某个操作打开了新窗口...
let allWindows = await driver.getAllWindowHandles();
let newWindow = allWindows.find(handle => handle !== originalWindow);
await driver.switchTo().window(newWindow);
// 操作新窗口...
await driver.close(); // 关闭新窗口
await driver.switchTo().window(originalWindow); // 切回原窗口

4.3 文件上传与下载

文件上传 ：对于 <input type=“file”> 元素，直接使用 sendKeys 传入文件的 绝对路径 即可。这是最可靠的方法。

let uploadInput = await driver.findElement(By.css(‘input[type=“file”]‘));
await uploadInput.sendKeys(‘/absolute/path/to/your/file.pdf‘);

如果遇到非标准的文件上传控件（如自定义的按钮），可能需要借助 AutoIT 或 Robot 类工具，但在Web自动化中，更常见的做法是和开发沟通，在测试环境下提供一个标准的input元素。

文件下载 ：控制下载行为稍微复杂。你需要通过浏览器选项设置默认下载目录，并禁用“下载前询问”的提示。

let prefs = {
  ‘download.default_directory‘: ‘/path/to/downloads‘,
  ‘download.prompt_for_download‘: false,
  ‘download.directory_upgrade‘: true,
  ‘safebrowsing.enabled‘: false // 有时需要禁用安全浏览以加速下载
};
options.setExperimentalOption(‘prefs‘, prefs);

设置好后，触发下载操作，然后你需要用Node.js的 fs 模块去检查目标目录下文件是否已下载完成。这里通常需要实现一个等待函数，轮询检查文件是否存在且大小不再增长。

5. 项目组织、测试框架集成与最佳实践

当脚本越来越多，你就需要考虑如何组织代码，使其可维护、可复用，并集成到更广泛的测试流程中。

5.1 使用Mocha/Chai/Jest组织测试用例

原生的Node.js脚本可以运行，但缺乏测试报告、断言库和生命周期钩子。集成一个测试框架会让你的自动化项目更加专业。

以 Mocha （测试运行器）+ Chai （断言库）为例：

安装依赖 ：

npm install mocha chai --save-dev

创建测试文件 （例如 test/search.test.js ）：

import { expect } from ‘chai‘;
import { Builder, By, Key, until } from ‘selenium-webdriver‘;
import chrome from ‘selenium-webdriver/chrome.js‘;

describe(‘百度搜索功能测试‘, function() {
  // 设置超时时间（Mocha默认2秒，对于UI测试太短）
  this.timeout(30000);

  let driver;

  before(async function() {
    // 每个测试套件开始前执行：启动浏览器
    let options = new chrome.Options();
    options.addArguments(‘--headless=new‘);
    driver = await new Builder()
      .forBrowser(‘chrome‘)
      .setChromeOptions(options)
      .build();
  });

  after(async function() {
    // 每个测试套件结束后执行：关闭浏览器
    if (driver) {
      await driver.quit();
    }
  });

  it(‘应该能成功搜索关键词并显示相关结果‘, async function() {
    await driver.get(‘https://www.baidu.com‘);
    await driver.wait(until.titleContains(‘百度‘), 5000);

    let searchBox = await driver.findElement(By.id(‘kw‘));
    await searchBox.sendKeys(‘自动化测试‘, Key.RETURN);

    await driver.wait(until.titleContains(‘自动化测试‘), 5000);

    let firstResultLink = await driver.findElement(By.css(‘#content_left h3 a‘));
    let linkText = await firstResultLink.getText();

    // 使用Chai断言
    expect(linkText).to.be.a(‘string‘);
    expect(linkText.toLowerCase()).to.include(‘自动化‘);
  });
});

在 package.json 中添加脚本 ：

“scripts“: {
  “test“: “mocha test/**/*.test.js“
}

运行测试 ： npm test 。Mocha会输出清晰的测试通过/失败报告。

使用测试框架的好处是结构清晰，支持 before / after 钩子进行初始化和清理，断言库提供了丰富的断言方法，并且可以轻松集成到CI/CD流水线中。

5.2 Page Object模式：提升代码可维护性

当测试用例涉及多个页面和大量重复的元素定位时，代码会迅速变得难以维护。 Page Object 模式是一种经典的设计模式，它将每个页面的元素定位和操作封装成一个类。测试脚本只与这些Page Object交互，而不直接接触底层的 findElement 和 sendKeys 。

示例：创建一个百度首页的Page Object ( pages/BaiduHomePage.js )：

import { By, until } from ‘selenium-webdriver‘;

export class BaiduHomePage {
  constructor(driver) {
    this.driver = driver;
    this.url = ‘https://www.baidu.com‘;
    // 元素定位器
    this.searchInput = By.id(‘kw‘);
    this.searchButton = By.id(‘su‘);
  }

  async open() {
    await this.driver.get(this.url);
    await this.driver.wait(until.titleContains(‘百度‘), 5000);
    return this;
  }

  async search(keyword) {
    let input = await this.driver.findElement(this.searchInput);
    await input.clear();
    await input.sendKeys(keyword);
    await this.driver.findElement(this.searchButton).click();
    // 等待搜索结果页面
    await this.driver.wait(until.titleContains(keyword), 5000);
  }
}

在测试中使用Page Object ：

import { BaiduHomePage } from ‘../pages/BaiduHomePage.js‘;

describe(‘使用Page Object测试‘, function() {
  // ... before, after 钩子 ...

  it(‘使用Page Object进行搜索‘, async function() {
    let homePage = new BaiduHomePage(driver);
    await homePage.open();
    await homePage.search(‘Selenium‘);
    // 后续可以引入SearchResultsPage来进一步操作和断言
  });
});

这样做的好处是：

复用性 ：元素定位逻辑集中在一处，修改页面元素时只需改一个地方。
可读性 ：测试用例读起来像自然语言，业务逻辑清晰。
可维护性 ：页面结构与测试逻辑分离，降低了耦合度。

5.3 配置管理与持续集成

环境配置 ：将浏览器类型、基础URL、超时时间等配置项提取到外部文件（如 config.json 或使用 dotenv 加载环境变量）。

// config.json
{
  “baseUrl“: “https://www.baidu.com“,
  “browser“: “chrome“,
  “headless“: true,
  “timeout“: 10000
}

在代码中读取配置，使脚本能轻松适应不同环境（开发、测试、生产）。

持续集成 ：在CI服务器（如Jenkins、GitHub Actions、GitLab CI）上运行Selenium测试，需要特别注意：

无头模式 ：必须使用 --headless 参数。
驱动管理 ：确保CI环境中 selenium-manager 能正常工作，或预先安装好正确版本的浏览器和驱动。
依赖安装 ：在CI脚本中运行 npm ci （比 npm install 更严格，适合CI）来安装依赖。
测试报告 ：集成 mochawesome 等报告生成器，将测试结果输出为HTML或JSON报告，便于查看。

一个简单的GitHub Actions工作流示例 ( .github/workflows/test.yml )：

name: UI Automation Tests
on: [push]
jobs:
  test:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v3
      - name: Use Node.js
        uses: actions/setup-node@v3
        with:
          node-version: ‘18‘
      - name: Install dependencies
        run: npm ci
      - name: Run UI Tests
        run: npm test
        env:
          CI: true

6. 常见问题排查与性能优化

即使按照最佳实践编写脚本，在实际运行中仍会遇到各种问题。这里记录了一些我踩过的坑和解决方案。

6.1 典型错误与解决方案速查表

问题现象	可能原因	解决方案
`SessionNotCreatedError: ... This version of ChromeDriver only supports Chrome version ...`	Chrome浏览器版本与ChromeDriver驱动版本不匹配。	1. 使用 `selenium-manager` （默认启用）自动匹配。2. 手动检查Chrome版本（ `chrome://version/` ），去官网下载对应版本的驱动。3. 考虑使用Docker固定浏览器和驱动版本。
`NoSuchElementError: Unable to locate element...`	元素尚未加载/出现在DOM中；元素在iframe或Shadow DOM内；定位器写错了。	1. 增加显式等待： `await driver.wait(until.elementLocated(By…), timeout)` 。2. 检查是否需切换 `iframe` 。3. 使用浏览器开发者工具重新验证定位器。4. 尝试更稳定的定位方式（如用ID替代复杂的XPath）。
`ElementNotInteractableException: element not interactable`	元素存在但不可交互（被遮挡、禁用、不可见、在视窗外）。	1. 等待元素可见： `until.elementIsVisible()` 。2. 滚动元素到视口： `await element.scrollIntoView()` 或 `executeScript` 滚动。3. 检查是否有遮罩层（Modal）。4. 尝试用JavaScript直接点击： `executeScript(“arguments[0].click()“, element)` 。
脚本在本地运行正常，在CI服务器失败	CI环境缺少显示服务器（无头模式需配置）、资源不足、网络环境不同。	1. 确保CI中使用了正确的无头模式参数。2. 增加超时时间和隐式等待（谨慎）。3. 在CI脚本中添加截图功能，失败时保存截图和页面源码以便排查。4. 检查CI环境的防火墙或代理设置。
浏览器被网站识别为自动化工具	网站检测到了WebDriver特征（如 `navigator.webdriver` 属性）。	1. 添加Chrome选项： `--disable-blink-features=AutomationControlled` 和 `excludeSwitches: [‘enable-automation‘]` 。2. 使用 `cdp` 命令覆盖属性（更激进，可能违反服务条款）。3. 评估是否必须在此网站进行自动化，或联系网站所有者。
执行速度很慢	不必要的等待过多；网络慢；定位器效率低（如复杂XPath）。	1. 用显式等待替代固定的 `sleep` 。2. 优化定位器，优先使用ID和CSS选择器。3. 考虑在无头模式下运行。4. 分析网络请求，看是否有资源加载过慢，可考虑禁用图片、CSS等非必要资源（通过浏览器选项）。

6.2 调试技巧与日志记录

截图和保存页面源码 ：这是调试UI测试失败的黄金组合。

const fs = require(‘fs‘).promises;
async function takeScreenshotAndSource(driver, filename) {
  // 截图
  let screenshot = await driver.takeScreenshot();
  await fs.writeFile(`${filename}.png`, screenshot, ‘base64‘);
  // 保存页面HTML源码
  let source = await driver.getPageSource();
  await fs.writeFile(`${filename}.html`, source);
  console.log(`调试信息已保存至：${filename}.png 和 ${filename}.html`);
}
// 在catch块或测试失败时调用

启用WebDriver日志 ：在构建 driver 时，可以设置日志级别，这有助于理解WebDriver与浏览器驱动之间的通信。

const { Builder, Browser, logging } = require(‘selenium-webdriver‘);
let prefs = new logging.Preferences();
prefs.setLevel(logging.Type.BROWSER, logging.Level.ALL);
let driver = await new Builder()
  .forBrowser(‘chrome‘)
  .setLoggingPrefs(prefs)
  .build();
// 之后可以获取日志
let logs = await driver.manage().logs().get(logging.Type.BROWSER);
console.log(logs);

使用 debugger 和 pause ：在开发脚本时，你可以在代码中插入 await driver.sleep(10000) 来暂停执行，然后手动检查浏览器状态。或者，在非无头模式下运行，直接观察浏览器的操作过程。

6.3 性能优化建议

并行执行 ：如果测试套件很大，考虑使用 mocha 的 --parallel 标志或 jest 的并发测试功能。但要注意，并行运行UI测试需要足够的系统资源，并且测试之间不能有状态依赖。
复用浏览器会话 ：对于一组相关的测试，可以在 beforeAll 钩子中启动浏览器，在所有测试结束后 afterAll 中关闭，而不是每个测试都重启。这能节省大量时间，但需要确保每个测试是独立的，不会相互污染状态（例如，清理Cookies、LocalStorage）。
选择性等待 ：避免使用全局的、过长的隐式等待。为每个需要等待的操作设置精确的、尽可能短的显式等待超时。

资源限制 ：在无头模式下，可以禁用图片、CSS、字体等资源的加载来加速页面渲染。

let prefs = { ‘profile.managed_default_content_settings.images‘: 2 }; // 2为禁用
options.setExperimentalOption(‘prefs‘, prefs);

使用更快的定位器 ：基准测试表明， By.id 和简单的 By.cssSelector 通常是最快的。尽量避免使用包含 // 的复杂XPath表达式，尤其是在循环中查找元素时。

最后，我想分享一个深刻的体会：Web自动化测试，尤其是基于Selenium的UI自动化，其价值不在于替代所有手工测试，而在于作为回归测试的守护者，以及执行那些重复、枯燥但必要的端到端流程。它的维护成本不低，因为前端页面总是在变化。因此，与开发团队建立良好的沟通机制，让页面元素拥有稳定的、有意义的ID或测试属性（如 data-testid ），是降低脚本“脆弱性”、提升自动化投资回报率的关键。将你的Page Object设计好，把变化隔离在少数几个文件中，当页面迭代时，你就能从容应对。

亚马逊云科技技术品牌专区

更多推荐

Kiro Editor 开发实战：使用 Cargo 构建、测试与性能优化指南

欢迎来到这篇终极指南，我们将深入探索如何使用Rust构建高性能的终端文本编辑器Kiro Editor。无论你是Rust新手还是经验丰富的开发者，这篇完整教程将带你了解如何利用Cargo工具链进行高效的开发、测试和性能优化，打造一款快速、轻量且功能强大的UTF-8文本编辑器。## 什么是Kiro Editor？Kiro Editor是一款使用Rust编写的极简终端文本编辑器，它最初是著名编辑