browser-tools-mcp 详细安装使用教程和详细说明

本文介绍了Browser Tools MCP工具的安装与使用流程。该工具包含三个组件：MCP服务器、本地Node.js中间件和Chrome扩展程序。要求Node.js v16+环境，安装步骤包括：1）克隆仓库；2）安装Chrome扩展；3）分别启动MCP和Server服务；4）在IDE中添加MCP配置。使用时可让AI助手通过MCP查看页面。文中还解答了常见问题，解释了MCP和Server的分工协作

liokF

646人浏览 · 2025-10-09 23:20:22

liokF · 2025-10-09 23:20:22 发布

安装环境要求

Node版本要求：v16.0.0 及以上（推荐LTS版本，如v18.x、v20.x）；

使用教程

第一步下载browser-tools-mcp

说明：browser-tools-mcp文件夹说明

browser-tools-mcp里面一共有3个文件夹
- 第一个文件夹browser-tools-mcp，安装到 IDE 中的 MCP 服务器，用于与扩展程序 + browser-tools-server 进行通信。
- 第二个文件夹browser-tools-server，本地 nodejs 服务器，用于收集日志的中间件。
- 第三个文件夹chrome-extension，拓展程序

拉取mcp仓库到本地
跳转到browser-tools-mcp仓库地址下载
git拉取：

git clone https://github.com/AgentDeskAI/browser-tools-mcp.git

第二步安装扩展程序

说明：上面第一步里面说明里面说了拉取的browser-tools-mcp里面一共有三个文件夹，chrome-extension文件夹就是其中一个，这个就是扩展程序，直接拖到扩展程序里面即可。

1、将chrome-extension文件夹直接拖拽至扩展程序管理页面即可完成安装。也可以选择加载未打包的扩展程序按钮选择chrome-extension文件夹
2、打开浏览器的管理扩展程序，谷歌浏览器可以在地址栏输入：chrome://extensions
3、需要打开开发者模式

第三步运行browser-tools-mcp

这个里面有说先运行mcp的有说先运行server的，不过我觉得先运行哪一个都可以，还有这个两个的关系，为什么都要运行，我在疑问说明里面会说

(1)、运行browser-tools-mcp

进入到browser-tools-mcp ---> browser-tools-mcp文件夹执行npm install然后运行npm run start

cd browser-tools-mcp
npm install
npm run start

(2)、运行browser-tools-server

进入到browser-tools-mcp ---> browser-tools-server文件夹执行npm install然后运行npm run start

cd browser-tools-server
npm install
npm run start

第四步idea工具里面添加browser-tools-mcp

这里以cursor为例，如果需要其他编辑工具的，可以使用AI给你转换一下

{
  "mcpServers": {
    "browserTools": {
      "command": "npx",
      "args": ["@agentdeskai/browser-tools-mcp@latest"],
      "env": {
        "BROWSER_TOOLS_MCP_PORT": "3025",
        "BROWSER_TOOLS_MCP_HOST": "localhost"
      }
    }
  }
}

第五步使用

直接跟cursor说：使用BrowserTools MCP查看一下当前页面

一些疑问说明

browser-tools-mcp目录

安装扩展程序的两种方式图片示例

拖动chrome-extension文件夹到浏览器拓展程序页面

在这里插入图片描述

选择加载未打包的扩展程序按钮

在这里插入图片描述

检查浏览器是否生效

按下f12查看，如果是红色的表示未生效，绿色的成功生效
在这里插入图片描述

mcp效果

可以先重新启动一下浏览器，和编辑工具，然后再问一下AI

为什么运行npm run start？

在这里插入图片描述

为什么需要同时运行mcp和serve两个呢？

以下纯AI回答的，但是我觉得回答的很好，其实只运行serve也行，但是这样问AI执行的时候，不会运行高阶命令

“browser-tools-mcp” 和 “browser-tools-server” 的作用及“需同时运行”的原因，需从项目分层架构与功能协作逻辑拆解：

“browser-tools-mcp” 的核心作用

它是项目的 “浏览器侧能力载体”，聚焦浏览器环境内的工具逻辑与 MCP 协议对接，可理解为「AI 指令在浏览器里的“执行器”」：

功能定位：
- 封装浏览器原生能力（如标签页管理、DOM 操作、网络请求拦截），将其转化为 MCP 协议可识别的“工具动作”（让 AI 能通过 MCP 协议调用浏览器功能）；
- 作为「浏览器 ↔ MCP 服务器」的中间层：接收 AI 工具（如 Cursor）通过 MCP 协议下发的指令（如“执行 JavaScript 代码”“捕获控制台日志”），在浏览器上下文执行后，把结果回传给 MCP 服务器；
- 可能联动 Chrome 扩展：通过扩展注入脚本、监听浏览器事件，实现更细粒度的页面交互（如自动填充表单、模拟点击）。

“browser-tools-server” 的核心作用

它是项目的 “后端业务大脑”，聚焦复杂逻辑处理、数据聚合与跨模块协同，可理解为「AI 指令的“调度中心”」：

功能定位：
- 处理 MCP 服务器转发的高阶请求：比如调度 Lighthouse 审计任务、编排多步骤自动化流程（如“先截图 → 再分析 DOM → 最后生成报告”）；
- 管理会话状态：记录不同标签页的调试上下文（如当前打开的页面 URL、AI 对话历史），确保多轮交互的连贯性；
- 对接外部服务：调用 Lighthouse API 完成网页性能审计、将审计报告存储至本地/云端；
- 作为“后端枢纽”：协调
  “browser-tools-mcp”（浏览器端）与 AI 客户端（如 Cursor）的通信，保障指令流转和结果反馈的稳定性。

为什么教程要求“两个都需要运行”？

这是由项目的分层协作架构决定的——
“browser-tools-mcp” 是「前端感知层」，
“browser-tools-server” 是「后端逻辑层」，二者缺一不可：

若只运行
“browser-tools-mcp”：浏览器能捕获事件、执行基础指令（如打印日志），但无法处理高阶任务（如 Lighthouse 审计需后端调度资源）、跨会话状态会失效（每次打开新标签页，AI 无法识别历史上下文），且无法与 AI 客户端建立稳定 MCP 连接（MCP 协议需后端服务器中转消息）。
若只运行
“browser-tools-server”：后端有业务逻辑，但无“前端触手”——所有依赖浏览器实时交互的功能（如元素检查、网络请求监控、DOM 操作）会完全失效（因为没有“执行层”在浏览器里干活）。

简单总结

“browser-tools-mcp” 是「浏览器里的执行者」，负责落地 AI 指令；
“browser-tools-server” 是「后端的指挥官」，负责统筹复杂任务。教程要求同时运行，是为了让 “前端交互能力”与“后端业务逻辑”形成完整闭环，确保工具链的所有功能（实时监控、自动化审计、自定义脚本等）都能正常运转～

北京朝阳AI社区

更多推荐

vLLM - 设计 - Paged Attention（分页注意力）

摘要： vLLM框架采用Paged Attention机制优化大模型推理性能，通过分块存储KV缓存提升内存利用率。其核心是多头query attention内核的CUDA实现，关键设计包括：1) 将KV缓存分割为固定大小的块（block）存储；2) 线程组协同处理query和key向量，通过共享内存优化数据访问；3) 采用向量化读取（vec）提升内存带宽利用率。该实现通过特殊的内存布局设计，确保邻

北京朝阳AI社区

不输 Claude Code！开源 MakingMcp 让 Codex 实现功能大逆袭

本文介绍了如何通过开源项目MakingMcp增强Codex AI编程助手的功能。主要内容包括：1）安装.NET 10 SDK和最新版Codex；2）下载配置MakingMcp服务端，设置API密钥和模型参数；3）修改Codex客户端配置文件启用MCP功能；4）测试验证Task等高级功能。MakingMcp基于.NET实现了MCP协议，采用主Agent/SubAgent架构，通过Semantic K

北京朝阳AI社区

vLLM - 设计 - 自动前缀缓存（Automatic Prefix Caching）

vLLM采用自动前缀缓存优化大模型推理，通过哈希机制缓存已处理的KV-cache块，当新请求前缀匹配时直接复用，减少重复计算。该方法支持多模态输入（如图片）和缓存隔离，通过请求级salt增强多租户安全性。vLLM v1采用块池和双向链表管理KV cache，实现高效分配、追加和回收操作。前缀缓存被OpenAI等广泛采用，vLLM通过SHA256哈希降低碰撞风险，每token处理仅增加100-200