在 ESXi 虚拟化环境中,GPU 直通是实现高性能 AI 计算、3D 渲染、游戏虚拟化的核心技术,能让虚拟机获得接近原生的 GPU 性能,彻底解决虚拟化环境下图形与算力不足的问题。ESXi 官方与社区广泛支持 NVIDIA 和 AMD 两大品牌显卡,核心兼容型号包括 NVIDIA V100/A100/RTX 全系列、AMD S7150/MI 系列。本文详细整理了 ESXi 7.0/8.0 全版本支持的 GPU 型号、适用场景、完整配置步骤及常见问题解决,帮助运维快速搭建稳定高效的 GPU 虚拟化环境。

一、ESXi GPU 直通基础说明

1.1 什么是 GPU 直通

GPU 直通(PCIe Passthrough)是 VMware ESXi 提供的硬件虚拟化技术,通过直接将物理 GPU 设备分配给单台虚拟机独占使用,绕过 ESXi 虚拟化层的资源调度,让虚拟机获得完整的 GPU 算力与功能支持,性能损耗低于 5%,可实现与物理机几乎一致的运行体验。

1.2 核心优势与适用场景

  • 性能接近原生:完整释放 GPU 算力,支持 CUDA、ROCm 等所有原生 GPU 功能;
  • 功能无限制:支持 AI 训练、3D 渲染、视频编码、游戏运行等所有 GPU 密集型任务;
  • 无需额外授权:相比 vGPU 技术,GPU 直通无需购买额外授权,成本更低。

主要适用场景:深度学习模型训练、影视后期渲染、CAD/CAM 设计、虚拟游戏主机、科学计算等。

二、NVIDIA GPU 全系列兼容列表

NVIDIA 是 ESXi GPU 直通支持最完善的品牌,从数据中心计算卡到消费级游戏卡均有良好兼容性,是企业与个人用户的首选。

2.1 数据中心计算卡(官方优先支持)

这是 ESXi 官方认证度最高、稳定性最好的系列,适合企业生产环境部署:

  • Tesla V 系列:V100(16GB/32GB)、V100S,主打高性能 AI 训练与推理;
  • Tesla A 系列:A100(40GB/80GB)、A30、A10、A16、A40,覆盖从入门到旗舰级 AI 算力;
  • Tesla T 系列:T4(16GB),性价比极高的推理卡,广泛用于 VDI 与边缘计算;
  • Tesla H 系列:H100(80GB),ESXi 8.0 及以上版本支持,代表当前最强 AI 算力;
  • 老款兼容型号:M40、P4、P40、P100,适合低成本 AI 学习环境搭建。

2.2 专业工作站卡

适合专业设计、渲染场景,驱动稳定,兼容性优秀:

  • Quadro RTX 系列:RTX 6000 Ada、RTX 5000、RTX 4000、P6000;
  • 老款 Quadro 系列:K2200、M2000、P2000,适合轻量级设计任务。

2.3 消费级 RTX 游戏卡

社区兼容性极佳,适合个人用户搭建 AI 工作站与游戏虚拟机:

  • RTX 40 系列:RTX 4090、4080、4070 Ti、4060 Ti,ESXi 8.0 U2 及以上完美支持;
  • RTX 30 系列:RTX 3090、3080 Ti、3070、3060,兼容性最好的消费级系列;
  • RTX 20 系列:RTX 2080 Ti、2070、2060,支持所有主流功能。

三、AMD GPU 全系列兼容列表

AMD GPU 在 ESXi 中的支持度逐年提升,尤其是最新的 RDNA 与 CDNA 架构,性价比优势明显。

3.1 数据中心计算卡

  • MI 系列:MI25、MI50、MI100、MI300,主打高性能 AI 与科学计算,ESXi 7.0 U3 及以上支持;
  • FirePro 系列:S7150、S7150x2,经典虚拟化专用卡,支持多用户共享 GPU 资源。

3.2 专业工作站卡

  • Radeon Pro 系列:W7900、W6800、W5700、WX 7100,适合专业设计与渲染场景;
  • 老款 FirePro 系列:WX 5100、WX 4100,轻量级图形加速首选。

3.3 消费级 RX 游戏卡

社区实践验证兼容性良好,适合个人用户使用:

  • RX 7000 系列:RX 7900 XTX、7800 XT、7700 XT,ESXi 8.0 U1 及以上支持;
  • RX 6000 系列:RX 6900 XT、6800 XT、6750 XT,兼容性最佳的 AMD 消费级系列;
  • RX 5000 系列:RX 5700 XT、5600 XT,支持基础直通功能。

四、ESXi GPU 直通完整配置步骤

4.1 第一步:主板 BIOS 基础配置

这是直通成功的前提,所有主板必须完成以下设置:

  1. 开机进入 BIOS,开启 CPU 虚拟化技术:Intel 平台开启VT-d,AMD 平台开启IOMMU
  2. 开启Above 4G Decoding(大于 4G 地址空间解码),必须开启否则无法识别大显存 GPU;
  3. 关闭CSM Support(兼容支持模块),切换为纯 UEFI 启动模式;
  4. 将 PCIe 链路速度设置为主板支持的最高版本(如 Gen4/Gen5),保存设置并重启。

4.2 第二步:ESXi 端开启 GPU 直通

  1. 登录 ESXi Web 管理界面,进入【管理】→【硬件】→【PCI 设备】;
  2. 在设备列表中找到你的 GPU 设备(通常显示为 NVIDIA 或 AMD Corporation 开头);
  3. 勾选 GPU 设备,点击右上角【切换直通】按钮,状态变为 “活动” 即表示成功;
  4. 重启 ESXi 主机,使直通配置生效。

4.3 第三步:虚拟机配置

  1. 创建或编辑目标虚拟机,操作系统选择对应版本,固件必须设置为EFI
  2. 点击【添加其他设备】→【PCI 设备】,选择已开启直通的 GPU 设备;
  3. 勾选【预留全部客户机内存】,这是 GPU 直通的强制要求,否则虚拟机无法开机;
  4. 进入【虚拟机选项】→【高级】→【配置参数】,添加以下两条参数:
    pciPassthru.use64bitMMIO = "TRUE"
    pciPassthru.64bitMMIOSizeGB = "64"
    
    (64GB 为通用值,可根据 GPU 显存大小调整,通常为显存的 2 倍)
  5. 禁用【UEFI 安全引导】,避免驱动安装失败。

4.4 第四步:虚拟机内安装驱动

  1. 启动虚拟机,进入操作系统;
  2. NVIDIA GPU:下载并安装对应版本的 NVIDIA 官方驱动,Linux 系统需先禁用开源 nouveau 驱动;
  3. AMD GPU:Windows 系统安装 Radeon Pro 驱动,Linux 系统安装 ROCm 驱动套件;
  4. 安装完成后重启虚拟机,通过nvidia-smirocm-smi命令验证 GPU 是否正常识别。

五、关键注意事项与避坑指南

  1. 单 GPU 独占原则:一块物理 GPU 只能直通给一台虚拟机使用,无法同时分配给多台虚拟机;
  2. 主机无法使用直通 GPU:开启直通后,ESXi 主机将失去对 GPU 的控制权,无法再使用 GPU 输出显示;
  3. ESXi 版本匹配:新架构 GPU 需要搭配最新版 ESXi,如 RTX 40 系列需 ESXi 8.0 U2 及以上;
  4. 内存必须全部预留:虚拟机内存必须 100% 预留,否则会出现 “内存设置无效” 报错;
  5. 避免跨主机迁移:直通 GPU 的虚拟机不支持 vMotion 热迁移,只能冷迁移。

六、常见问题解决

6.1 虚拟机开机提示 “错误 43”

这是 NVIDIA 消费级卡最常见的问题,解决方法:在虚拟机配置参数中添加hypervisor.cpuid.v0 = "FALSE",隐藏虚拟化标识。

6.2 虚拟机无法开机,提示 “模块 DevicePowerOn 打开电源失败”

检查是否已预留全部内存、是否开启了 Above 4G Decoding、MMIO 大小是否设置正确。

6.3 ESXi 无法识别 GPU 设备

检查 GPU 是否正确安装在 PCIe 插槽中,确认主板 BIOS 已开启 PCIe 设备枚举,尝试更换 PCIe 插槽。

七、全文总结

ESXi 对 GPU 直通的支持非常完善,核心兼容型号为 NVIDIA V100/A100/RTX 全系列和 AMD S7150/MI 系列,覆盖从企业级数据中心到个人用户的所有场景。配置流程主要分为 BIOS 设置、ESXi 端开启直通、虚拟机配置、驱动安装四个步骤,只要严格按照规范操作,就能获得接近原生的 GPU 性能。日常运维中需注意单 GPU 独占、内存预留等关键事项,避免出现常见故障,保障 GPU 虚拟化环境稳定运行。

Logo

免费领 100 小时云算力,进群参与显卡、AI PC 幸运抽奖

更多推荐