01_Docker 部署 Ollama 模型（支持 NVIDIA GPU）

本文介绍了如何在Windows系统下通过Docker部署Ollama大模型并支持NVIDIA GPU加速。主要内容包括：安装Ubuntu WSL2环境、配置NVIDIA Container Toolkit实现GPU支持、安装Ollama Desktop测试模型运行、使用docker-compose.yml部署Ollama容器，以及测试API调用。该方案让用户能在Windows环境下高效运行大语言模

耀耀_爱编程

113人浏览 · 2025-10-03 15:06:53

耀耀_爱编程 · 2025-10-03 15:06:53 发布

01_Docker 部署 Ollama 模型（支持 NVIDIA GPU）

在本地运行大模型时，Docker + Ollama 是非常方便的选择。
不过如果你需要调用显卡加速，就必须正确配置 WSL2 + NVIDIA Container Toolkit。
本文将完整梳理安装流程，并提供可直接使用的 docker-compose.yml 配置。

1️⃣ 安装 Ubuntu WSL2

首先需要一个完整的 Linux 环境，这里使用 Ubuntu WSL2。

在 PowerShell（管理员模式） 中执行：

wsl --install -d Ubuntu

自动安装最新的 Ubuntu，并启用 WSL2 内核。
安装完成后，首次进入会提示你创建用户名和密码。

查看当前已安装的发行版：

wsl -l -v

2️⃣ 启动并配置 Ubuntu

进入 Ubuntu 环境：

wsl -d Ubuntu

在 Ubuntu 内更新环境：

sudo apt update
sudo apt install -y curl gnupg

3️⃣ 安装 NVIDIA Container Toolkit

如果要让 Docker 使用 GPU，需要安装 NVIDIA Container Toolkit。

🔹 验证是否已支持 GPU

运行测试命令：

docker run --rm --gpus all nvidia/cuda:12.3.0-base-ubuntu22.04 nvidia-smi

成功：输出与你本机 nvidia-smi 类似的 GPU 信息。
失败（如提示 could not select device driver "nvidia"）：说明需要安装 Toolkit。

🔹 安装 Toolkit（WSL2 内执行）

# 添加 NVIDIA 软件源
curl -fsSL https://mirrors.ustc.edu.cn/libnvidia-container/gpgkey | \
  sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg

curl -s -L https://mirrors.ustc.edu.cn/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
  sed 's#deb https://nvidia.github.io#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://mirrors.ustc.edu.cn#g' | \
  sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 安装 Toolkit
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit

# 配置 Docker
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

⚠️ 提示：在 Windows 主机 上，也要确认 Docker Desktop 已启用 WSL 2 后端（Settings > General > Use WSL 2 based engine），并且勾选了 GPU 选项。

4️⃣ 安装 Ollama Desktop（可选）

在 Windows 上可以先安装 Ollama Desktop，用来测试模型运行。

例如运行一个模型：

ollama run qwen2:7b

如果模型下载卡在 100% 或报错超时，记得配置代理。

测试运行是否正常，例如：

ollama run qwen2:7b --prompt "你好，请自我介绍一下"

5️⃣ Docker 部署 Ollama

下面是一个完整的 docker-compose.yml 配置，支持 GPU 加速。

version: '3.8'

services:
  ollama:
    image: ollama/ollama:latest
    container_name: ollama
    restart: unless-stopped
    ports:
      - "11434:11434"   # Ollama API 端口
    volumes:
      - E:/ollama/models:/root/.ollama/models   # 模型目录映射
    runtime: nvidia
    environment:
      - OLLAMA_HOST=0.0.0.0:11434
      - OLLAMA_ORIGINS=*
      - NVIDIA_VISIBLE_DEVICES=all
      - NVIDIA_DRIVER_CAPABILITIES=compute,utility

启动容器：

docker-compose up -d

6️⃣ 测试 Ollama API

容器启动后，可以直接通过 API 调用模型：

curl http://localhost:11434/api/generate -d '{
  "model": "qwen2:7b",
  "prompt": "写一首关于秋天的诗"
}'

如果能得到正常返回，说明部署成功 🎉。

✅ 总结

安装 WSL2 + Ubuntu
配置 NVIDIA Container Toolkit，让 Docker 支持 GPU
安装 Ollama（Desktop 或 Docker）
通过 docker-compose.yml 部署并运行

这样，你就能在 Windows 上用 Docker + GPU 运行大模型了 🚀。

北京朝阳AI社区

更多推荐

深度学习前沿技术全景解析 —— 设计思想、源码剖析与业务落地

迁移学习与预训练模型通过知识迁移，大幅提升新任务表现。生成对抗网络实现高质量数据生成，激发创新应用。强化学习智能体自适应环境，推动自动决策技术落地。大模型与多模态学习突破单一信息壁垒，赋能复杂场景理解与生成。迁移换头，冻结微调；真假对抗，交替优化；Q表迭代，奖励驱动；编码融合，智能生成。善用预训练，巧用Prompt，关注资源优化，监控训练曲线。结合主流框架、部署工具，实现模型高效落地。未来趋势：更

北京朝阳AI社区

《大模型多场景应用：同一模型适配客服、营销、运营的技巧》

北京朝阳AI社区

光络云携IPIPGO与天启HTTP亮相2025云栖大会，全球代理IP解决方案引关注

据悉，展会期间光络云累计接待了1000余位专业客户，达成多个深度合作意向，并与多家AI企业签订了LLM数据采集合作协议，展现出其全球代理IP服务在市场上的强劲需求。"这就是为什么越来越多的AI公司选择我们，"现场光络云技术人员解释道，"我们专门为大规模数据采集进行了优化。"一位尝试直播的观众惊呼，"几乎感受不到任何卡顿和延迟。云计算与AI正重塑全球商业landscape，光络云的AI大模型训练、S