如何安装Ollama并使用Qwen模型

如何安装Ollama并使用Qwen模型。

千江明月

1195人浏览 · 2026-03-13 23:01:11

千江明月 · 2026-03-13 23:01:11 发布

qwen（通义千问）是阿里巴巴推出的一系列大语言模型。和 codex 一样，它本身不是一个可以直接在终端运行的 .exe 程序。你不能直接输入 qwen 来启动它。

要使用 Qwen 模型，通常有以下几种方式，请根据你的需求选择：

情况一：你想在本地运行 Qwen 模型（推荐用于开发/测试）

如果你想在本地电脑上运行 Qwen 模型（例如 Qwen2.5, Qwen-Max 等），你需要借助第三方工具来加载模型文件。目前最流行且简单的方法是使用 Ollama 或 LM Studio。

方案 A：使用 Ollama（最简单，命令行友好）

下载并安装 Ollama:
访问 ollama.com 下载 Windows 版并安装。
拉取 Qwen 模型:
安装完成后，打开新的 PowerShell 窗口，运行以下命令下载 Qwen 模型（以最新的 Qwen2.5 为例）：
```
ollama run qwen2.5
```
注：第一次运行会自动下载模型文件，文件大小取决于版本（几GB到几十GB不等）。
开始对话:
下载完成后，你就可以直接在终端里和 Qwen 对话了。

方案 B：使用 Python 调用 (Transformers / vLLM)

既然你在 E:\Project_Soft\Python\... 目录下，你可能想用 Python 代码调用它：

安装依赖：

pip install transformers torch accelerate

编写 Python 脚本（例如 run_qwen.py）来加载模型，而不是直接在终端输入 qwen。

情况二：你想通过 API 使用云端的 Qwen

如果你不想本地部署，而是想调用阿里云的 API：

你需要去阿里云百炼平台获取 API Key。
安装阿里云的 SDK：
```
pip install dashscope
```
编写 Python 脚本来发送请求。同样，没有直接的 qwen 命令。

情况三：你是否记错了命令？

VS Code? 再次确认，如果你是想打开编辑器，命令是 code。
其他工具? 是否有某个特定的、名字里带 “qwen” 的小众 CLI 工具是你之前听说过的？如果有，请告诉我它的全名或来源，我可以帮你查找具体的安装命令。

总结

直接输入 qwen 是行不通的。

如果你想立刻在终端体验：请安装 Ollama 然后运行 ollama run qwen2.5。
如果你是开发者：请使用 Python (pip install dashscope 或 transformers) 编写代码来调用。

在 Windows 上安装 Ollama 并运行 Qwen2.5 模型非常简单。请按照以下步骤操作：

第一步：下载并安装 Ollama

访问官网：
打开浏览器，访问 Ollama 官方网站。
下载 Windows 版：
点击页面上的 “Download” 按钮（通常会自动识别为 Windows），或者直接进入下载页面下载安装包 (OllamaSetup.exe)。
运行安装程序：
- 双击下载好的 OllamaSetup.exe。
- 安装过程中会提示是否将 Ollama 添加到用户环境变量，请务必确认安装成功（通常默认选项即可）。
- 安装完成后，Ollama 会在后台运行（你可以在任务栏右下角的托盘图标中看到它的小羊驼图标）。

第二步：验证安装

安装完成后，关闭当前的 PowerShell 窗口，重新打开一个新的 PowerShell 窗口（这一步很重要，为了让新的环境变量生效）。

输入以下命令检查版本：

ollama --version

如果显示了版本号（例如 ollama version 0.x.x），说明安装成功。

第三步：下载并运行 Qwen2.5 模型

Ollama 的模型库中已经收录了阿里通义千问（Qwen）系列。你可以直接通过一条命令拉取并运行。

1. 运行最新版 Qwen2.5 (推荐)

在 PowerShell 中输入：

ollama run qwen2.5

首次运行：Ollama 会自动从网络下载 Qwen2.5 的默认版本（通常是 7B 参数量，约 4-5GB）。下载速度取决于你的网络环境。
下载完成后：终端会显示 success，然后直接进入对话模式。你可以直接输入中文或英文与它交流。
- 尝试输入：你好，请用 Python 写一个快速排序算法。
- 退出对话：输入 /bye 或按 Ctrl + D。

2. 运行特定大小的版本 (可选)

如果你的电脑显存（GPU VRAM）有限，或者想要更聪明的模型，可以选择不同参数量的版本：

轻量版 (适合低配电脑/纯CPU):

ollama run qwen2.5:1.5b
# 或者
ollama run qwen2.5:3b

高性能版 (需要较大显存，建议 16GB+ VRAM):

ollama run qwen2.5:14b
# 或者
ollama run qwen2.5:32b

代码专用版 (如果你主要用来写代码):
Qwen2.5-Coder 系列对编程优化更好：
```
ollama run qwen2.5-coder
```

第四步：常用管理命令

在安装和使用过程中，你可能需要用到以下命令：

查看已下载的模型：
```
ollama list
```
删除模型 (如果空间不足)：
```
ollama rm qwen2.5
```
更新模型：
```
ollama pull qwen2.5
```

常见问题与优化

下载速度慢/失败：
Ollama 的模型托管在 Hugging Face 等服务器上，国内直接下载可能很慢或中断。
- 解决方法：配置镜像源。在运行 ollama pull 之前，设置环境变量：
```
$env:OLLAMA_HOST="http://127.0.0.1:11434"
# 如果需要配置具体的镜像地址，通常需要修改 Ollama 的服务配置或使用代理工具
```
  更简单的做法：如果下载卡住，可以尝试使用科学上网工具，或者寻找国内的 Ollama 镜像站（如 ollama.modelscope.cn，需配置 OLLAMA_ORIGINS 或直接替换下载源，具体视 Ollama 版本支持情况而定，目前最稳妥的方式仍是保持网络通畅或使用代理）。
运行速度慢：
- Qwen2.5 (7B) 模型建议至少有 8GB 内存 (纯 CPU 运行较慢) 或 6GB 显存 (NVIDIA GPU 运行飞快)。
- 如果只有 CPU，建议使用 qwen2.5:1.5b 或 qwen2.5:3b 版本。
- 确保你的显卡驱动是最新的。

如何在代码中使用？
安装好 Ollama 后，你可以使用 Python 轻松调用本地模型：

pip install ollama

import ollama

response = ollama.chat(model='qwen2.5', messages=[
  {
    'role': 'user',
    'content': '为什么天空是蓝色的？',
  },
])
print(response['message']['content'])

现在，你可以试着在 PowerShell 中输入 ollama run qwen2.5 开始体验了！

加入AMD AI开发者计划！

免费领 100 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

解锁AMD Ryzen处理器隐藏性能：SMUDebugTool完全指南

你是否曾好奇，为什么你的AMD Ryzen处理器没有发挥出全部潜力？为什么别人的同款CPU能跑出更高的分数？答案可能就藏在那些默认设置中。今天，我要向你介绍一款能让你完全掌控AMD Ryzen处理器的神奇工具——SMUDebugTool。这款免费开源的硬件调试工具，专门为AMD Ryzen用户设计，让你从普通用户变成硬件调校专家。SMUDebugTool是一款功能强大的AMD Ryzen处理器

AMD开发者中国社区

AMD Ryzen终极硬件调试指南：SMUDebugTool专业调优完全实战手册

想要深度掌控AMD Ryzen处理器的每一个核心性能吗？SMUDebugTool这款开源硬件调试工具为技术爱好者和系统优化师提供了前所未有的硬件访问能力。作为专为AMD Ryzen平台设计的专业级调试解决方案，它打破了传统BIOS限制，实现了Windows环境下的实时硬件参数调节与监控。**核心关键词**：AMD Ryzen调试工具、SMUDebugTool硬件调优、Ryzen处理器超频

AMD开发者中国社区

专业级AMD Ryzen硬件调试：SMUDebugTool深度调优完全指南

想要彻底掌控AMD Ryzen处理器的底层性能吗？SMUDebugTool作为一款开源的硬件级调试工具，为技术爱好者和专业用户提供了直接访问处理器核心参数的能力。这款专为AMD Ryzen平台设计的专业调试解决方案，突破了传统BIOS限制，实现了Windows环境下的实时硬件参数调节与监控。无论您是追求极限性能的游戏玩家，还是需要精细控制的系统优化师，SMUDebugTool都能提供前所未有的硬件