qwen(通义千问)是阿里巴巴推出的一系列大语言模型。和 codex 一样,它本身不是一个可以直接在终端运行的 .exe 程序。你不能直接输入 qwen 来启动它。

要使用 Qwen 模型,通常有以下几种方式,请根据你的需求选择:

情况一:你想在本地运行 Qwen 模型(推荐用于开发/测试)

如果你想在本地电脑上运行 Qwen 模型(例如 Qwen2.5, Qwen-Max 等),你需要借助第三方工具来加载模型文件。目前最流行且简单的方法是使用 OllamaLM Studio

方案 A:使用 Ollama(最简单,命令行友好)
  1. 下载并安装 Ollama:
    访问 ollama.com 下载 Windows 版并安装。

  2. 拉取 Qwen 模型:
    安装完成后,打开新的 PowerShell 窗口,运行以下命令下载 Qwen 模型(以最新的 Qwen2.5 为例):

    ollama run qwen2.5
    

    注:第一次运行会自动下载模型文件,文件大小取决于版本(几GB到几十GB不等)。

  3. 开始对话:
    下载完成后,你就可以直接在终端里和 Qwen 对话了。

方案 B:使用 Python 调用 (Transformers / vLLM)

既然你在 E:\Project_Soft\Python\... 目录下,你可能想用 Python 代码调用它:

  1. 安装依赖:

    pip install transformers torch accelerate
    
  2. 编写 Python 脚本(例如 run_qwen.py)来加载模型,而不是直接在终端输入 qwen


情况二:你想通过 API 使用云端的 Qwen

如果你不想本地部署,而是想调用阿里云的 API:

  1. 你需要去 阿里云百炼平台 获取 API Key。

  2. 安装阿里云的 SDK:

    pip install dashscope
    
  3. 编写 Python 脚本来发送请求。同样,没有直接的 qwen 命令。


情况三:你是否记错了命令?

  • VS Code? 再次确认,如果你是想打开编辑器,命令是 code
  • 其他工具? 是否有某个特定的、名字里带 “qwen” 的小众 CLI 工具是你之前听说过的?如果有,请告诉我它的全名或来源,我可以帮你查找具体的安装命令。

总结

直接输入 qwen 是行不通的。

  • 如果你想立刻在终端体验:请安装 Ollama 然后运行 ollama run qwen2.5
  • 如果你是开发者:请使用 Python (pip install dashscopetransformers) 编写代码来调用。

在 Windows 上安装 Ollama 并运行 Qwen2.5 模型非常简单。请按照以下步骤操作:

第一步:下载并安装 Ollama

  1. 访问官网
    打开浏览器,访问 Ollama 官方网站
  2. 下载 Windows 版
    点击页面上的 “Download” 按钮(通常会自动识别为 Windows),或者直接进入 下载页面 下载安装包 (OllamaSetup.exe)。
  3. 运行安装程序
    • 双击下载好的 OllamaSetup.exe
    • 安装过程中会提示是否将 Ollama 添加到用户环境变量,请务必确认安装成功(通常默认选项即可)。
    • 安装完成后,Ollama 会在后台运行(你可以在任务栏右下角的托盘图标中看到它的小羊驼图标)。

第二步:验证安装

安装完成后,关闭当前的 PowerShell 窗口,重新打开一个新的 PowerShell 窗口(这一步很重要,为了让新的环境变量生效)。

输入以下命令检查版本:

ollama --version

如果显示了版本号(例如 ollama version 0.x.x),说明安装成功。

第三步:下载并运行 Qwen2.5 模型

Ollama 的模型库中已经收录了阿里通义千问(Qwen)系列。你可以直接通过一条命令拉取并运行。

1. 运行最新版 Qwen2.5 (推荐)

在 PowerShell 中输入:

ollama run qwen2.5
  • 首次运行:Ollama 会自动从网络下载 Qwen2.5 的默认版本(通常是 7B 参数量,约 4-5GB)。下载速度取决于你的网络环境。
  • 下载完成后:终端会显示 success,然后直接进入对话模式。你可以直接输入中文或英文与它交流。
    • 尝试输入:你好,请用 Python 写一个快速排序算法。
    • 退出对话:输入 /bye 或按 Ctrl + D
2. 运行特定大小的版本 (可选)

如果你的电脑显存(GPU VRAM)有限,或者想要更聪明的模型,可以选择不同参数量的版本:

  • 轻量版 (适合低配电脑/纯CPU):

    ollama run qwen2.5:1.5b
    # 或者
    ollama run qwen2.5:3b
    
  • 高性能版 (需要较大显存,建议 16GB+ VRAM):

    ollama run qwen2.5:14b
    # 或者
    ollama run qwen2.5:32b
    
  • 代码专用版 (如果你主要用来写代码):
    Qwen2.5-Coder 系列对编程优化更好:

    ollama run qwen2.5-coder
    

第四步:常用管理命令

在安装和使用过程中,你可能需要用到以下命令:

  • 查看已下载的模型

    ollama list
    
  • 删除模型 (如果空间不足):

    ollama rm qwen2.5
    
  • 更新模型

    ollama pull qwen2.5
    

常见问题与优化

  1. 下载速度慢/失败
    Ollama 的模型托管在 Hugging Face 等服务器上,国内直接下载可能很慢或中断。

    • 解决方法:配置镜像源。在运行 ollama pull 之前,设置环境变量:

      $env:OLLAMA_HOST="http://127.0.0.1:11434"
      # 如果需要配置具体的镜像地址,通常需要修改 Ollama 的服务配置或使用代理工具
      

      更简单的做法:如果下载卡住,可以尝试使用科学上网工具,或者寻找国内的 Ollama 镜像站(如 ollama.modelscope.cn,需配置 OLLAMA_ORIGINS 或直接替换下载源,具体视 Ollama 版本支持情况而定,目前最稳妥的方式仍是保持网络通畅或使用代理)。

  2. 运行速度慢

    • Qwen2.5 (7B) 模型建议至少有 8GB 内存 (纯 CPU 运行较慢) 或 6GB 显存 (NVIDIA GPU 运行飞快)。
    • 如果只有 CPU,建议使用 qwen2.5:1.5bqwen2.5:3b 版本。
    • 确保你的显卡驱动是最新的。
  3. 如何在代码中使用?
    安装好 Ollama 后,你可以使用 Python 轻松调用本地模型:

    pip install ollama
    
    import ollama
    
    response = ollama.chat(model='qwen2.5', messages=[
      {
        'role': 'user',
        'content': '为什么天空是蓝色的?',
      },
    ])
    print(response['message']['content'])
    

现在,你可以试着在 PowerShell 中输入 ollama run qwen2.5 开始体验了!

Logo

免费领 100 小时云算力,进群参与显卡、AI PC 幸运抽奖

更多推荐