Ollama 核心命令速查

Ollama 简明使用指南核心功能：基础命令：run/pull/list/rm 管理模型常用模型：llama3/deepseek-coder/qwen等交互命令：/set//clear//bye调整会话支持自定义模型和API调用（默认端口11434）使用注意：首次运行自动下载模型（2-4GB） Windows需管理员权限可修改存储路径和环境变量包含模型管理、交互控制、API调用和

Font Tian

1092人浏览 · 2025-08-13 11:31:21

Font Tian · 2025-08-13 11:31:21 发布

以下是简洁精确的 Ollama 使用指南，仅保留核心命令和常用功能：

Ollama 核心命令速查

# 基础操作
ollama serve             # 启动服务（默认端口11434）
ollama run <模型名>      # 运行模型（自动下载）示例：ollama run llama3
ollama pull <模型名>     # 手动下载模型
ollama list             # 查看本地模型
ollama rm <模型名>       # 删除模型
ollama ps               # 查看运行中的实例

# 自定义模型
ollama create -f Modelfile  # 创建自定义模型
ollama cp <源模型> <新名>  # 复制模型

常用模型示例

ollama run llama3          # Meta通用模型
ollama run deepseek-coder  # 代码生成专用
ollama run qwen:7b         # 阿里多语言模型
ollama run phi3-mini       # 轻量级模型（4GB内存即可）

交互模式快捷命令

/set temperature 0.5  # 调整创造性（0-1）
/clear                # 清空对话上下文
/load <模型名>         # 热切换模型
/bye                  # 退出交互

基础配置说明

修改模型存储路径:

# Linux/macOS
export OLLAMA_MODELS=/new/path/models

# Windows（管理员PowerShell）
[Environment]::SetEnvironmentVariable("OLLAMA_MODELS", "D:\ollama\models", "Machine")

简单 Modelfile 示例

FROM llama3
SYSTEM "你是个专业技术顾问，回答要简洁准确"
PARAMETER temperature 0.3

问题解决

# 卡下载时重试
Ctrl+C → ollama pull <模型名>

# 启用详细日志
ollama run <模型> --verbose

API快速调用

import openai
client = openai.OpenAI(base_url="http://localhost:11434/v1", api_key="any")
response = client.chat.completions.create(
    model="llama3",
    messages=[{"role": "user", "content": "解释量子力学"}]
)

关键提示：

首次运行自动下载模型（约2-4GB）

Windows需管理员权限运行

查看模型列表：

常见错误：端口11434被占用时更换 OLLAMA_HOST=新端口

加入AMD AI开发者计划！

免费领 100 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

Spring AI Ollama 连接超时问题排查与解决：OkHttp 读超时配置全指南

摘要： Spring AI Ollama 集成时出现 HTTP 连接超时问题，表现为调用聊天接口时在10秒左右报错。根本原因是存在两层独立超时机制：模型层超时（spring.ai.ollama.chat.options.timeout）仅控制服务端生成时间，而底层 OkHttp 客户端的默认读超时（10秒）会先触发中断。解决方案包括两种：1）通过 okhttp.read-timeout 全局配置延

AMD开发者中国社区

别再只用GCN了！用PyTorch Geometric实战有向图卷积网络DGCN（附代码）

本文介绍了如何使用PyTorch Geometric实现有向图卷积网络(DGCN)，突破传统GCN在处理有向图数据时的局限性。通过构建三重信息捕获机制（一阶邻近矩阵、二阶入度邻近和二阶出度邻近），DGCN能有效捕捉有向图中的方向性信息，提升节点分类等任务的准确率。文章包含完整的PyG实战代码，适用于社交网络分析、金融交易追踪等场景。