以下是简洁精确的 Ollama 使用指南,仅保留核心命令和常用功能:

Ollama 核心命令速查

# 基础操作
ollama serve             # 启动服务(默认端口11434)
ollama run <模型名>      # 运行模型(自动下载)示例:ollama run llama3
ollama pull <模型名>     # 手动下载模型
ollama list             # 查看本地模型
ollama rm <模型名>       # 删除模型
ollama ps               # 查看运行中的实例

# 自定义模型
ollama create -f Modelfile  # 创建自定义模型
ollama cp <源模型> <新名>  # 复制模型

常用模型示例

ollama run llama3          # Meta通用模型
ollama run deepseek-coder  # 代码生成专用
ollama run qwen:7b         # 阿里多语言模型
ollama run phi3-mini       # 轻量级模型(4GB内存即可)

交互模式快捷命令

/set temperature 0.5  # 调整创造性(0-1)
/clear                # 清空对话上下文
/load <模型名>         # 热切换模型
/bye                  # 退出交互

基础配置说明

修改模型存储路径:

# Linux/macOS
export OLLAMA_MODELS=/new/path/models

# Windows(管理员PowerShell)
[Environment]::SetEnvironmentVariable("OLLAMA_MODELS", "D:\ollama\models", "Machine")

简单 Modelfile 示例

FROM llama3
SYSTEM "你是个专业技术顾问,回答要简洁准确"
PARAMETER temperature 0.3

问题解决

# 卡下载时重试
Ctrl+C → ollama pull <模型名>

# 启用详细日志
ollama run <模型> --verbose

API快速调用

import openai
client = openai.OpenAI(base_url="http://localhost:11434/v1", api_key="any")
response = client.chat.completions.create(
    model="llama3",
    messages=[{"role": "user", "content": "解释量子力学"}]
)

关键提示:

  1. 首次运行自动下载模型(约2-4GB)
  2. Windows需管理员权限运行
  3. 查看模型列表:
  4. 常见错误:端口11434被占用时更换 OLLAMA_HOST=新端口
Logo

免费领 100 小时云算力,进群参与显卡、AI PC 幸运抽奖

更多推荐