龙虾Openclaw使用本地大模型调用超时了怎么办?
1.改 Agent 全局超时(默认 10 分钟)2.改 LLM 请求超时(API 调用)3.重启网关 + 新建会话,旧会话会缓存旧配置。4.只保留本地模型,禁用云端模型(避免干扰)二、
·
一、先改 OpenClaw 超时
1.改 Agent 全局超时(默认 10 分钟)
# 设为 30 分钟(推荐)
openclaw config set agents.defaults.timeoutSeconds 1800
# 长任务可设 1 小时
# openclaw config set agents.defaults.timeoutSeconds 3600
2.改 LLM 请求超时(API 调用)
# 设 300 秒(5 分钟),默认一般 60 秒
openclaw config set llm.timeout 300
openclaw config set llm.max_retries 2
3.重启网关 + 新建会话
openclaw gateway restart
必须新建微信对话,旧会话会缓存旧配置。
4.只保留本地模型,禁用云端模型(避免干扰)
# 查看当前模型列表
openclaw models list
# 禁用所有qwen-portal云端模型(只留本地Ollama模型)
openclaw models disable qwen-portal/coder-model
openclaw models disable qwen-portal/vision-model
# 只启用本地Ollama模型
openclaw models enable custom-127-0-0-1-11434/qwen2.5:7b
二、检查 Ollama 连接与状态
# 1. 看 Ollama 是否在跑
ollama list
# 2. 直连测试(排除龙虾问题)
curl http://localhost:11434/api/tags
- 不通:Ollama 没启 / 端口错(默认 11434)
- 很慢:模型没加载 / 硬件瓶颈
三、Ollama 提速
1. 让模型常驻内存(避免反复加载)
# Mac/Linux
export OLLAMA_KEEP_ALIVE=-1
# Windows(PowerShell)
$env:OLLAMA_KEEP_ALIVE=-1
# 然后重启 Ollama
ollama stop
ollama start
2. 强制用 GPU(Mac/Windows/Nvidia)
# 全模型层上 GPU
export OLLAMA_GPU_LAYERS=99
export OLLAMA_NUM_GPU=999
# 然后重启 Ollama
ollama stop
ollama start
四、一键修复脚本
# 1. 配置Ollama常驻内存+全GPU加速
echo 'export OLLAMA_KEEP_ALIVE=-1' >> ~/.zshrc
echo 'export OLLAMA_GPU_LAYERS=99' >> ~/.zshrc
echo 'export OLLAMA_NUM_GPU=999' >> ~/.zshrc
source ~/.zshrc
ollama stop
ollama start
# 2. 拉取稳定的7b量化模型
ollama pull qwen2.5:7b-q4_K_M
# 3. 调整OpenClaw超时配置
openclaw config set llm.timeout 300
openclaw config set llm.max_retries 2
openclaw config set agents.defaults.timeoutSeconds 1800
# 4. 禁用云端模型,只启用本地模型
openclaw models disable qwen-portal/coder-model
openclaw models disable qwen-portal/vision-model
openclaw models enable custom-127-0-0-1-11434/qwen2.5:7b
# 5. 重启网关
openclaw gateway restart
更多推荐





所有评论(0)