MacOS下Ollama运行Qweb3:8b模型

xiliuhu

78人浏览 · 2026-01-23 00:08:22

xiliuhu · 2026-01-23 00:08:22 发布

1 下载ollama

https://ollama.com/

2 下载模型

3 查看下载的模型

执行命令

ollama list

显示如下，已经下载了qweb3:8b模型

4 以命令形式运行模型

export OLLAMA_HOST="0.0.0.0:11434"
ollama serve

5 以curl命令调用接口

curl http://127.0.0.1:11434/api/generate -d '{
  "model": "qwen3:8b",
  "prompt": "请用中文解释一下人工智能是什么？",
  "stream": true
}'

"stream": true，是流式输出

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

FlagOS Day 0 跨芯适配 GLM-5.2：发布即覆盖四款芯片，支持 vLLM + SGLang双插件

同时，FlagGems 新增 6 大领域算子库——FlagDNN、FlagBlas、FlagSparse、FlagFFT、FlagTensor、FlagAudio，覆盖科学计算与信号处理场景，共计 102 个领域算子，从"大模型专用"走向全领域覆盖。厂商目录放置后由插件自动发现加载，vLLM-Plugin-FL、SGLang-Plugin-FL、Megatron-LM-FL、Transformer