logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【转载+修改】 ollama多显卡都用上,实现负载均衡

添加这两行:Environment="CUDA_VISIBLE_DEVICES=0,1" Environment="OLLAMA_SCHED_SPREAD=1"Environment="CUDA_VISIBLE_DEVICES=0,1" 代表让ollama能识别到第几张显卡。Environment="OLLAMA_KEEP_ALIVE=-1" 模型一直加载, 不自动卸载。Environment="

#负载均衡#运维
到底了