vLLM启动项目并输出到日志
vLLM启动项目并输出到日志
·
vLLM启动项目并输出到日志
CUDA_VISIBLE_DEVICES=1 nohup vllm serve /llm_models/Qwen3-32B \
--served-model-name Qwen3-32B \
--gpu_memory_utilization 0.95 \
--tensor-parallel-size 1 \
--max-model-len 32768 \
--port 7562 \
--enable-reasoning --reasoning-parser deepseek_r1 \
--device cuda \
&> /llm_models/Qwen3-32B/Qwen3-32B.log &
更多推荐


所有评论(0)