vLLM启动项目并输出到日志

郭庆汝

373人浏览 · 2025-08-18 19:02:56

郭庆汝 · 2025-08-18 19:02:56 发布

vLLM启动项目并输出到日志

CUDA_VISIBLE_DEVICES=1 nohup vllm serve /llm_models/Qwen3-32B \
        --served-model-name Qwen3-32B \
        --gpu_memory_utilization 0.95 \
        --tensor-parallel-size 1 \
        --max-model-len 32768 \
        --port 7562 \
        --enable-reasoning --reasoning-parser deepseek_r1 \
        --device cuda \
        &> /llm_models/Qwen3-32B/Qwen3-32B.log &

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

FlagOS Day 0 跨芯适配 GLM-5.2：发布即覆盖四款芯片，支持 vLLM + SGLang双插件

同时，FlagGems 新增 6 大领域算子库——FlagDNN、FlagBlas、FlagSparse、FlagFFT、FlagTensor、FlagAudio，覆盖科学计算与信号处理场景，共计 102 个领域算子，从"大模型专用"走向全领域覆盖。厂商目录放置后由插件自动发现加载，vLLM-Plugin-FL、SGLang-Plugin-FL、Megatron-LM-FL、Transformer