HY_will 个人主页

@HY_will

HY_will

2023-08-04 14:39:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

vllm 重新梳理cpu源码安装(版本0.21.0) (小白级文档)

本文介绍了vLLM 0.21.0版本的源码编译安装方法。主要内容包括：1) 基于官方Dockerfile.cpu文件准备基础镜像，重点说明了PATH环境变量的配置变化；2) 详细描述了镜像构建(docker build)和容器运行命令；3) 在容器内执行uvpip安装依赖和源码编译的具体步骤；4) 最后系统讲解了Dockerfile中关键指令的作用和使用方法，包括WORKDIR、ARG、ENV、R

vllm -- 源码剖析5 (serve启动方式--headless) 小白级教程

今天来详细剖析，serve三种启动方式之一的headless无头模式入口函数(api_server_count小于1时)启动命令: vllm serve --headless但是会出现报错RuntimeError: Did not receive response from front-end process within 5 minutes，目前还没找错误原因。哪位大佬知道可以指导我一下。多AP

vllm -- 源码剖析5 (serve启动方式--headless) 小白级教程

vllm -- 源码剖析4 (serve启动流程) 小白级教程

这篇文章分析了vLLM框架中启动本地OpenAI兼容API服务的核心逻辑。主要包括：1) 通过命令行参数控制模型加载（默认使用Qwen3-0.6B）；2) 支持gRPC和HTTP两种协议；3) 参数校验机制（如headless模式与api_server_count互斥、负载均衡模式冲突检测）；4) 自动设置api_server_count默认值；5) 根据参数选择不同启动模式（无API/单实例/多

vllm -- 源码剖析4 (serve启动流程) 小白级教程

声明: 纯兴趣爱好，如有疏漏敬请谅解。

vllm -- 源码学习2 (main.py) (小白级教程)

本文分析了vLLM项目v0.21.0版本的命令行入口源码main.py。该文件作为vLLM的命令行启动入口，主要功能是根据传入参数进行函数分发。文章梳理了核心流程：1)定义CMD_MODULES模块列表；2)设置环境变量；3)创建命令行解析器；4)关联子命令与对应模块；5)根据参数执行分发逻辑。同时总结了Python相关知识点，包括函数内import、sys.argv、__all__作用、魔法方法

#学习

vllm -- 源码学习2 (main.py) (小白级教程)

#学习

vllm -- 调用vllm(离线方式) (小白级教程)

上一篇介绍完如何在cpu下安装vllm，接下来介绍如何调用vllm。参照官方文档，调用vllm的demo代码分为两大类。第一类: 直接在python代码内部调用vllm，即: 离线方式。第二类: 通过http调用vllm，即: 在线方式。掌握了第二种方式，就可以构建一个简单的大模型应用了。今天我们只介绍离线方式，代码也很简单。

vllm概要 + cpu安装、运行(小白级文档)

VLLM是一个高效、低成本的大语言模型推理服务框架，专为LLM在线推理设计。本文提供了在Linux系统下基于Docker的VLLM安装指南：首先通过Dockerfile构建包含Python 3.12和必要依赖的Ubuntu基础镜像；然后使用uv管理Python环境，从源码编译安装VLLM（指定CPU版本）；最后启动服务测试运行。整个过程涉及Docker容器创建、虚拟环境配置和VLLM源码编译，适合

到底了