love_and_hope 个人主页

@weixin_68930974

love_and_hope

2024-11-05 21:01:34 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Num2：大模型API调用（vLLM高性能部署）+本地部署

虽然使用 transformers 在本地部署模型能让我们获得完整的控制权限，但这种方式存在一定的性能瓶颈，尤其在首次推理时表现明显。这种本地部署方式更适合进行简单模型加载测试或算法研究工作，但若要将模型打造成一个支持高并发调用的服务，其计算效率则显得捉襟见肘。请同学们尝试使用 python 中的 requests 来调用模型服务。: 模型路径，指向本地存储的 Qwen 3.0 6B 模型文件。m

#pytorch #人工智能 #学习 +2

Num2：大模型API调用（vLLM高性能部署）+本地部署

#pytorch #人工智能 #学习 +2

到底了