m0_71833495 个人主页

@m0_71833495

m0_71833495

2023-12-20 09:17:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

使用SGLang多机多卡部署满血版Deepseek -R1

SGLang 是一个专为大型语言模型（LLM）和视觉语言模型（VLM）设计的高性能服务框架，旨在提升模型交互的速度与可控性。它融合了高效的后端执行引擎与灵活的前端编程接口，助力构建更强大、智能的 AI 应用。其主要特点包括：RadixAttention 前缀缓存：加速长文本处理零开销 CPU 调度器 & 连续批处理：最大化硬件利用率分页注意力 & 推测解码：提升响应速度支持张量并行、分块预填充：高

#java #python #conda +4

Vllm部署deepseek 单机多卡部署

调用curl http://127.0.0.1:8000/v1/completions -H "Content-Type: application/json" -d '{ "model": "自己下载模型位置", "prompt": "你好", "max_tokens": 1000, "temperature": 0 }'用anacondaconda环境部署前提是装好anaconda（在Linu

#python #linux #人工智能

Paddleocr的部署（Linux基于docker容器的方式）

本文介绍了使用PaddleOCR进行GPU版部署的步骤：1)拉取PaddlePaddle的GPU版本镜像；2)通过docker命令挂载端口和目录；3)在挂载目录中克隆PaddleOCR项目并安装所需环境。最后提供了一个Python示例代码，展示了如何创建OCR服务接口，包括图像读取、文本识别和结果处理功能，支持通过HTTP接口进行OCR识别请求。

#docker #容器 #python

Paddleocr的部署（Linux基于docker容器的方式）

#docker #容器 #python

到底了