
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
SGLang 是一个专为大型语言模型(LLM)和视觉语言模型(VLM)设计的高性能服务框架,旨在提升模型交互的速度与可控性。它融合了高效的后端执行引擎与灵活的前端编程接口,助力构建更强大、智能的 AI 应用。其主要特点包括:RadixAttention 前缀缓存:加速长文本处理零开销 CPU 调度器 & 连续批处理:最大化硬件利用率分页注意力 & 推测解码:提升响应速度支持张量并行、分块预填充:高
调用curl http://127.0.0.1:8000/v1/completions -H "Content-Type: application/json" -d '{ "model": "自己下载模型位置", "prompt": "你好", "max_tokens": 1000, "temperature": 0 }'用anacondaconda环境部署 前提是装好anaconda(在Linu
本文介绍了使用PaddleOCR进行GPU版部署的步骤:1)拉取PaddlePaddle的GPU版本镜像;2)通过docker命令挂载端口和目录;3)在挂载目录中克隆PaddleOCR项目并安装所需环境。最后提供了一个Python示例代码,展示了如何创建OCR服务接口,包括图像读取、文本识别和结果处理功能,支持通过HTTP接口进行OCR识别请求。
本文介绍了使用PaddleOCR进行GPU版部署的步骤:1)拉取PaddlePaddle的GPU版本镜像;2)通过docker命令挂载端口和目录;3)在挂载目录中克隆PaddleOCR项目并安装所需环境。最后提供了一个Python示例代码,展示了如何创建OCR服务接口,包括图像读取、文本识别和结果处理功能,支持通过HTTP接口进行OCR识别请求。







