logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PaddleOCR-VL + vLLM 高性能推理实践:踩坑与调优全记录

本文记录了PaddleOCR-VL结合vLLM高性能推理的实践过程。首先遇到CUDA版本冲突问题,通过强制安装CUDA12.9兼容的vLLM wheel解决。随后发现PaddleOCR-VL高版本模型不支持内置HPI引擎,改用vLLM服务作为后端。在连接阶段,通过统一服务端和客户端的模型名称解决404错误。针对显存不足问题,调整GPU内存利用率为0.6并优化单图片推理配置,包括限制并发序列、降低批

#人工智能#语言模型
PaddleOCR-VL + vLLM 高性能推理实践:踩坑与调优全记录

本文记录了PaddleOCR-VL结合vLLM高性能推理的实践过程。首先遇到CUDA版本冲突问题,通过强制安装CUDA12.9兼容的vLLM wheel解决。随后发现PaddleOCR-VL高版本模型不支持内置HPI引擎,改用vLLM服务作为后端。在连接阶段,通过统一服务端和客户端的模型名称解决404错误。针对显存不足问题,调整GPU内存利用率为0.6并优化单图片推理配置,包括限制并发序列、降低批

#人工智能#语言模型
python主线程捕获子线程异常

import queueimport threadingimport sysdef thread_text(q, i):try:time.sleep(i)raise Exception('子线程异常')except:q.put(sys.exc_info())# time.sleep(1)if __name__ =='__main__':q = queue.Queue()t = threading.

#python#开发语言#后端
pyflinkf初试:table API与 datastream API

tableAPI没啥好说的,就是flinksqldatastreamAPI重点的有几个算子:map:对数据进行函数操作,map传入一个方法,方法入参为整个数据流,但在方法内部以列表的形式处理filter:该算子将按照条件对输入数据集进行筛选操作,将符合条件的数据集输出最重要的就是map,因为map方法能做到一些flinksql做不到的事情:例如:要判断数据大于100,则则发送消息,很显然,在sql

#python#flink
到底了