不吃天鹅肉个人主页

@weixin_45621200

不吃天鹅肉

2022-06-23 15:32:18 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

PaddleOCR-VL + vLLM 高性能推理实践：踩坑与调优全记录

本文记录了PaddleOCR-VL结合vLLM高性能推理的实践过程。首先遇到CUDA版本冲突问题，通过强制安装CUDA12.9兼容的vLLM wheel解决。随后发现PaddleOCR-VL高版本模型不支持内置HPI引擎，改用vLLM服务作为后端。在连接阶段，通过统一服务端和客户端的模型名称解决404错误。针对显存不足问题，调整GPU内存利用率为0.6并优化单图片推理配置，包括限制并发序列、降低批

#人工智能 #语言模型

PaddleOCR-VL + vLLM 高性能推理实践：踩坑与调优全记录

#人工智能 #语言模型

python主线程捕获子线程异常

import queueimport threadingimport sysdef thread_text(q, i):try:time.sleep(i)raise Exception('子线程异常')except:q.put(sys.exc_info())# time.sleep(1)if __name__ =='__main__':q = queue.Queue()t = threading.

#python #开发语言 #后端

pyflinkf初试：table API与 datastream API

tableAPI没啥好说的，就是flinksqldatastreamAPI重点的有几个算子：map：对数据进行函数操作，map传入一个方法，方法入参为整个数据流，但在方法内部以列表的形式处理filter:该算子将按照条件对输入数据集进行筛选操作，将符合条件的数据集输出最重要的就是map，因为map方法能做到一些flinksql做不到的事情：例如：要判断数据大于100，则则发送消息，很显然，在sql

#python #flink

到底了