logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【OCR】文本识别模型训练前置工作——合成图片数据生成

主要是用来针对PaddleOCR的文本识别模型训练数据生成说明,当然,其他的文本识别模型也能有所借鉴。

#python#计算机视觉#paddle
【OCR】OCR前置工作——透视矫正,使用YOLOv8-pose分支在卡证文档图片上进行yolo关键点检测

主要就是针对卡证文档等图片进行OCR推理,需要识别的信息因为拍摄或者扫描问题,导致信息与图片不在同一个水平面上,然后就需要一个预处理——透视矫正。使用yolov8-pose训练一个关键点检测模型。

#图像处理#计算机视觉
到底了