
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
【OCR】文本识别模型训练前置工作——合成图片数据生成
主要是用来针对PaddleOCR的文本识别模型训练数据生成说明,当然,其他的文本识别模型也能有所借鉴。
【OCR】OCR前置工作——透视矫正,使用YOLOv8-pose分支在卡证文档图片上进行yolo关键点检测
主要就是针对卡证文档等图片进行OCR推理,需要识别的信息因为拍摄或者扫描问题,导致信息与图片不在同一个水平面上,然后就需要一个预处理——透视矫正。使用yolov8-pose训练一个关键点检测模型。
【PaddleOCR改造】在模型串联部分将文本检测修改为YOLO目标检测
使用YOLO作为PaddleOCR的文本检测模块。
到底了







