logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【全志开发板部署】系列5:LPRNet汽车车牌识别模型部署后处理中的CTC解码算法

CTC解码算法用于解决序列学习中标签与预测值对齐问题,广泛应用于语音识别和文本识别领域。文章介绍了两种主流算法:贪心解码(Greedy Decode)每次选取当前时刻最大概率字符,计算简单但可能忽略多条路径概率总和;束搜索(Beam Search)则保留多个候选路径,通过概率累积获得更优结果,计算复杂度较高。实际应用中,由于实时性要求,通常采用计算效率更高的贪心解码算法。该技术有效解决了变长序列、

文章图片
#汽车#算法#深度学习 +1
【全志开发板部署】系列1:LPRNet数据集制作简要说明

本文简要说明LPRNet数据集的制作过程:1)从LPRNet模型仓库中选取10张代表性车牌图片作为样本;2)编写dataset.txt文件记录样本图片的相对路径;3)将图片数据集和txt文件统一放置在awnpu_model_zoo\examples\dataset\LICENSE_PLATE_10文件夹下。该数据集主要用于后续模型配置文件的引用。整个过程简单清晰,便于快速构建小型车牌识别测试数据集

文章图片
#深度学习#人工智能#目标检测 +1
【全志开发板部署】系列0:LPRNet模型简要说明

《LPRNet:基于全卷积网络的无分割车牌识别方法》提出了一种轻量级端到端车牌识别方案,其核心创新在于:1)首次采用纯卷积结构(不含RNN)实现实时识别,计算量仅0.34GFLOPs;2)通过CTCLoss直接处理变长车牌,支持复杂格式(如中国车牌);3)结合全局上下文模块增强特征表达。该网络在94×24像素输入下达到95%准确率,CPU推理仅1.3ms/张,并创新性地采用两阶段训练策略(先收敛识

文章图片
#深度学习#人工智能#目标检测
【全志开发板部署】系列2:LPRNet模型推理环境搭建及推理流程

本文介绍了LPRNet车牌识别模型的推理测试方法,包括PyTorch和ONNX两种格式的实现。主要内容包括:1. 环境配置要求,需安装PyTorch、OpenCV等依赖库;2. PyTorch模型测试流程,展示模型加载、推理和结果可视化方法;3. ONNX模型转换和推理实现,使用ONNX Runtime进行加速推理;4. 常见问题解决方案,如Numpy版本兼容性问题处理。测试结果显示模型在车牌识别

文章图片
#深度学习#人工智能#计算机视觉
【全志开发板部署】系列4:LPRNet汽车车牌识别模型部署常见问题及排查指南

摘要:本文解答了关于模型推理中前后处理配置的三个常见问题。首先指出MEAN和SCALE值可在原代码的load_data.py预处理部分找到;其次详细介绍了通过张量对齐方法验证前后处理正确性的四步排查流程;最后提供了修改config_model.yml文件的三种思路:调整mean/std值、分别验证前后处理。这些方法可有效解决板端推理结果错误的问题。

文章图片
#开发语言#人工智能#目标检测 +1
【全志开发板部署】系列3:LPRNet模型转换及部署流程(全网最详细版)

本文介绍了LPRNet模型的快速部署流程,包括环境配置、模型转换和配置文件设置。首先需要从指定网址下载资源并配置Docker环境。模型结构包含预处理、后处理和主程序等组件。模型转换需在配置好的Python环境下将.pth模型转为onnx格式,并修改相关路径参数。配置文件中需根据代码设置mean值为127.5,scale值为0.0078125(1/128)。文章还提供了完整的config_yml.p

文章图片
#深度学习#人工智能#目标检测 +1
【全志开发板部署】系列5:LPRNet汽车车牌识别模型部署后处理中的CTC解码算法

CTC解码算法用于解决序列学习中标签与预测值对齐问题,广泛应用于语音识别和文本识别领域。文章介绍了两种主流算法:贪心解码(Greedy Decode)每次选取当前时刻最大概率字符,计算简单但可能忽略多条路径概率总和;束搜索(Beam Search)则保留多个候选路径,通过概率累积获得更优结果,计算复杂度较高。实际应用中,由于实时性要求,通常采用计算效率更高的贪心解码算法。该技术有效解决了变长序列、

文章图片
#汽车#算法#深度学习 +1
到底了