logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

工业踩坑实录(十七):从40分到高分:工业零件OCR,通用模型一上来就给我打脸

工业零件OCR识别面临独特挑战:通用OCR模型直接应用于金属零件文字识别时准确率仅40%,远低于文档OCR效果。主要问题在于工业文字的特殊性——钢印、激光打标等工艺导致字符变形、对比度低,金属反光和表面纹理造成干扰,文字常呈不规则角度排列。有效解决方案需分三步:1)采用旋转框检测(YOLO OBB)精确定位任意角度文字;2)对裁剪出的文字区域进行仿射变换校正;3)使用专用识别模型处理校正后的文字。

文章图片
#人工智能#算法#python
工业视觉踩坑实录(十三):SOP系列之二,“你们这是帮我们,还是监视我们?”

《工业视觉SOP行为检测的实践与思考》摘要:作者基于10年工业视觉经验,分享了SOP行为检测系统开发中的技术挑战与非技术难题。技术层面,传统状态机架构难以处理模糊动作边界、并行操作和复杂分支流程,需转向事件驱动和时序动作分割模型。更棘手的是系统定位问题——工人质疑"这是帮助还是监视",促使产品从"监控者"转向"数字教练"。作者提出未来方向

文章图片
#算法#python#目标检测
工业视觉踩坑实录(十二):加了假人训练数据,检测模型还是分不清真假人

一个教室,四五十个学生,地上躺着4个假人模特。检测模型全报了,系统一直误报有人躺着。回去加了假人照片做负样本训练,换个新款假人照样误检。试了多模态大模型能分,但四五十个人全送大模型推理,根本跑不动。这篇聊聊为什么检测模型分不了假人,以及为什么大小模型级联这个思路能工作。

文章图片
#人工智能
为什么“聪明”的工程师,反而做不好项目?

《为什么"聪明"的工程师做不好项目?》探讨了技术人才在项目中的思维局限问题。文章指出,许多技术专家虽然专业能力强,却常陷入"一维思考"陷阱——只从自身专业角度解决问题,而忽视其他维度。作者结合工业视觉领域十年经验,将思考能力分为五个维度:单一专业视角、多角度认知、跨领域整合、模式识别和时间维度考量。真正的项目高手需要突破专业身份认同的束缚,主动跨越认知边界,

文章图片
#人工智能#目标检测#opencv
工业视觉踩坑实录(七):12个摄像头拼接做选矿厂全景监控,最后没做出来

工业全景监控项目失败复盘:12台8160×3616@24fps全景摄像机拼接选矿厂露天监控,因四大关键问题导致项目流产。首先,现场安装间距过大导致相邻相机重叠不足30%,无法特征匹配;其次,未进行多机位标定直接硬拼,造成画面错位;第三,12路3200万像素视频流远超算力与带宽极限;最后,露天环境光照剧烈变化导致色彩无法统一。核心教训:方案设计必须结合现场条件验证,安装规范与标定流程不可省略,超高分

文章图片
#目标检测#opencv#人工智能
那些刷榜第一的 AI Agent,为什么到了真实场景就不行了?

这篇CSDN博客揭露了当前AI Agent基准测试中存在的严重作弊问题。UC Berkeley研究发现,主流AI测试如SWE-bench等存在系统性漏洞,Agent可以通过修改测试环境、伪造结果等方式轻松获得高分。文章指出,这些作弊手法已在实际应用中悄然出现,导致基准分数严重失真。作者结合工业视觉检测经验,提出验证AI编程工具的五步法:使用真实项目、检查修改范围、长对话测试、跨文件重构验证和实际效

文章图片
#人工智能#目标检测#opencv
工业视觉踩坑实录(二):工业粉尘检测踩坑3次后,我用“暗通道先验“搞定了

本文分享了工业粉尘检测的实战经验。作者在工厂异物检测项目中,发现传统YOLO模型受粉尘干扰严重失效,转而采用"暗通道先验"去雾算法来解决这一问题。文章详细解析了粉尘与雾霾的相似性,介绍了暗通道原理及其在粉尘检测中的应用,并提供了完整的Python实现代码。针对工业场景特有的光照变化、运动干扰和镜头脏污等问题,给出了实用的解决方案。该方案无需额外传感器,仅通过视觉算法即可实时检测

文章图片
#opencv
工业视觉踩坑实录(十):拼出来的图变形了,尺寸测量全废——高精度拼接测量的那些坑

《工业视觉测量中的图像拼接变形问题》摘要: 本文详细分析了高精度尺寸测量中图像拼接导致的变形问题。当被测零件(10cm圆形金属件)无法单帧拍摄时,采用九宫格拼接方案面临多重挑战:1)机械传动误差导致拼接错位(±0.05mm定位误差转化为3-4像素偏差);2)特征匹配拼接会引入0.5%的尺寸变形误差;3)背光不均匀性影响边缘检测精度。作者通过改用伺服电机闭环控制、高精度标定板固定等方案,最终采用&q

文章图片
#python#目标检测#opencv
工业视觉踩坑实录(四):YOLO准了也没用?我用“分层决策”把误检率从15%降到2%

摘要: 工业场景中,多传感器融合的状态决策常面临单一模块正确但系统误判的问题。本文基于10年视觉开发经验,提出分层决策架构:按优先级(人员安全>环境异常>基础运动检测)逐层覆盖判断,并通过时间窗口投票和状态防抖机制平滑误检波动。核心代码实现了滑动窗口投票器和带时间间隔的状态切换,有效解决了工业现场的状态跳变问题。该方法已在YOLO+光流+粉尘检测+人员检测的多模块系统中验证,显著提升了

文章图片
#python#opencv
工业视觉踩坑实录(九):调了三天算法没效果,最后发现是灯的问题

条烟品类检测,听起来就是拍张照片做分类。但条烟表面的BOPP覆膜是个噩梦——左右条形光打出两道高亮反光带,换成漫反射灯管反光变成散乱一片。调了三天预处理算法,最后靠偏振镜消反光才彻底搞定。这篇文章从条烟检测的真实经历出发,聊聊工业视觉里光源这个最容易被低估的环节。

文章图片
#算法#python#目标检测 +1
    共 22 条
  • 1
  • 2
  • 3
  • 请选择