登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍了一套基于YOLOv8的金属锈蚀智能识别系统,实现了从算法到工程落地的完整闭环。传统人工检测存在效率低、风险高、主观性强等问题,该系统通过无人机采集+深度学习视觉技术实现智能化检测。采用目标检测而非分割,在保证精度的同时兼顾工程部署便捷性。系统采用标准工业AI五层架构,包含图像采集、预处理、YOLOv8推理、结果分析和PyQt5可视化交互模块。YOLOv8的Anchor-Free架构、高效
请注意,您必须将代码中的“C:/Users/Desktop/lena.png”替换为计算机中图像的有效位置。然后,您应该在创建的窗口中看到网络摄像头的输出。按下“Esc”键后,创建的窗口将被销毁,网络摄像头的视频输出将保存在给定位置。但此页面中列出的大多数编解码器可能无法在您的计算机中使用。此函数将给定的 img 对象写入指定的文件。上面的代码段将给定的图像写入指定的文件。帧的大小应与您在初始化视
本文介绍了一个基于Qwen3-Coder的多模态智能诊断与全栈部署平台。该平台实现了从深度学习模型训练到前后端开发、运维自动化的全流程闭环,90%代码由AI自动生成。核心功能包括:多模态医学影像诊断(CT/X光/皮肤镜等)、糖尿病/心脏病等疾病辅助诊断、自然语言症状分析等。技术亮点在于集成硅基流动API和AnythingLLM实现上下文记忆,支持Python/Shell/HTML等多语言代码自动生
从让机器人流畅打太极,到助力好莱坞打造视觉奇观,再到赋能虚拟主播的一颦一笑,这些应用的背后,都离不开一个核心的“观察者”——动作捕捉系统。作为连接物理世界与数字世界的桥梁,动作捕捉的精度直接决定了上层应用的逼真度与可靠性。本文将深入剖析包括NOKOV度量在内的七款主流动作捕捉解决方案,通过硬核数据对比与应用场景解析,为你揭开高精度运动捕捉的奥秘。
AI视频监控系统正推动煤矿生产从"人工巡检"向"智能感知"转变。该系统通过深度学习算法实现主动预警,能识别安全隐患、规范人员行为,并应用于无人化开采、智能巡检、无人驾驶矿车调度等核心场景。尽管面临井下环境恶劣、数据样本不足等技术挑战,该系统仍显著提升了煤矿的安全生产水平和运营效率,成为煤矿智能化转型的关键支撑。
在标签贴装、元件就位、零件插装等装配场景下,企业对自动化检测的精度、效率和灵活适配能力有着更高要求。为了帮助企业构建,森赛睿科技基于自研的视觉AI云平台和AI检测推理软件,设计了一套可灵活配置、快速部署、跨行业适配的解决方案。本文将通过一个典型客户案例,介绍这套方案的落地方式与通用价值。
常规的紫外工业镜头有哪些?能做什么?
本篇博文主要用于记录学习Halcon中算子的应用场景,及其使用代码和图像展示。只讲通俗易懂使用方法,不讲原理,不讲原理,不讲原理,重要的事情说三遍。提示:以下是本篇文章正文内容,下面案例可供参考, 注意参数坐标的使用,能帮助你理解算子。
摘要:本文针对工业场景中视觉检测与设备控制割裂的问题,提出了一种基于C#的一体化解决方案。通过YOLOv8模型实现贴片电阻引脚缺陷检测(准确率≥99.5%),并同步联动西门子PLC控制执行机构,解决了传统方案中的判错、误动作和通信延迟问题。方案采用工业级技术选型(OpenCvSharp4+S7NetPlus+ONNX Runtime),详细拆解了从图像采集、缺陷识别到设备联动的全流程实现,包括核心
AI视觉检测与预测性维护助力制造业降本增效 摘要:本文探讨AI技术在制造业中的两大核心应用——视觉检测与预测性维护。传统制造业面临质量控制难、设备维护被动等挑战,AI技术通过智能视觉检测实现精确高效的产品缺陷识别,预测性维护则通过数据分析提前发现设备故障隐患。文章详细介绍了AI视觉检测的技术原理和应用场景,并提供了基于OpenCV和Java的简易视觉检测系统代码示例,展示了如何通过图像处理和机器学
3)打开mindspore官网,找到安装教程,根据Mindspore版本选择不同的cann包,由于要安装的mindspore版本为2.4.1,选择8.0.RC3.beta1版本的CANN包。1)以conda环境为例,安装昇腾AI处理器配套软件包提供的whl包,whl包随配套软件包发布,升级配套软件包之后需要重新安装。2)若系统中已安装过CANN包,则删除镜像中已安装CANN包释放空间,防止安装新C
本文介绍了一个基于YOLOv8的焊缝表面缺陷智能检测系统,该系统通过深度学习技术解决了传统人工检测效率低、一致性差等问题。系统采用标准工业AI架构,包含数据集模块、模型训练模块、推理服务模块和可视化界面模块,支持图片/视频/摄像头实时检测。项目详细展示了YOLOv8模型训练流程、推理核心代码实现以及PyQt5可视化界面设计,具备工程化部署能力。该系统可显著降低质检成本、提高检测稳定性,为工业视觉检
本文介绍了一个基于OpenCV和Python的通用颜色识别系统,采用LAB颜色空间进行颜色分析。系统通过实时图像采集、主色调提取,并计算与参考颜色的ΔE差异值实现准确识别。核心功能包括相机配置、图像处理、颜色检测和比对模块,支持CIE76和CIE2000两种颜色差异算法。系统提供GUI界面和颜色校准工具,可应用于工业检测和自动化生产场景。项目开源并提供Windows/Linux部署指南,包含故障排
🔥【同济大学IPMV】Blob检测:LoG与DoG算法全解析!本文详解斑点检测(Blob Detection)核心原理,带你掌握:1️⃣ LoG算法:尺度归一化+极值搜索,σ=r/√2时响应最强2️⃣ DoG优化:高斯差分快速逼近LoG,SIFT特征提取的基石3️⃣ 实战对比:边缘检测看"过零点",斑点检测找"极值点"
【代码】k230车牌识别。
通过网盘分享的文件:颜色工具V1.0.rar链接: https://pan.baidu.com/s/1chQTtSUXSFj14X8dLvsvsw 提取码: 3tie--来自百度网盘超级会员v6的分享。
4、抽取frames文件夹中的视频关键帧图片,用于标注。前面的代码可以将抽取出来的图片全部存放至一个,后面注释的代码可以生成子文件夹,生成每个视频对应的关键帧图片文件夹。,转数据为ava2.1数据格式(via数据集转为slowfast格式),原文中csv文件与代码同一目录,先改为从文件夹中读取并存放至对应文件夹。3、抽取视频每帧的图片,这个文件夹frames也是自动生成,会对应每个视频生成对应的图
使用大功率贴片LED和高均匀漫射板,形成高亮无影照射区域。:环形光源提供不同角度照射,能突出物体的三维信息。有效解决对角照射阴影问题,能突出物体信息。可制作长度60mm~2000mm的光源。应用领域:高速流水线电子元件表面检测。:光源线使用夹线端子固定,更加牢固。:PCB基板检测、塑胶容器检测。,大功率灯珠,高亮度光线集中;:大面积打光首选、可自由组合。显微镜照明、通用外观检测。印刷品质量检测、灯
视频监控,视频分析
解耦跟踪
VM-UNet是一种针对医学图像分割优化的创新模型。针对传统UNet在精度、效率和鲁棒性上的不足,VM-UNet通过多项改进实现突破性平衡:采用Ghost-Patch Stem缩减参数,引入并行视觉状态空间模块(PVM)提高计算效率,使用可变形SS2D增强几何适应性,设计双分支注意力桥(CAB+SAB)抑制跳跃噪声,并优化解码器实现高效量化。这些改进使模型在小目标分割、边缘定位和实时处理方面表现优
【代码】k230人体检测。
UV 紫外相机在半导体制造领域的应用
这是研究生毕业走向工作的第一篇csdn,记录学习历程以及一些思考。希望在如今的AI浪潮里更好的谋生立命,不负寒窗。Faster-RCNN预印版于2016,那是博主还是高二学着物理化的毛头小子。言归正传,本篇文章主要说一下FasterRCNN的两大性质,即实时性(端到端)和RPN区域提议网络。如今AI大模型已经可以把大多数知识展现给我们,为标新立异,这里我想给大家聊点我自己的理解。
紫外UV相机在机器视觉检测方向的应用
特朗普100%关税+出口管制对机器视觉行业产品的影响
需要在VM的C#脚本设置string类型Out变量和float类型OutF变量,python的输出信息会在Out变量显示。
Transformer架构在计算机视觉领域取得突破性进展,但其高计算成本限制了实际部署。本文系统梳理了视觉Transformer的轻量化策略,包括注意力机制优化、结构剪枝、低秩分解、模型蒸馏和硬件友好设计五类方法。重点分析了MobileViT等典型轻量模型的优化特点,并探讨了多模态协同轻量化、自适应计算等未来趋势。文章还结合大牛直播SDK等工业系统,展望了轻量Transformer在实时视频分析中
大规模视觉语言模型(例如 CLIP)学习了强大的图像文本表示,这些表示已在从零样本分类到文本到图像生成等众多应用中得到应用。尽管如此,它们通过提示解决新型判别任务的能力仍落后于大型语言模型(例如 GPT-3)。在这里,我们探索了视觉提示工程的想法,通过在图像空间而不是文本中进行编辑来解决分类以外的计算机视觉任务。具体来说,我们发现了 CLIP 的一项新兴能力,只需在对象周围画一个红色圆圈,我们就可
MATLAB影像处理的简单应用--统计图中有多少颗米,本次使用MATLAB内置的rice.png作为实验材料。先从基本的影像处理函数开始,一步步实现功能的实现及调优。
工业相机帧率与曝光的平衡艺术:别只顾快,这3招让检测不糊不漏
Baumer工业相机堡盟工业相机如何实现高精度的硬件同步触发
Kairos是一款顶级数字人制作工具,它基于先进的 AI 算法,能够快速克隆出用户的数字分身,并且精准匹配外貌、声音和口型。它可以帮你做直播、互动,如果你懒得自己出镜拍视频,直接让数字人上场,省时省力,效果逼真自然。用户只需要传入一个视频文件和音频文件,Kairos会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按
定制模板是由 DINO-X 开放平台独家提供的一项能力。用户只需提供少量标注样本,即可训练出一个高质量的视觉模板(Embedding),用于模型推理中精准识别特定目标。相比于传统模型仅能识别人、车、动物等常见类别,定制模板可识别用户业务中独有的目标,例如品牌 logo、工业缺陷、异形部件、特殊商品等,特别适用于长尾类别识别、工业定制、非标物体检测等复杂场景,帮助用户高效完成 AI 验证与部署。
桌面智能助手项目添加OCR模块进行文字识别,为AI添加上看电脑的“眼睛”,经验分享和问题总结。
LabelImg是一款开源的图像标注工具,支持YOLO、VOCXML等格式,适用于YOLOv5等目标检测模型的数据准备。本文详细介绍了其安装(pip/源码)、配置(设置类别文件、标注格式)和使用方法(快捷键操作、标注流程),重点讲解了YOLO格式标注文件的结构和注意事项。同时提供了数据集目录组织建议、配置文件创建指南及常见问题解答,帮助用户高效完成图像标注任务。该工具支持Windows、macOS
OpenCVDS是一个简单易用的开源图片批量处理计算机视觉检测软件,初衷是用以补充Windows平台的一些视频监控系统没有的视觉检测记录分区保存功能。通过批量处理图片,可以快速完成大量图片的视觉检测任务。一款开源的计算机视觉检测软件,以其简单易用、功能全面的特点受到了大家的好评。它不仅补充了现有视频监控系统在视觉检测记录分区保存方面的不足,还提供更加便捷、高效的视觉检测体验。主要目标是补充现有视频
运动模糊修复:4 类实用算法及 OpenCV + Halcon 实战代码
视觉检测
——视觉检测
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net