logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

工业实时检测的范式革新:基于 RT-DETR 的高性能瑕疵识别架构深度解析与实战

工业4.0时代,机器视觉成为制造业数字化转型的关键。针对传统CNN在工业质检中的不足(如NMS性能瓶颈、固定锚框局限性和虚警问题),RT-DETR(实时检测Transformer)通过端到端NMS-Free架构、混合编码器(AIFI和CCFF)等技术,实现了高精度和稳定实时性。结合昇腾AI平台的算子优化(如算子融合和INT8量化),RT-DETR在高反射金属表面瑕疵识别等场景中表现优异,检测率和误

文章图片
#架构#人工智能
工业实时检测的范式革新:基于 RT-DETR 的高性能瑕疵识别架构深度解析与实战

工业4.0时代,机器视觉成为制造业数字化转型的关键。针对传统CNN在工业质检中的不足(如NMS性能瓶颈、固定锚框局限性和虚警问题),RT-DETR(实时检测Transformer)通过端到端NMS-Free架构、混合编码器(AIFI和CCFF)等技术,实现了高精度和稳定实时性。结合昇腾AI平台的算子优化(如算子融合和INT8量化),RT-DETR在高反射金属表面瑕疵识别等场景中表现优异,检测率和误

文章图片
#架构#人工智能
工业实时检测的范式革新:基于 RT-DETR 的高性能瑕疵识别架构深度解析与实战

工业4.0时代,机器视觉成为制造业数字化转型的关键。针对传统CNN在工业质检中的不足(如NMS性能瓶颈、固定锚框局限性和虚警问题),RT-DETR(实时检测Transformer)通过端到端NMS-Free架构、混合编码器(AIFI和CCFF)等技术,实现了高精度和稳定实时性。结合昇腾AI平台的算子优化(如算子融合和INT8量化),RT-DETR在高反射金属表面瑕疵识别等场景中表现优异,检测率和误

文章图片
#架构#人工智能
工业实时检测的范式革新:基于 RT-DETR 的高性能瑕疵识别架构深度解析与实战

工业4.0时代,机器视觉成为制造业数字化转型的关键。针对传统CNN在工业质检中的不足(如NMS性能瓶颈、固定锚框局限性和虚警问题),RT-DETR(实时检测Transformer)通过端到端NMS-Free架构、混合编码器(AIFI和CCFF)等技术,实现了高精度和稳定实时性。结合昇腾AI平台的算子优化(如算子融合和INT8量化),RT-DETR在高反射金属表面瑕疵识别等场景中表现优异,检测率和误

文章图片
#架构#人工智能
工控机算力瓶颈破解:边缘端视觉缺陷检测的显存优化实战 | 缺陷检测 边缘节点推理

摘要:工业物联网中边缘设备的"显存墙"成为视觉大模型部署的主要瓶颈。OpticCore团队针对低功耗设备提出创新解决方案,通过亚线性内存分配、算子融合和激活值重计算技术,将工业视觉检测模型的显存需求降低60%以上。该方案在医药包装质检线实测中,成功在微型工控机上实现4路视频流实时处理,内存占用仅1.8GB且运行稳定。研究证明,通过底层架构优化可突破边缘设备算力限制,为智能制造提

文章图片
#人工智能
复杂光照环境的表面瑕疵检测与特征融合实践 | 视觉瑕疵检测 工业质检

摘要: 针对工业制造中复杂光照与金属反光导致的视觉检测难题,OpticCore团队提出定制化RT-DETR架构,结合多尺度特征融合与自注意力机制,显著提升边缘设备的检测精度与效率。通过光照不变性特征解耦、Transformer全局注意力优化及动态算子融合技术,解决了传统YOLO模型在高反光场景下的漏检问题。实测显示,该方案在强干扰环境中将F1-Score从87%提升至99.1%,推理延迟降至22毫

文章图片
#人工智能#深度学习
深度剖析:Claude“被开源”背后的产业焦虑,兼谈灵声智库语音识别的私有化落地解法

深度剖析:Claude“被开源”背后的产业焦虑,兼谈宜天信达语音识别的私有化落地解法

文章图片
#开源
深度剖析“Claude源代码泄漏”风波:拨开大模型迷雾,看懂灵声智库语音识别解决方案的真实价值

【摘要】近期"Claude源代码泄漏"传闻引发行业震动,但经核实实为虚假消息。当前AI落地面临的核心问题并非模型获取,而是人机交互效率与企业数据融合。灵声智库语音识别解决方案提供务实路径:通过工业级ASR精度、实时流式响应和RAG技术深度集成,解决语音交互瓶颈,确保AI精准理解业务需求。该方案不依赖特定模型,专注构建稳定高效的语音入口,为企业AI落地提供可靠基础。

文章图片
#语音识别#人工智能
语音识别本地部署:大模型时代的企业数据主权保卫战与落地指南

摘要: 2026年,AI深度渗透各行业,但数据隐私泄露成为企业新危机。公有云语音识别服务(SaaS)存在数据合规风险、网络依赖和长期成本高昂等致命缺陷,促使企业转向本地部署语音识别(On-Premises ASR),以保障数据主权。本地部署的核心优势在于物理级数据隔离和边际成本趋零,适合高频、敏感业务场景。以“灵声智库”为代表的私有化解决方案,集成顶级开源模型(如FunASR),支持批量离线处理、

文章图片
#语音识别#人工智能
语音识别本地部署:企业级AI转写的破局之路与实战解析

摘要:随着AI语音识别技术发展,企业应用面临数据安全与效率的挑战。公有云服务存在隐私泄露、网络依赖和成本失控等痛点,促使本地部署方案成为企业首选。本地化部署通过物理隔离确保数据安全,消除网络瓶颈提升效率,并实现长期成本优化。以"灵声智库"为代表的解决方案,整合开源模型与本地算力,提供高精度识别、批量处理和智能分析功能,满足金融、医疗等强监管行业需求。本地部署正成为企业构建数字资

文章图片
#人工智能#语音识别
    共 14 条
  • 1
  • 2
  • 请选择