
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出TrackRef3D,首个全自动无需人工标注的开放世界3D指代分割方法。针对现有技术依赖昂贵人工标注和多视角伪标签不一致的问题,通过轨迹感知语义共识模块(TSCM)实现跨视角语义一致性,利用混合训练策略(HTS)联合优化类别语义和指代描述。在Ref-LERF基准上以38.8mIoU超越此前最优方法9.6个百分点,在LERF-OVS和3D-OVS上分别达到63.2和95.2mIoU。该方法通

清华大学等机构联合发布首个工业巡检安全评估多模态数据集InspecSafe-V1,填补了该领域真实数据空白。该数据集包含5类工业场景、2239个巡检点的5013个实例,提供7种同步感知模态(RGB/红外/音频/点云等)和像素级分割(234类对象)、场景描述及四级安全标签。基准测试显示,现有视觉语言模型在复杂工业环境下表现欠佳,推理增强模型准确率仅比指令模型高8个百分点,误报率超30%,暴露了恶劣光

清华大学等机构联合发布首个工业巡检安全评估多模态数据集InspecSafe-V1,填补了该领域真实数据空白。该数据集包含5类工业场景、2239个巡检点的5013个实例,提供7种同步感知模态(RGB/红外/音频/点云等)和像素级分割(234类对象)、场景描述及四级安全标签。基准测试显示,现有视觉语言模型在复杂工业环境下表现欠佳,推理增强模型准确率仅比指令模型高8个百分点,误报率超30%,暴露了恶劣光

YOLOv6是由美团视觉智能部研发的一款目标检测框架,专注于工业应用。相较于YOLOv4和YOLOv5,YOLOv6在网络结构方面进行了深入优化,提升了模型的检测精度,并在处理复杂场景时更加稳健。同时,YOLOv6还在保持高效性的基础上,减少了模型的参数量,适合在移动端等计算资源有限的设备上运行。论文:总结而言,YOLOv6是一个专为工业应用设计的单阶段目标检测框架,通过优化标签分配策略、损失函数

在目标检测领域,YOLO系列算法以其高效的端到端设计和卓越的实时性能,始终占据着重要地位。其中,YOLOv3作为该系列的第三代,凭借Darknet-53骨干网络、多尺度检测机制以及对分类方法的优化,不仅实现了精度与速度的平衡,还为目标检测技术的实际应用提供了新的可能性。在这篇文章中,我们将详细解读YOLOv3的模型结构与性能表现,探索其在Coovally CPU平台上的使用方法,从模型训练到实际预

一场又一场智慧与技术的较量接连上演,这不仅是一次提升专业素养和设计能力的绝佳机会,更是通往丰厚奖励的桥梁。参赛选手自由集成任何第三方开源或闭源模型进行比赛,利用Coovally的模型训练功能开展模型的训练,并由此来提交训练结果至打分系统。采用调用模型接口的形式进行比赛,大赛组委会针对此类赛题搭建比赛平台,比赛平台自动挂载数据,自动执行模型,在离线环境中进行比赛。使用官方提供的绘画工具,紧扣【天山绮

本文提出了面向矿区地表裂缝的完整框架:DRA-UNet 语义分割(F1=71.60%/MIoU=70.00%)→ 骨架提取与几何量化 → 工作面尺度空间分析。几何分析揭示裂缝长度、宽度和面积均呈右偏长尾分布(均值:长度 2.12 m,宽度 7.73 cm),矩形度随裂缝长度增加而下降;空间分析表明工作面边界附近裂缝密度和复杂度显著增高,内部裂缝呈特征性的"C形"张开模式。检测-量化-空间分析的三层
福井大学联合UBC等机构提出InvAD,创新性地采用"反演检测"替代传统扩散模型的"重建检测"范式。该方法通过3步DDIM反演将图像映射到隐空间,测量其与正常分布的偏离度来判断异常,避免了传统方法中噪声强度调参和多步去噪的瓶颈。实验表明,InvAD在MVTec-AD上达到99.0%的AU-ROC和88.1FPS的推理速度,比现有最快方法提速2.2倍,且无需调

能够提供“打包自身的A I能力”,给业务人员使用,可实现“授人以渔”。如上图所示,搜索相关模型名称后,Coovally插件会帮助自动识别相关模型名称并进行标注,点击便能直接跳转至Coovally平台,进行相关任务的创建。“得数据者,得人工智能”,有了浏览器插件功能的加持,Coovally将进一步拓宽应用场景,提高使用灵活度,助力深度学习研究的进一步发展。下载Coovally插件即可在浏览器内的任何

Ultralytics在2024年YOLO Vision活动上隆重推出全新计算机视觉模型——YOLO 11。YOLO 11于今日正式开源,为广大开发者带来更高效、更精准的视觉识别体验。YOLO 11标志着YOLO系列模型翻开新的篇章,它带来了一系列强大的功能和优化,使其更快,更准确,并且功能多样。








