logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据集|二维码目标检测QRCodeDetection

本文介绍了一个包含20,000+张高质量标注图像的二维码检测数据集。该数据集针对真实环境中的复杂干扰(如光照变化、几何变形、遮挡和介质差异)进行了系统设计,覆盖工业自动化、智能安防和移动扫码等应用场景。数据集采用X-AnyLabeling工具标注,旨在提升二维码检测模型在复杂条件下的泛化能力。文中展示了多个标注示例,并提供了工具下载链接。该资源可用于优化各类二维码识别系统的性能表现。

文章图片
#目标检测#人工智能#计算机视觉
图解 | 大模型智能体LLM Agents

本文介绍了LLM代理的存储机制和工具使用方法。在存储方面,LLM具有短期记忆和长期记忆:短期记忆通过上下文窗口或总结对话历史实现;长期记忆则借助向量数据库和检索增强生成(RAG)技术存储历史交互。在工具使用方面,LLM可通过函数调用与外部环境交互,Toolformer等技术能训练模型自主调用API。此外,模型上下文协议(MCP)标准化了API访问流程,简化了工具集成。这些技术共同增强了LLM的记忆

文章图片
数据集|多种水果目标检测数据集-苹果、西瓜、番茄、菠萝、洋葱(共 5 类)

本文介绍了一个包含1055张真实场景图片的水果检测数据集,旨在解决现有数据集中背景简单、种类单一的问题。该数据集包含苹果、西瓜、番茄、菠萝和洋葱5类标注,重点关注复杂场景下的果蔬检测能力,包括处理遮挡、区分相似类别(如红苹果与红番茄)以及抗干扰能力。图像分辨率为640*640像素,采用Labelme JSON格式标注。数据集适用于目标检测研究和智慧农业项目开发,并提供标注工具下载链接。

文章图片
#目标检测#人工智能#计算机视觉
数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)

本文介绍了一个草莓成熟度分类数据集,包含1,623张224×224像素的草莓图像,分为未熟(白/绿色)、半熟(粉/浅红色)和完熟(深红色)3类。数据集真实反映了农业场景中的类别不平衡问题(未熟923张、半熟217张、完熟483张),适用于轻量级模型训练和边缘设备部署验证。文章详细分析了草莓成熟度分类面临的四大挑战:类别不平衡、视觉歧义性、跨场景泛化能力差和细粒度分类难度,并展示了各类别的典型样本图

文章图片
#人工智能#机器学习
数据集|草莓成熟度分割检测数据集-3类530张图

本文介绍了一个草莓成熟度分割检测数据集,包含530张高分辨率田间图像,针对草莓自动化采摘中的视觉识别难题设计。数据集提供未熟、半熟、完熟三级精细标注(Labelme JSON格式),解决了红色果实与背景区分困难、成熟度过渡模糊等实际问题。图像涵盖遮挡、重叠等复杂场景,支持目标检测模型训练和迁移学习,适用于农业机器人开发和采摘决策研究。数据分辨率640x640像素,标注工具推荐X-AnyLabeli

文章图片
#目标跟踪#人工智能#计算机视觉
数据集|草莓成熟度目标检测数据集-3类530张图

本文介绍了一个草莓成熟度目标检测数据集,包含530张高分辨率田间图像,标注了未熟、半熟和完熟三类草莓。该数据集针对农业自动化采摘中的视觉识别难题设计,具有以下特点:1) 三级成熟度精细标注,支持精准采摘决策;2) 覆盖复杂场景(遮挡、重叠、多变光照);3) 半熟状态经专家标定,可识别微妙过渡;4) 适中规模适合轻量模型训练或大模型微调。数据采用Labelme JSON格式,图像分辨率640x640

文章图片
#目标检测#目标跟踪#人工智能
数据集|草莓成熟度目标检测数据集-3类530张图

本文介绍了一个草莓成熟度目标检测数据集,包含530张高分辨率田间图像,标注了未熟、半熟和完熟三类草莓。该数据集针对农业自动化采摘中的视觉识别难题设计,具有以下特点:1) 三级成熟度精细标注,支持精准采摘决策;2) 覆盖复杂场景(遮挡、重叠、多变光照);3) 半熟状态经专家标定,可识别微妙过渡;4) 适中规模适合轻量模型训练或大模型微调。数据采用Labelme JSON格式,图像分辨率640x640

文章图片
#目标检测#目标跟踪#人工智能
数据集|西红柿番茄成熟度目标检测数据集-6类别800张图

本文介绍了一个针对西红柿/番茄成熟度检测的专业数据集,包含800张真实场景图像,覆盖大西红柿和圣女果两类品种的三种成熟度(绿熟、半熟、完熟)。数据集采用Labelme JSON格式标注,包含6个细粒度类别,支持目标检测模型训练。该数据集特别针对农业场景中的成熟度模糊、品种差异、光照干扰等痛点设计,具有跨尺度特征学习和复杂环境鲁棒性等特点,适用于智能农业、自动化采摘等应用场景。文中提供了数据标注示例

文章图片
#目标检测#人工智能
第4例 基于卷积神经网络VGG的猫狗图像识别

VGG网络结构是牛津大学著名研究组VGG( Visual Geometry Group )在2014年提出的卷积神经网络结构,受AlexNet网络启发的,其探索卷积神经网络的深度和其性能之间的关系,优化方向**属于“网络加深”** 。

文章图片
#深度学习
神经网络之卷积层,池化层输出大小计算

设计网络卷积层的参数:(1)输入图片大小(矩形): AA(2)卷积核大小: KK(3)步长: S(4)填充padding: p那么卷积层的输出为: N = (A − k + 2p ) / s + 1

    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择