logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

YOLOv8 区域计数系统:基于计算机视觉的智能物体计数方案

本文介绍基于YOLOv8的区域计数系统,结合目标检测与ByteTrack跟踪算法,实现指定区域内物体实时计数。系统支持自定义多边形/矩形计数区域,可通过鼠标拖动调整位置,利用Shapely几何计算判断物体是否入区,结合跟踪ID避免重复计数。技术栈包含Ultralytics YOLOv8、OpenCV、Shapely等,具备检测框、跟踪轨迹与计数结果可视化功能,支持视频结果保存。适用于交通流量监控、

文章图片
#人工智能#深度学习
什么是具身智能?《让网络空间与物理世界保持一致:具身智能综述》

这篇论文《Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI》详细阐述了具身人工智能(Embodied AI)的发展现状,特别是在多模态大模型(MLM)和世界模型(WM)技术推动下的进展。具身人工智能被认为是实现通用人工智能(AGI)的关键途径之一。本文不仅深入探讨了具身感知、具身交互和具身

文章图片
#人工智能#机器学习#语言模型
YOLO26 前瞻!2025 边缘目标检测新王者:无 NMS、去 DFL,CPU 速度飙升 43% 的四大核心突破

YOLO26作为YOLO系列最新成员,专为边缘和低功耗设备优化,带来四大核心突破:1)移除DFL简化边界框回归;2)首创端到端无NMS设计,CPU推理速度提升43%;3)引入ProgLoss和STAL策略提升小目标检测精度;4)采用MuSGD优化器加速训练收敛。该架构遵循简洁性、部署效率和训练创新三大原则,支持多任务和多种导出格式,显著降低边缘设备部署门槛。相比前代产品,YOLO26在保持精度的同

文章图片
#目标检测#人工智能#计算机视觉
什么是具身智能?《让网络空间与物理世界保持一致:具身智能综述》

这篇论文《Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI》详细阐述了具身人工智能(Embodied AI)的发展现状,特别是在多模态大模型(MLM)和世界模型(WM)技术推动下的进展。具身人工智能被认为是实现通用人工智能(AGI)的关键途径之一。本文不仅深入探讨了具身感知、具身交互和具身

文章图片
#人工智能#机器学习#语言模型
如何批量运行YOLOv8模型验证:全面指南及脚本解析

在深度学习项目中,训练多个模型版本以优化性能是常见的做法。随着模型数量的增加,手动验证每个模型的性能不仅耗时,而且容易出错。为了提高效率,自动化批量验证过程显得尤为重要。本文将介绍如何使用Python脚本批量运行YOLOv8模型的验证,并将验证结果组织到指定的文件夹中,方便后续分析和管理。遍历训练目录:自动查找所有包含文件的子文件夹。加载模型:使用Ultralytics YOLO库加载每个模型。运

文章图片
#深度学习#目标检测#人工智能
视频抽帧:将视频逐帧抽取为图片用于标注

视频抽帧,将视频抽取为图片,用于数据集的制作

#音视频#python#深度学习
U-Net 与深度学习的完美结合:图像分割的高效解决方案

本文深入解析了 U-Net 模型的结构与应用,特别是在医学图像分割中的优势。我们介绍了 U-Net 的编码器、解码器及跳跃连接设计,阐述了卷积、池化、上采样等核心操作及损失函数(如 Dice 系数与交叉熵)。此外,提供了基于 PyTorch 的 U-Net 实现代码,涵盖数据预处理、模型训练、优化与评估。通过实际代码,读者可以了解如何高效训练 U-Net 模型,并应用于实际的图像分割任务。

文章图片
#深度学习#人工智能#计算机视觉
什么是具身智能?《让网络空间与物理世界保持一致:具身智能综述》

这篇论文《Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI》详细阐述了具身人工智能(Embodied AI)的发展现状,特别是在多模态大模型(MLM)和世界模型(WM)技术推动下的进展。具身人工智能被认为是实现通用人工智能(AGI)的关键途径之一。本文不仅深入探讨了具身感知、具身交互和具身

文章图片
#人工智能#机器学习#语言模型
YOLOv12—以注意力为中心的实时对象检测器

本研究成功将以注意力为核心的设计引入YOLO框架,提出YOLOv12,在实时目标检测的延迟 - 精度权衡方面取得了最先进的成果。为实现高效推理,设计了新颖的网络,利用区域注意力降低计算复杂度,通过残差高效层聚合网络(R - ELAN)增强特征聚合。同时,对普通注意力机制的关键组件进行优化,使其更好地适应YOLO的实时约束,保持高速性能。通过有效结合区域注意力、R - ELAN和架构优化,YOLOv

文章图片
#人工智能#深度学习
到底了