logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第 03 讲《监督学习:数据、标签、Loss与训练循环》

本文通过类比学生做题的过程,系统介绍了监督学习的核心概念和训练机制。主要内容包括: 监督学习本质:模型通过"做题(预测)-对答案(标签)-改参数(优化)"的循环过程逐步学习。 关键概念解析: 数据集划分:训练集(练习册)、验证集(模拟考)、测试集(期末考试) 标签:监督学习的标准答案 Loss:预测错误的量化指标 学习率:参数更新的调整幅度 训练流程:详细拆解了从输入样本到参数更新的6个关键步骤,

文章图片
#学习#目标检测#人工智能
YOLO26 全网独家改进创新:CVPR 2025 LSNet 大核小核主干,引入 See Large, Focus Small 机制!

本文提出了一种改进的YOLO26目标检测模型YOLO26-LSNetBackbone,创新性地融合了CVPR 2025 LSNet网络的"See Large, Focus Small"思想。该方法通过替换原YOLO26主干中的C3k2阶段为LSNetStage模块,构建大核深度卷积和小核深度卷积的双分支结构:大核分支负责扩大感受野以获取全局上下文信息,小核分支专注于保留局部细节特征。这种设计既解决

文章图片
#目标检测#计算机视觉#人工智能
YOLO26 全网独家改进创新: MIT 2025 振荡状态空间模型:引入可学习的阻尼机制,独家创新!

本文提出了一种基于LinOSS/D-LinOSS振荡状态空间模型的YOLO26改进方法,通过引入可学习的阻尼机制,使模型能够在多时间尺度上自适应调控特征能量的耗散。该创新将目标检测中的特征图视为具有频率、速度和稳定性的振荡动力系统,在保留YOLO26原有架构优势的同时,有效解决了复杂场景下的小目标检测、多尺度特征融合和长程依赖建模等关键问题。改进后的模型通过振荡状态更新机制实现了更灵活的特征表达,

#学习#目标检测#计算机视觉 +1
YOLO26改进创新 | 全网首发,MV-Split均值-方差残差重构,破解深层特征统计漂移,高阶写作创新!

本文介绍了将MV-Split均值-方差残差重构方法应用于YOLO26目标检测模型的创新改进。该方法源自解决超深层DiT网络训练中均值主导塌缩问题的研究,通过分离控制均值项和中心化残差,有效防止特征统计漂移。文章详细阐述了该方法的核心原理、数学公式及在YOLO26中的融合策略,重点分析了改进前后网络结构的差异,包括残差更新方式、深层统计稳定性等方面的优化。这种改进不仅提升了模型在复杂场景下的表现,更

文章图片
#均值算法#目标检测
叫叫兽原创二次创新!上下文+CBAM捕捉中远距离像素间的语义关联,将全局场景信息有效融合到局部特征中,有效涨点,嘎嘎创新!!!!

YOLO26最新改进:叫叫兽团队创新性融合ContextAggregation与CBAM注意力机制,有效解决传统CNN在长距离上下文建模的不足。该设计通过全局K-V聚合与局部注意力协同,显著提升小目标和密集场景的检测性能,同时保持计算效率。改进后的模型在精度与速度间取得平衡,特别适用于遥感、医学等复杂场景。详细实现代码已在B站发布,为科研人员提供实用参考。

文章图片
#人工智能#深度学习#目标检测 +1
YOLO26最新创新改进系列:DRoRAE深度路由表征融合,让多层视觉语义在检测中真正协同,高阶魔改写作创新!

本文介绍了YOLO26检测模型的最新改进DRoRAE深度路由表征融合方法。该方法源自论文《Beyond the Last Layer》,通过深度路由和渐进校正机制,有效聚合多层视觉特征,解决传统方法仅使用最后一层特征导致的信息丢失问题。在YOLO26中,该创新被转化为多专家修正块,放置在P3/P4/P5节点后,实现内容敏感的特征修正。改进后的模型在语义细节协同、纹理处理和小目标检测等方面表现更优,

文章图片
#目标检测#计算机视觉#人工智能
YOLO26最新创新改进系列:别再把深度学习当黑盒:一张图看懂 CNN 如何“看见”图像

本文通过可视化方式解析CNN如何“看见”图像,打破深度学习黑盒认知。核心要点包括:1)图像在模型中转化为三维数字张量;2)卷积运算本质是局部特征的乘加计算;3)CNN层级结构实现从边缘到语义的逐层抽象;4)YOLO通过Backbone-Neck-Head架构完成目标检测。文章提供7天学习路线和实操代码,帮助新手从图像张量、卷积计算到特征可视化和YOLO检测逐步掌握深度学习原理。建议通过打印网络结构

文章图片
#深度学习#cnn#人工智能
YOLO26最新创新改进:融合 MicroViTv2(Cvpr26年5月中旬提出)三种主干迁移方案、增强全局语义表达,有效创新!

本文提出将轻量级视觉主干网络MicroViTv2与YOLO26目标检测框架融合的创新方案。MicroViTv2结合了CNN的局部特征提取能力和Transformer的全局建模优势,特别适合移动端和边缘计算场景。研究设计了三种融合方法:完整主干替换、主干适配器和局部块替换,在保持YOLO实时检测能力的同时增强模型对遮挡目标、小目标和复杂背景的处理能力。核心创新点在于将MicroViTv2的轻量混合模

#目标检测#深度学习
YOLO26改进 | PKINet多核Inception:让多尺度目标拥有更合适的感受野!强创新!

本文提出了一种改进YOLO26目标检测模型的新方法PKINet,通过引入多核Inception结构增强多尺度目标检测能力。该方法的核心创新点包括:1) 在YOLO26的Backbone P4阶段嵌入PKIBlock模块,采用多尺度卷积核(3×3,5×5,7×7)协同建模不同感受野;2) 通过残差连接保持原始检测框架的同时增强特征表达能力;3) 特别适用于遥感图像中尺度差异大、背景复杂的目标检测场景

文章图片
#目标检测
YOLO26最新创新改进:引入 CVPR2026 FAAFusion,普通目标检测获得方向鲁棒性,创新性强!

本文提出了一种基于傅里叶角度对齐(FAA)的YOLO26改进方法,通过将CVPR2026的FAAFusion技术迁移到目标检测任务中。该方法在Backbone、Neck和Head三个关键模块引入傅里叶主方向估计与特征对齐机制,显著提升了模型对方向变化的鲁棒性。具体改进包括:在Neck中使用FAAFusionConcat替代普通Concat实现多尺度特征对齐;在Backbone关键输出层添加FFAF

文章图片
#目标检测#人工智能#计算机视觉
    共 231 条
  • 1
  • 2
  • 3
  • 24
  • 请选择