logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于Transformer的无人机对地突防轨迹预测方法研究【k学长深度学习宝库】

本文介绍了一个基于深度学习的无人机轨迹预测系统。该系统采用多模态神经网络架构,通过处理历史飞行数据(包括三维坐标和速度)来预测未来轨迹。系统包含数据预处理、模型训练、性能评估和可视化四大模块,支持滑动窗口技术处理序列数据。评估指标包括MSE、RMSE和MAE,并提供三维轨迹图等可视化工具。系统适用于空中交通管理等场景,但对数据质量和计算资源有一定要求。详情可访问k学长的深度学习宝库获取源码和教程。

文章图片
#深度学习#transformer#无人机
k学长的深度学习宝库:YOLOv11改进:WTConv小波卷积提升大感受野与检测精度(ECCV 2024)

本文介绍了一种新型小波卷积层(WTConv),通过小波变换解决CNN大感受野带来的参数膨胀问题。WTConv利用多频率响应扩展感受野,参数仅对数增长,显著提升了特征提取效率。实验表明,在YOLOv11中应用WTConv构建的C3k2模块,相比基础模型减少了11.4万参数和0.2GFLOPs计算量,实现了有效的轻量化。该方法参数增长平缓、感受野扩大且形状偏差提升,为CNN改进提供了高效易集成的解决方

文章图片
#深度学习#人工智能
U-Net++:嵌套密集跳跃连接,多尺度融合增强特征表达,医学影像分割的unet创新-k学长深度学习专栏

医学图像分割模型UNet++的创新与局限 UNet++是针对医学图像分割需求提出的改进模型,通过嵌套密集跳跃连接和深度监督机制解决了U-Net存在的语义鸿沟问题。其核心创新包括:1)重新设计跳跃路径,通过逐级卷积缩小编码器与解码器特征间的语义差距;2)采用密集连接优化梯度流动;3)引入多尺度深度监督提升训练稳定性。实验显示其在多个医学数据集上IoU指标平均提升3.9%。但该模型存在计算成本高、实现

#深度学习#人工智能
ResUNet:U-Net 中加入残差块-k学长深度学习专栏

摘要:ResUNet是一种结合U-Net和残差学习的深度学习模型,用于航拍道路提取任务。该模型通过U-Net的"沙漏"结构实现特征提取与细节恢复,并引入残差块的"短路连接"解决深层网络训练难题。其创新点在于用残差块替换普通卷积层,形成双重信息通道,使浅层细节与深层语义特征更好融合。相比传统U-Net,ResUNet具有训练更轻松、信息流通更顺畅、参数更少性能

文章图片
#深度学习#人工智能#图像处理
Restormer:用于高分辨率图像恢复的高效 Transformer-k学长深度学习专栏

Restormer是一种高效Transformer模型,专为高分辨率图像修复任务设计。它通过三大创新解决传统Transformer的计算瓶颈:1)高效注意力机制(MDTA),将复杂度从O(N²)降为线性;2)通道-空间双注意力融合(GDFN),实现跨通道特征协调;3)分层U-Net结构,结合全局语义与局部细节。相比CNN和SwinIR,Restormer既能建模全局依赖,又保持局部精度,在去噪、超

文章图片
#人工智能#深度学习
Noise2Noise:无监督去噪方法-k学长深度学习专栏

Noise2Noise颠覆了传统图像去噪需要干净样本的局限,提出仅用成对噪声图像即可训练模型。其核心思想是利用噪声的随机性,通过两张独立噪声图像让网络自动学习忽略噪声、保留真实内容。该方法在数学上证明了用噪声图像替代干净标签的可行性,且适用于多种噪声类型。虽然降低了数据采集门槛,但仍需成对噪声图像,且对噪声的独立性、零均值假设较理想化,难以处理相关性噪声或带偏置的噪声。这一工作为后续无监督去噪方法

文章图片
#计算机视觉#人工智能#深度学习
Monodepth:基于左右一致性的无监督单目深度估计,单目估计的起步-k学长深度学习专栏

Monodepth是一种创新的单目深度估计方法,通过无监督学习实现深度预测。其核心思想是将深度估计转化为图像重建问题,利用双目相机的左右图像进行训练,无需真实深度标注。方法采用编码器-解码器结构预测视差图,并通过三种关键损失函数(外观匹配损失、视差平滑损失和左右一致性损失)来优化模型性能。最大的创新点是引入左右一致性约束,使模型能更准确地理解场景的几何结构。相比传统方法,Monodepth降低了数

文章图片
#深度学习#人工智能
nnU-Net:基于unet的医学图像分割自适应框架,自动配置超参数与结构-k学长深度学习专栏

本文介绍了nnU-Net这一医学图像分割框架的创新设计与应用价值。针对传统医学分割方法泛化性差、调参复杂的问题,nnU-Net通过自配置pipeline实现了网络结构、预处理、训练策略的自动化适配。核心创新包括:1)基于数据特性的自配置网络(2D/3D U-Net及级联组合);2)标准化的训练与推理流程;3)自动模型选择与集成。实验表明,该框架在MSD多数据集上取得领先性能。虽然存在计算成本高、依

文章图片
#深度学习#人工智能
Mask2Former:用于通用图像分割的掩码注意力掩码变换器,通用分割架构(语义!实例!全景)-k学长深度学习专栏

本文提出Mask2Former,一种基于masked attention的统一分割框架。研究背景源于现有分割任务(语义/实例/全景)的割裂处理,MaskFormer虽提出统一范式但掩码生成能力有限。核心创新包括:1)masked attention机制增强query与像素特征的交互;2)多尺度特征解码器设计;3)端到端任务无关训练。实验表明其在三类分割任务中均达SOTA,但存在计算开销大、小目标分

文章图片
#深度学习#人工智能
Monodepth2:自监督单目深度估计的改进-k学长深度学习专栏

摘要:Monodepth v2针对v1版本在无相机运动、遮挡和分辨率不足等场景下的局限性,提出了三大创新方法:最小重投影损失避免遮挡误差,自动掩码排除无效训练数据,全分辨率多尺度预测提升细节精度。尽管在反射区域和复杂边界仍存在缺陷,但该模型显著提升了自监督深度估计的鲁棒性。后续DPT、MiDaS等改进模型通过引入Transformer、多数据集训练等技术进一步提升了性能。更多深度学习资源可访问k学

文章图片
#深度学习#人工智能
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择