2301_81927851 个人主页

@2301_81927851

2301_81927851

2023-12-30 14:35:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习和机器学习到底有啥区别？零基础先学哪个？一篇说透k学长的深度学习宝库

机器学习与深度学习的区别及学习路径指南摘要：机器学习（ML）和深度学习（DL）是AI领域的核心分支，二者为包含关系（ML包含DL）。ML依赖人工特征工程，适合结构化数据和中小规模任务；DL通过神经网络自动提取特征，擅长非结构化数据和大规模场景。零基础者建议先学ML，掌握特征工程、基础算法（如线性回归、决策树）及数学原理（线性代数、概率统计），再过渡到DL。典型学习周期约6个月，需依次掌握Pyth

#深度学习 #人工智能

基于Transformer的无人机对地突防轨迹预测方法研究【k学长深度学习宝库】

本文介绍了一个基于深度学习的无人机轨迹预测系统。该系统采用多模态神经网络架构，通过处理历史飞行数据（包括三维坐标和速度）来预测未来轨迹。系统包含数据预处理、模型训练、性能评估和可视化四大模块，支持滑动窗口技术处理序列数据。评估指标包括MSE、RMSE和MAE，并提供三维轨迹图等可视化工具。系统适用于空中交通管理等场景，但对数据质量和计算资源有一定要求。详情可访问k学长的深度学习宝库获取源码和教程。

#深度学习 #transformer #无人机

k学长的深度学习宝库：YOLOv11改进：WTConv小波卷积提升大感受野与检测精度（ECCV 2024）

本文介绍了一种新型小波卷积层(WTConv)，通过小波变换解决CNN大感受野带来的参数膨胀问题。WTConv利用多频率响应扩展感受野，参数仅对数增长，显著提升了特征提取效率。实验表明，在YOLOv11中应用WTConv构建的C3k2模块，相比基础模型减少了11.4万参数和0.2GFLOPs计算量，实现了有效的轻量化。该方法参数增长平缓、感受野扩大且形状偏差提升，为CNN改进提供了高效易集成的解决方

#深度学习 #人工智能

U-Net++：嵌套密集跳跃连接，多尺度融合增强特征表达，医学影像分割的unet创新-k学长深度学习专栏

医学图像分割模型UNet++的创新与局限 UNet++是针对医学图像分割需求提出的改进模型，通过嵌套密集跳跃连接和深度监督机制解决了U-Net存在的语义鸿沟问题。其核心创新包括：1）重新设计跳跃路径，通过逐级卷积缩小编码器与解码器特征间的语义差距；2）采用密集连接优化梯度流动；3）引入多尺度深度监督提升训练稳定性。实验显示其在多个医学数据集上IoU指标平均提升3.9%。但该模型存在计算成本高、实现

#深度学习 #人工智能

ResUNet：U-Net 中加入残差块-k学长深度学习专栏

摘要：ResUNet是一种结合U-Net和残差学习的深度学习模型，用于航拍道路提取任务。该模型通过U-Net的"沙漏"结构实现特征提取与细节恢复，并引入残差块的"短路连接"解决深层网络训练难题。其创新点在于用残差块替换普通卷积层，形成双重信息通道，使浅层细节与深层语义特征更好融合。相比传统U-Net，ResUNet具有训练更轻松、信息流通更顺畅、参数更少性能

#深度学习 #人工智能 #图像处理

Restormer：用于高分辨率图像恢复的高效 Transformer-k学长深度学习专栏

Restormer是一种高效Transformer模型，专为高分辨率图像修复任务设计。它通过三大创新解决传统Transformer的计算瓶颈：1）高效注意力机制（MDTA），将复杂度从O(N²)降为线性；2）通道-空间双注意力融合（GDFN），实现跨通道特征协调；3）分层U-Net结构，结合全局语义与局部细节。相比CNN和SwinIR，Restormer既能建模全局依赖，又保持局部精度，在去噪、超

#人工智能 #深度学习

Noise2Noise：无监督去噪方法-k学长深度学习专栏

Noise2Noise颠覆了传统图像去噪需要干净样本的局限，提出仅用成对噪声图像即可训练模型。其核心思想是利用噪声的随机性，通过两张独立噪声图像让网络自动学习忽略噪声、保留真实内容。该方法在数学上证明了用噪声图像替代干净标签的可行性，且适用于多种噪声类型。虽然降低了数据采集门槛，但仍需成对噪声图像，且对噪声的独立性、零均值假设较理想化，难以处理相关性噪声或带偏置的噪声。这一工作为后续无监督去噪方法

#计算机视觉 #人工智能 #深度学习

Monodepth：基于左右一致性的无监督单目深度估计，单目估计的起步-k学长深度学习专栏

Monodepth是一种创新的单目深度估计方法，通过无监督学习实现深度预测。其核心思想是将深度估计转化为图像重建问题，利用双目相机的左右图像进行训练，无需真实深度标注。方法采用编码器-解码器结构预测视差图，并通过三种关键损失函数（外观匹配损失、视差平滑损失和左右一致性损失）来优化模型性能。最大的创新点是引入左右一致性约束，使模型能更准确地理解场景的几何结构。相比传统方法，Monodepth降低了数

#深度学习 #人工智能

nnU-Net：基于unet的医学图像分割自适应框架，自动配置超参数与结构-k学长深度学习专栏

本文介绍了nnU-Net这一医学图像分割框架的创新设计与应用价值。针对传统医学分割方法泛化性差、调参复杂的问题，nnU-Net通过自配置pipeline实现了网络结构、预处理、训练策略的自动化适配。核心创新包括：1）基于数据特性的自配置网络（2D/3D U-Net及级联组合）；2）标准化的训练与推理流程；3）自动模型选择与集成。实验表明，该框架在MSD多数据集上取得领先性能。虽然存在计算成本高、依

#深度学习 #人工智能

Mask2Former：用于通用图像分割的掩码注意力掩码变换器，通用分割架构（语义!实例!全景）-k学长深度学习专栏

本文提出Mask2Former，一种基于masked attention的统一分割框架。研究背景源于现有分割任务（语义/实例/全景）的割裂处理，MaskFormer虽提出统一范式但掩码生成能力有限。核心创新包括：1）masked attention机制增强query与像素特征的交互；2）多尺度特征解码器设计；3）端到端任务无关训练。实验表明其在三类分割任务中均达SOTA，但存在计算开销大、小目标分

#深度学习 #人工智能

共 40 条

请选择