logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【深度学习】U-Net系列(六):常见问题与调优指南(FAQ)

U-Net常见问题与调优指南摘要:本文系统梳理了U-Net实践中的典型问题及解决方案,涵盖训练不收敛(学习率调整、数据归一化)、过拟合/欠拟合识别与应对策略、类别不平衡处理方法(加权损失函数、Focal Loss)。同时提供数据加载验证模板和性能优化方案,包括混合精度训练(显存减少50%)、梯度检查点、推理加速(TorchScript/ONNX)等关键技术。针对医学图像分割特有的小目标问题,重点分

#深度学习#人工智能#图像处理
深度学习驱动的控制方法详解(十二):实战案例与工程部署

本文是深度学习控制系列文章的终章,聚焦工程实践环节,通过两个典型案例展示从仿真到真实部署的全流程。第一个案例详细介绍了四足机器人运动控制的深度强化学习实现,包括40维状态空间和12维动作空间的设计、基于PPO算法的训练流程、奖励函数工程以及课程学习策略。第二个案例展示了机械臂抓取任务,采用SAC算法构建端到端控制系统,包含15维状态空间和8维动作空间的设计。文章特别强调了工程实现细节,如并行环境设

#深度学习#人工智能#学习 +1
【深度学习】U-Net系列(零):前置知识——深度学习与图像分割基础

本文介绍了深度学习图像分割的基础知识,重点为理解U-Net架构做准备。主要内容包括: 图像分割任务分类(语义/实例/全景分割) CNN核心组件(卷积、池化、激活函数) 编码器-解码器结构原理 上采样方法与损失函数 训练流程及评估指标 这些知识是理解U-Net创新点(如跳跃连接、端到端像素预测)的重要基础,特别适合医学图像等需要精确边界的分割任务。

#深度学习#人工智能#拓扑学
深度学习驱动的控制方法详解(十):Physics-Informed Neural Networks控制

本文介绍了物理信息神经网络(PINN)在控制领域的应用。PINN通过将物理定律作为约束嵌入神经网络,实现了数据高效且符合物理规律的学习控制。文章首先阐述了PINN的基本原理,包括将物理方程(PDE)作为损失函数的一部分,并展示了自动微分计算物理残差的方法。随后详细讲解了PINN在控制系统中的两种应用:一是用于构建物理约束的动力学模型,通过能量守恒等物理原理增强模型可靠性;二是设计物理约束控制器,将

#深度学习#人工智能
深度学习驱动的控制方法详解(七):基于模型的深度学习控制

核心要点动力学建模:概率集成模型量化不确定性MPC规划:CEM、MPPI等优化方法Dyna架构:用模型生成虚拟数据MBPO:当前最佳Model-Based方法关键公式pθst1∣statNμθσθ2pθ​st1​∣st​at​Nμθ​σθ2​min⁡a0H−1∑t0H−1cstats.t.st1fθstata0H−1​min​t0∑H−1。

#深度学习#人工智能
无人机视觉语言导航从入门到精通(二十四):前沿研究方向与热点

摘要:本文系统梳理了无人机视觉语言导航(UAV-VLN)四大前沿研究方向:持续学习解决部署后环境适应问题,通过EWC等方法缓解灾难性遗忘;多智能体协作探索多无人机协同导航新范式;对话导航实现更自然的人机交互;开放世界导航突破封闭数据集限制。文章详细分析了持续学习的核心挑战、典型场景及主流方法(正则化、回放等),为读者把握领域发展脉络和开展深入研究提供了系统性参考。这些方向将推动VLN技术从实验室走

#无人机#cocos2d#游戏引擎
无人机路径规划仿真场景生成机制深度分析

本文分析了五种主流无人机规划项目的场景生成机制。EGO-Planner采用随机森林和Perlin噪声生成3D障碍物;EGO-Planner-Swarm在单机基础上扩展集群协同;GCOPTER专注于全局轨迹规划,使用Perlin噪声和迷宫结构;RACER支持PCD文件加载实现真实场景仿真;SUPER通过OpenGL渲染实现高速飞行测试。各项目场景生成技术差异显著,EGO系列侧重随机障碍物,GCOPT

#无人机
视觉语言导航从入门到精通(三)

VLN Agent 架构Language EncoderCross-Modal FusionVisual EncoderAction DecoderAction: 前进/左转/右转/停止模块功能Language Encoder编码自然语言指令Visual Encoder编码视觉观察Cross-Modal Fusion融合语言和视觉特征Action Decoder解码生成导航动作1.2 导航循环2.

#transformer
CS285 深度强化学习(七):Model-based RL(上)——学会想象

前面我们学习的算法——策略梯度、Actor-Critic、DQN——都属于 Model-free(无模型) 方法。它们直接从经验中学习策略或价值函数,不需要了解环境是如何工作的。但这种"不理解环境"的学习方式有一个代价:样本效率低。DQN 需要数百万帧才能学会一个 Atari 游戏,而人类玩几分钟就能上手。Model-based RL(基于模型的强化学习) 采用不同的策略:先学习环境的模型,再用模

#深度学习#人工智能
ROS 2从入门到精通系列(十八):视觉识别系统 - 目标检测与跟踪

ROS 2视觉识别系统:目标检测与跟踪 本文介绍了基于ROS 2构建的完整视觉处理系统架构,重点实现YOLOv8目标检测功能。系统包含硬件层(RGB/深度摄像头)、采集层(图像获取与标定)、检测层(YOLO等模型)、跟踪层(卡尔曼滤波等)和识别层(分类/分割)。通过Python节点实现了YOLOv8模型的实时目标检测,包括图像订阅、目标识别、结果处理和可视化输出功能,可输出检测框、类别标签和置信度

#目标检测#人工智能#计算机视觉 +2
    共 105 条
  • 1
  • 2
  • 3
  • 11
  • 请选择