logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【声纳与人工智能融合——从理论前沿到自主系统实战】第十章 总结、技术挑战与未来展望

然而,声纳数据的标注面临独特的困难:首先,水声信号的专业性强,需要具备声纳物理、海洋声学与水文环境知识的专家进行标注,人力成本极高;从数据驱动的模式识别到物理引导的因果推理,从单平台自动化到多平台集群智能,这一领域的技术进步将深刻改变海洋探索、资源开发与水下作战的形态。面对数据稀缺、计算约束与跨域泛化等挑战,研究者需在自监督学习、模型压缩与神经符号AI等前沿方向持续创新,推动声纳系统从自动化迈向真

#人工智能#深度学习
【全身灵巧操作:3D扩散策略、力自适应与接触显式学习】第七章 高效推理与实时控制 》》》人形机器人专栏

在精度与延迟的权衡分析中,单步一致性模型在典型操作任务上的成功率达到多步教师的百分之九十五以上,而推理延迟从数百毫秒降至十毫秒级别,满足实时控制需求。在Intel NUC平台上,通过OpenVINO运行时优化,扩散策略能够以每秒三十次的频率生成动作,满足大多数操作任务的实时性要求。在执行层面,采用模型预测控制风格的重规划策略,仅执行第一个关键姿态对应的轨迹段,随后基于新观测重新规划,实现闭环鲁棒性

#人工智能#机器学习#算法
具身智能算法:从理论到实践 -- 第1章 具身智能概述

具身智能是指具有物理形态的智能体,通过"感知-决策-行动-反馈"闭环系统与物理环境进行持续交互,能够理解、适应并改造环境,具备在开放世界中完成复杂任务能力的智能系统。其核心特征包括:具身性(Embodiment)、交互性(Interaction)、适应性(Adaptability)和涌现性(Emergence)。这一定义标志着学术界对具身智能认识的深化与统一。相较于2020年代初期仅强调"物理实体

#microsoft
【高级强化学习:算法、优化与泛化】第七章 元强化学习与快速适应 (Meta-Reinforcement Learning)

SNAIL 架构结合因果卷积与注意力机制,通过时间卷积提供高带宽的近期信息访问,并通过注意力机制实现长期的精确信息检索,克服了传统 RNN 的梯度消失与长期依赖限制。本章所呈现的元强化学习实现涵盖了从基于梯度的快速适应(MAML、Meta-SGD、Reptile)到基于记忆的任务推断(RL²、SNAIL、PEARL)的完整技术栈。基于记忆的元学习利用循环神经网络的隐状态或显式上下文编码器来隐式学习

#人工智能#深度学习
【高级强化学习:算法、优化与泛化】第二章 深度强化学习的高样本效率与模型化方法

目标策略平滑机制在目标网络的动作选择环节引入服从截断正态分布的随机扰动,通过对动作空间施加有界噪声,平滑价值函数在动作维度上的变化率,降低策略对特定动作模式过度拟合的风险。该方法采用短视域模型预测与真实数据混合训练的策略,通过控制虚拟轨迹与真实交互的比例,在保持样本效率的同时抑制模型复合误差的累积。该方法在动作价值函数的学习过程中引入保守性惩罚项,要求学习到的Q值低于真实值,从而在策略评估阶段避免

#人工智能#深度学习
【幻觉缓解算法 - 减少大模型错误生成】第二章 知识增强架构与推理时干预策略

Chain-of-RAG采用顺序分解策略,将复杂查询拆解为子问题链,每个子问题的答案作为下一轮检索的查询条件,逐步收敛至目标信息。多源策略确保覆盖单源检索的盲区,解释生成增强了系统的可审计性。更关键的是,基础RAG缺乏动态知识更新机制,无法识别检索结果中的时效性信息,导致模型在回答涉及近期事件或快速演变领域的问题时产生事实性幻觉。模型在生成过程中实时评估 token 级或片段级的置信度,当概率分布

文章图片
#人工智能#深度学习#计算机视觉
【幻觉缓解算法 - 减少大模型错误生成】第一章 幻觉的本质、形式化定义与评估体系

内在幻觉描述的是生成内容与输入上下文之间的逻辑冲突,即模型输出中包含与源文本明确矛盾的信息片段。QAGS 采用问答作为摘要忠实性的代理任务,通过检验基于摘要生成的答案与基于原文生成的答案之间的一致性来间接测量信息失真。架构层面的局限体现在注意力机制的设计偏置。固定长度的上下文窗口构成了信息处理的硬边界,超出该范围的语境线索被截断处理,破坏了事实核查所需的完整证据链。在该框架下,风险度量涵盖两个层面

文章图片
#人工智能#深度学习#计算机视觉
【幻觉缓解算法 - 减少大模型错误生成】第三章 监督微调与对齐训练的事实性优化

通过从专家模型的对数几率中减去业余模型的对数几率(按温度缩放),对比解码放大了专家模型的优势,抑制了业余模型也可能犯错的高置信度错误,从而提升事实准确性。不同于标准的检索增强生成(RAG)在生成前仅检索一次上下文,该方法在每一步解码时都动态检索与当前前缀相关的证据,并调整词汇分布以提升检索证据中出现的实体与关系token的概率。这种细粒度的检索干预能够有效纠正生成过程中的事实偏离。通过在特定架构约

文章图片
#算法#人工智能
对 YOLOv26 及现有 YOLO 变体的全面综述:架构、训练方法以及在医疗和通用计算机领域的应用幻想

原文地址,本文仅作翻译学习使用,如遇侵权,请联系本人删除统一单阶段设计与高效推理。本文全面回顾了最先进的YOLO模型,重点介绍了YOLOv26的核心思想——一种端到端检测框架,该框架从整个推理流程中移除了非极大值抑制。此外,本文从检测头、无分布焦点损失(Distribution Focal Loss)的损失设计、统一训练目标以及基于MuSGD的优化等方面研究了其架构构成。随后,本文进一步从多个维度

#架构
从 YOLOv1 到 YOLOv26 的 YOLO 家族综述 A Review of YOLO Family from YOLOv1 to YOLO26

目标检测技术构成了从自主系统到医学影像等广泛应用领域实时性能的基础。本研究分析了YOLO系列(该领域的基准方法)从最初的版本到当前YOLOv26模型的广泛架构演进。本文按时间顺序考察了主干网络(backbone)、颈部(neck)和检测头(head)组件中的结构变革。综述聚焦于关键技术里程碑,包括从基于锚框(anchor-based)到无锚框(anchor-free)系统的转变、注意力机制的集成以

#人工智能
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择