logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【RL Latest Tech】安全强化学习(Safe RL):理论、方法与应用

在强化学习(Reinforcement Learning, RL)中,智能体通过与环境的交互来学习一个策略,以最大化长期累积回报。然而,传统的强化学习算法在优化回报时往往不考虑智能体行为的安全性,导致在训练或部署过程中可能出现不安全的行为。**安全强化学习(Safe Reinforcement Learning,Safe RL)**正是在此背景下提出的,它旨在在优化回报的同时确保智能体的行为符合某

文章图片
#安全#人工智能#机器学习 +1
【强化学习】演员评论家Actor-Critic算法(万字长文、附代码)

演员评论家,Actor-Critic算法是强化学习领域的一种重要方法,结合了“演员”(Actor)和“评论家”(Critic)两个部分,它结合了值函数估计和策略优化的优点。在理解其背景时,需要从强化学习的演化历史、策略梯度方法的局限性以及如何通过值函数辅助优化策略展开。文章用一个生活中的比喻来说明它的原理。

文章图片
#人工智能#算法#python +1
【强化学习】Double DQN(Double Deep Q-Network)算法

强化学习中的深度Q网络(DQN)是一种将深度学习与Q学习结合的算法,它通过神经网络逼近Q函数以解决复杂的高维状态问题。然而,DQN存在过估计问题(Overestimation Bias),即在更新Q值时,由于同时使用同一个网络选择动作和计算目标Q值,可能导致Q值的估计偏高。Double DQN(DDQN)引入了“双网络”机制来缓解这个问题,从而提高了算法的稳定性和收敛性。

文章图片
#算法#人工智能#机器学习
深度学习方法的改进

深度学习的成功来自于以下 3 个要素:一是数据:二是算法:三是算力:早在 2014 年,深度学习的诸多缺陷不断地被发现,预示着这条道路遇到了瓶颈。深度学习为何如此脆弱,容易受攻击,被欺骗和不安全。基于深度学习的 AI 具有不可解释性和鲁棒性差等缺陷,并针对这两个缺陷展开分析。2 深度学习的改进分析2.1可解释性问题人类理解机器决策过程的核心难点是跨越数据特征空间和人类语义空间之间的鸿沟。

文章图片
#深度学习#人工智能
【启发式算法】Dynamic A*(D*)算法详细介绍(Python)

本文介绍了动态A*(D*)路径规划算法及其Python实现。D算法是A的改进版本,适用于动态环境中机器人路径规划,能够通过增量更新高效处理障碍物变化。文章详细阐述了D的工作原理,包括反向搜索、局部更新和优先队列机制,并提供了完整的Python代码实现,包含地图建模、状态处理和动画可视化功能。该算法广泛应用于机器人导航、自动驾驶和无人机领域,具有实时性强、计算效率高等优点,但也存在实现复杂、内存消耗

文章图片
#人工智能#算法#机器学习 +2
数字视网膜与云视觉系统演进

高文院士分享了如何利用对神经网络的理解来改进包括城市大脑或智慧城市系统等现有云视觉系统方面存在的一些问题。高文院士等人从高级生命体视觉系统的进化历史中寻找灵感,在设计新的第二代城市大脑或者说云视觉系统时,在中间的视觉神经通道做工作。他们将这一想法称之为数字视网膜。

文章图片
#人工智能#深度学习#云计算 +1
【RL Latest Tech】分层强化学习:FeUdal Networks算法

FeUdal Networks(FuN)是一种分层强化学习(Hierarchical Reinforcement Learning, HRL)算法,由Google DeepMind团队提出。该算法的灵感来源于层级控制结构,将任务分解为高层目标和低层执行细节,从而提高强化学习在复杂环境中的效率。与传统的强化学习算法不同,FeUdal Networks将学习过程分为不同的层次,每个层次的角色不同,但都

文章图片
#算法#人工智能#机器学习 +1
【RL Latest Tech】分层强化学习:MAXQ分解算法

MAXQ分解是一种用于分层强化学习(Hierarchical Reinforcement Learning, HRL)的算法,由Thomas G. Dietterich提出。该算法通过将复杂的任务分解成更小的子任务来简化问题,并利用这些子任务来构建更复杂的策略。主要思想是将一个复杂的Markov决策过程(MDP)分解成一系列嵌套的子MDP,以便更容易解决。MAXQ算法引入了一种分层的结构,将原始任

文章图片
#算法#人工智能#机器学习 +1
【DRL】深度强化学习介绍

深度强化学习本文介绍:[Python] 深度Q网络(DQN)实现[Python] REINFORCE算法实现[Results] 运行结果随着深度学习的迅猛发展,深度强化学习(Deep Reinforcement Learning, DRL)将深度学习与强化学习相结合,使得处理高维状态空间成为可能。

文章图片
#人工智能#python#算法
【RL Latest Tech】元强化学习(Meta Reinforcement Learning)

元强化学习是一种提升智能体适应新任务能力的技术,它让智能体不仅能学习完成当前的任务,还能在面对新的任务或环境时更快地学会新的策略。与传统的强化学习不同,元强化学习关注如何学习得更快、更高效,即学习如何学习。它让智能体在多种任务之间迁移经验,以应对任务变化或环境变化。核心思想元强化学习的核心思想是通过一个“元层”对多个任务进行学习和优化。该元层不是直接学习如何执行任务,而是学习如何在给定的任务下快速

文章图片
#人工智能#算法#python
    共 101 条
  • 1
  • 2
  • 3
  • 11
  • 请选择