
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
【计算机视觉(6)】边缘与直线检测基础篇:从Canny到Hough变换
【计算机视觉(6)】边缘与直线检测基础篇:从Canny到Hough变换
【模式识别与机器学习】机器学习练习题集 - 答案与解析
机器学习练习题集 - 答案与解析
【模式识别与机器学习(14)】惰性学习kNN(聚类分析)【3】K-means算法中K值确定的五种方式
【模式识别与机器学习(14)】K-means算法中K值确定教程
【模式识别与机器学习(16)】惰性学习kNN(聚类分析)【1】:基础概念与常见方法
【模式识别与机器学习(16)】聚类分析【1】:基础概念与常见方法
【AI Engineering】什么是Agent?如何构建和评估AI Agent?
【AI Engineering】什么是Agent?如何构建和评估AI Agent?
【AI Engineering】什么是Agent?如何构建和评估AI Agent?
【AI Engineering】什么是Agent?如何构建和评估AI Agent?
【强化学习基础(2)】被动强化学习:学习价值函数
被动强化学习(Passive Reinforcement Learning)是指智能体有一个固定的策略π(s),它按照这个策略行动,学习状态的价值函数U(s)。价值函数表示"从状态s开始,按照策略π,期望能获得多少累积奖励"。在被动学习中,智能体不知道环境的转移模型P(s’|s, a)和奖励函数R(s, a, s’)。它只能通过观察来学习:执行动作,观察结果状态和奖励,然后更新对状态价值的估计。这

【强化学习基础(2)】被动强化学习:学习价值函数
被动强化学习(Passive Reinforcement Learning)是指智能体有一个固定的策略π(s),它按照这个策略行动,学习状态的价值函数U(s)。价值函数表示"从状态s开始,按照策略π,期望能获得多少累积奖励"。在被动学习中,智能体不知道环境的转移模型P(s’|s, a)和奖励函数R(s, a, s’)。它只能通过观察来学习:执行动作,观察结果状态和奖励,然后更新对状态价值的估计。这

【系统架构设计(34)】计算机网络架构与技术基础
【系统架构设计(33)】计算机网络架构与技术基础








