logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习笔记(二)马尔可夫决策过程

马尔可夫性序贯决策:智能体状态会随时间发生转移马尔可夫性:未来状态只依赖于当前状态。这里涉及到对“状态”的定义。P[st+1∣s1,⋯ ,st]=P[st+1∣st]\mathbb P[s_{t+1}|s_1,\cdots,s_t]=\mathbb P[s_{t+1}|s_t]P[st+1​∣s1​,⋯,st​]=P[st+1​∣st​]部分可观测:智能体不能获得环境的全部信息s,只能获得观测量o

#机器学习
一文学会LaTeX基础

一文学会LaTeX基础

文章图片
#经验分享
模式识别笔记(一)概论、贝叶斯决策(参数估计、非参数估计)

概论人工智能:机器对人类智能的模仿人类智能:感知、学习、思考、语言、行动模式识别(机器感知):将非结构化数据转化为结构化知识模式识别基本方法:特征提取、特征选择特征空间上的分类器分类器设计过程:选择分类器类型、设计损失函数/似然函数、训练(参数估计)数据集分类:训练集、验证集、测试集验证集:训练后在这一数据集上对模型进行评价、修改泛化性:测试数据上的分类性能过拟合:在训练集上性能好,但泛化性不好;

#机器学习#人工智能#算法
到底了