
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习笔记(二)马尔可夫决策过程
马尔可夫性序贯决策:智能体状态会随时间发生转移马尔可夫性:未来状态只依赖于当前状态。这里涉及到对“状态”的定义。P[st+1∣s1,⋯ ,st]=P[st+1∣st]\mathbb P[s_{t+1}|s_1,\cdots,s_t]=\mathbb P[s_{t+1}|s_t]P[st+1∣s1,⋯,st]=P[st+1∣st]部分可观测:智能体不能获得环境的全部信息s,只能获得观测量o
一文搞定pytorch配置
简易版安装pytorch指南

一文搞定pytorch配置
简易版安装pytorch指南

一文学会LaTeX基础
一文学会LaTeX基础

模式识别笔记(一)概论、贝叶斯决策(参数估计、非参数估计)
概论人工智能:机器对人类智能的模仿人类智能:感知、学习、思考、语言、行动模式识别(机器感知):将非结构化数据转化为结构化知识模式识别基本方法:特征提取、特征选择特征空间上的分类器分类器设计过程:选择分类器类型、设计损失函数/似然函数、训练(参数估计)数据集分类:训练集、验证集、测试集验证集:训练后在这一数据集上对模型进行评价、修改泛化性:测试数据上的分类性能过拟合:在训练集上性能好,但泛化性不好;
到底了







