闵帆个人主页

@minfanphd

闵帆

2023-08-15 15:08:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习极简例子--迷宫问题

迷宫图1为一个小型迷宫，其中S为入口，−-−表示墙，+++表示出口。你说出口不在边缘？对的，就是这么任性。图1. 迷宫解法1: 单源最短路径我们把迷宫的各个可达状态进行编号，获得图2.图2. 编号后的迷宫将各可达状态看成节点并编号，则相邻节点之间的距离为1，则迷宫可以转成无向图。令0号节点为源，18号节点为目的，则该问题为单源最短路径问题。但是，我们偏不。解法2: 强化学习强化学习有两个实体: 一

#机器学习 #自然语言处理 #线性代数

论文笔记: 分类不确定性计算的证据深度学习方法

摘要: 本文描述对论文 Murat Sensoy, Lance Kaplan, Melih Kandemir, Evidential deep learning to quantify classification uncertainty, NIPS 2018 的理解.

#论文阅读 #分类 #深度学习

深度学习C++代码配套教程（5附1: CNN代码调拭）

CNN 的代码出了问题, 这里把调拭过程展示出来, 希望对读者有用.1. 问题网络训练好后, 对不同的输入产生了相同的输出. 例如, 预测值总是 7.将训练过程的预测值打印, 发现同一批的输出都是相同的, 但不同批的输出可能不同. 网络是在每批数据 forward 和 backPropagation 之后进行 updateParameters, 因此, 预测值主要由网络确定.进一步打印每次预测的分

#机器学习 #c++

强化学习极简例子--井字棋

井字棋3*3的棋盘上，白、黑子轮流下。如果某方棋子占满同一行、同一列、同一条斜线，则算赢。当棋盘占满还未分出胜负，则为和棋。棋局状态编码由于每个位置有三种可能状态：空（0）、白（1）、黑（2），可用3进制来表示棋局当前状态，其中0行0列表示最低位，0行1列表示次低位。图1. 棋局例图1所示棋局，用3进制表示为001200210，转化为十进制即0×38+0×37+1×36+2×35+0×34+0×3

#人工智能 #算法 #机器学习

论文写作 12: 算法伪代码 (含实例)

算法伪代码是论文的核心之一.需要说明输入、输出;方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;需要写出主要步骤的注释;长度控制在 15-30 行;可使用数学式子或对已有数学式子的引用;不重要的步骤可以省略;一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准.例子:...

#算法 #开发语言 #线性代数

从 AI 级别到人类棋手级别

为增加游戏的趣味性，需要判断人类棋手级别.1. 棋手分析当前涉及三个实体.1.1 传统 AI传统 AI 是指当前使用的 AI, 其机制需要深入理解. 个人而言, 我不太清楚. 猜测: 它赖于 a) 一些既定的规则，与 b) 一定的搜索.级别: 不同级别的 AI 使用不同的规则、不同的搜索策略. 或者相同的搜索策略，但不同的搜索深度。1.2 强化 AI强化 AI是指将使用强化学习与深度学习结合获得的

#游戏 #深度学习

到底了