logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

搜索算法Python入门 CS188 Proj1 学习笔记

本文介绍了四种搜索算法的Python实现:深度优先搜索(DFS)、广度优先搜索(BFS)、统一成本搜索(UCS)和A搜索。DFS使用栈结构实现深度优先遍历,BFS使用队列实现广度优先遍历,两者主要区别在于数据结构的选择。UCS和A都采用优先队列,UCS基于路径成本选择节点,A则结合启发式函数和路径成本。文章特别指出A实现中容易出现的环路问题,强调正确管理已访问节点的重要性。所有算法都遵循相似的框架

#深度优先#广度优先#人工智能 +3
多智能体搜索算法Python实现 CS188 Proj2 学习笔记

本文介绍了CS188课程项目2中关于多智能体搜索的实现过程。主要内容包括: Q1 Reflex Agent:通过改进评估函数来优化反射型智能体的表现。评估函数考虑了游戏分数、食物距离、幽灵状态等因素,并添加了对stop动作的惩罚。测试结果显示性能显著提升,但仍存在后期反复踱步的问题。 Q2 Minimax:开始实现Minimax算法,利用伪代码框架构建决策树。代码提供了游戏状态评估、合法动作获取等

#学习#人工智能#python
贝叶斯网络到粒子滤波Python算法实现 CS188 Proj4 学习笔记

这篇博客介绍了CS188课程Project 4(Ghostbusters)中前所有问题的解决思路和代码实现。

#网络#python#算法 +2
从感知机到 Attention:我用 PyTorch 打穿 CS188 机器学习终章 CS188 Proj5 学习笔记

本文围绕 CS188 Project 5 的机器学习部分展开,以 PyTorch 基础为起点,依次梳理 Tensor、Shape、Batch、DataLoader 等核心概念,并完成从感知机、非线性回归、MNIST 数字分类、语言识别 RNN、手写卷积函数到 Attention 机制的完整实现。文章不仅记录代码解法,也重点解释输入输出维度、训练流程、损失函数、激活函数选择和模型结构设计,适合 Py

文章图片
#机器学习#pytorch#学习 +2
贝叶斯网络中精确推理方法--变量消除法 CS188 Note14 学习笔记

本文介绍了贝叶斯网络中的精确推理方法——变量消除(Variable Elimination)。该方法通过逐步消除变量来高效计算条件概率,避免了枚举法需要构建完整联合概率表的高计算成本。文章以宝藏陷阱模型为例,详细展示了变量消除的7个步骤:选择相关因子、连接因子、消除变量、归一化等。与枚举法相比,变量消除通过将无关项移出求和符号,显著减少了中间表的大小。作者还讨论了消除顺序的选择策略,建议采用贪心算

#学习#人工智能#python +1
强化学习入门ⅡCS188 Note10 学习笔记

本文介绍了强化学习中的近似Q学习(Approximate Q-learning)及其相关概念。传统Q-learning缺乏泛化能力,近似Q-learning通过将状态表示为特征向量(如距离幽灵/食物的距离等),将Q函数建模为特征的线性组合,提高了内存效率和泛化能力。文章还探讨了探索与利用(Exploration vs. Exploitation)的平衡问题,介绍了ε-Greedy策略和探索函数两种

#学习#人工智能#python
强化学习入门 I CS188 Note9 学习笔记

本文介绍了强化学习中的几种核心方法。首先区分了离线规划和在线规划,重点讨论了基于模型和无模型两种学习方式。基于模型的方法通过统计样本估计转移和奖励函数,但面临状态爆炸问题。无模型学习则直接估计值函数,包括被动学习的直接评估法和时序差分学习(TD Learning),后者通过贝尔曼方程思想增量更新估值,效率更高。最后介绍了里程碑式的Q-learning算法,通过贝尔曼方程变体直接学习最优动作值函数,

#学习#人工智能#python +1
CS188 Note2 学习笔记

本文介绍了搜索问题的六要素:状态空间、动作集、转移模型、动作代价、初始状态和目标测试。以Pacman游戏为例,分析了状态空间大小的计算方法,指出实际应用中难以完全存储。对比了状态空间图(概念模型)和搜索树(实际结构)的区别,后者包含路径信息且同一状态可重复出现。最后比较了三种无信息搜索算法(DFS、BFS、UCS)的特性,包括数据结构、完备性、最优性、时空复杂度等,其中UCS能保证最优解但可能耗时

#学习#人工智能
到底了