imDwAaY 个人主页

@2405_88524973

imDwAaY

2026-05-18 23:24:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从朴素贝叶斯到参数估计，机器学习到底在“学”什么？ CS188 Note19 学习笔记

本文围绕 CS188 机器学习入门内容展开，介绍监督学习、数据集划分、朴素贝叶斯分类思想及其条件独立假设，并进一步说明如何通过最大似然估计学习模型参数。文章最后讨论了 MLE 的零概率问题，并引入 Laplace Smoothing 来提升模型的泛化能力。

#学习 #算法 #人工智能 +2

机器学习入门：从感知机到逻辑回归，理解线性分类器与Softmax CS188 Note20 学习笔记

本文围绕机器学习中的线性模型展开，系统梳理线性分类器、二分类与多分类感知机、线性回归、逻辑回归以及 Softmax 多分类方法。文章重点解释特征向量、权重、决策边界、Bias、损失函数、梯度下降和最大似然等核心概念，帮助读者建立从感知机到逻辑回归的整体理解。

#机器学习 #逻辑回归 #学习 +2

从感知机到 Attention：我用 PyTorch 打穿 CS188 机器学习终章 CS188 Proj5 学习笔记

本文围绕 CS188 Project 5 的机器学习部分展开，以 PyTorch 基础为起点，依次梳理 Tensor、Shape、Batch、DataLoader 等核心概念，并完成从感知机、非线性回归、MNIST 数字分类、语言识别 RNN、手写卷积函数到 Attention 机制的完整实现。文章不仅记录代码解法，也重点解释输入输出维度、训练流程、损失函数、激活函数选择和模型结构设计，适合 Py

#机器学习 #pytorch #学习 +2

搜索算法Python入门 CS188 Proj1 学习笔记

本文介绍了四种搜索算法的Python实现：深度优先搜索(DFS)、广度优先搜索(BFS)、统一成本搜索(UCS)和A搜索。DFS使用栈结构实现深度优先遍历，BFS使用队列实现广度优先遍历，两者主要区别在于数据结构的选择。UCS和A都采用优先队列，UCS基于路径成本选择节点，A则结合启发式函数和路径成本。文章特别指出A实现中容易出现的环路问题，强调正确管理已访问节点的重要性。所有算法都遵循相似的框架

#深度优先 #广度优先 #人工智能 +3

多智能体搜索算法Python实现 CS188 Proj2 学习笔记

本文介绍了CS188课程项目2中关于多智能体搜索的实现过程。主要内容包括： Q1 Reflex Agent：通过改进评估函数来优化反射型智能体的表现。评估函数考虑了游戏分数、食物距离、幽灵状态等因素，并添加了对stop动作的惩罚。测试结果显示性能显著提升，但仍存在后期反复踱步的问题。 Q2 Minimax：开始实现Minimax算法，利用伪代码框架构建决策树。代码提供了游戏状态评估、合法动作获取等

#学习 #人工智能 #python

贝叶斯网络到粒子滤波Python算法实现 CS188 Proj4 学习笔记

这篇博客介绍了CS188课程Project 4（Ghostbusters）中前所有问题的解决思路和代码实现。

#网络 #python #算法 +2

从感知机到 Attention：我用 PyTorch 打穿 CS188 机器学习终章 CS188 Proj5 学习笔记

#机器学习 #pytorch #学习 +2

贝叶斯网络中精确推理方法--变量消除法 CS188 Note14 学习笔记

本文介绍了贝叶斯网络中的精确推理方法——变量消除(Variable Elimination)。该方法通过逐步消除变量来高效计算条件概率，避免了枚举法需要构建完整联合概率表的高计算成本。文章以宝藏陷阱模型为例，详细展示了变量消除的7个步骤：选择相关因子、连接因子、消除变量、归一化等。与枚举法相比，变量消除通过将无关项移出求和符号，显著减少了中间表的大小。作者还讨论了消除顺序的选择策略，建议采用贪心算

#学习 #人工智能 #python +1

强化学习入门ⅡCS188 Note10 学习笔记

本文介绍了强化学习中的近似Q学习（Approximate Q-learning）及其相关概念。传统Q-learning缺乏泛化能力，近似Q-learning通过将状态表示为特征向量（如距离幽灵/食物的距离等），将Q函数建模为特征的线性组合，提高了内存效率和泛化能力。文章还探讨了探索与利用（Exploration vs. Exploitation）的平衡问题，介绍了ε-Greedy策略和探索函数两种

#学习 #人工智能 #python

强化学习入门 I CS188 Note9 学习笔记

本文介绍了强化学习中的几种核心方法。首先区分了离线规划和在线规划，重点讨论了基于模型和无模型两种学习方式。基于模型的方法通过统计样本估计转移和奖励函数，但面临状态爆炸问题。无模型学习则直接估计值函数，包括被动学习的直接评估法和时序差分学习（TD Learning），后者通过贝尔曼方程思想增量更新估值，效率更高。最后介绍了里程碑式的Q-learning算法，通过贝尔曼方程变体直接学习最优动作值函数，

#学习 #人工智能 #python +1

共 11 条

请选择