logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【深度学习04】PyTorch:损失函数、优化器、模型微调、保存与加载

本文介绍了神经网络训练中的损失函数与反向传播机制。文章首先阐述了损失函数的作用:量化模型预测与真实目标的差距,为反向传播提供依据。接着,重点讲解并用代码演示了L1 Loss、MSE Loss及CrossEntropy Loss三种常用损失函数的计算方法。文中还展示了如何在训练循环中集成损失计算,并阐明了反向传播正是利用计算出的损失值来调整网络参数,从而使模型预测不断逼近真实目标。全文结合图示与代码

文章图片
#深度学习#pytorch#人工智能 +2
【机器学习11】决策树进阶、随机森林、XGBoost、模型对比

本文深入探讨决策树模型的高级应用与集成学习方法。首先讲解了决策树如何通过独热编码和最优分割点来处理多值分类特征与连续特征,并介绍了其在回归任务中如何基于方差缩减进行学习。随后,为解决单棵决策树的不稳定性,文章详细阐述了两种强大的集成技术:Bagging(及其演进版随机森林)和Boosting(及其高效实现XGBoost)。最后,对决策树与神经网络的优劣进行了全面对比,为不同场景下的模型选择提供指导

文章图片
#机器学习#决策树#随机森林 +4
【机器学习14】深度学习推荐系统、降维技术PCA

本文探讨了推荐系统的高级应用与方法,重点介绍了基于深度学习的现代推荐架构。首先分析了协同过滤的局限性(如冷启动问题),提出通过引入额外信息构建混合推荐系统。然后比较了协同过滤与基于内容过滤的区别,并详细阐述了深度学习推荐系统的实现方案:使用用户网络和物品网络分别生成低维嵌入向量,通过点积预测评分。对于大规模系统,推荐采用召回(快速筛选候选)和排序(精准打分)两阶段流程。最后简要提及了TensorF

文章图片
#机器学习#深度学习#人工智能 +1
【机器学习13】异常检测优化、推荐系统、协同过滤

本文首先深入探讨了异常检测与监督学习的核心区别与适用场景,并介绍了通过特征工程优化异常检测模型的方法。随后,文章系统性地引入了推荐系统,从基于内容的推荐算法入手,详细讲解了如何为用户和物品构建模型。核心部分聚焦于强大的协同过滤算法,阐述了其如何同时学习用户偏好和物品特征,并覆盖了均值归一化处理冷启动问题以及在TensorFlow中实现自定义训练循环等关键技术细节。

文章图片
#机器学习#人工智能#学习 +1
【机器学习16】连续状态空间、深度Q网络DQN、经验回放、探索与利用

本文介绍了连续状态空间下的强化学习及其应用。相较于离散状态空间,连续状态空间(如自动驾驶直升机、月球登陆器)使用高维连续向量描述状态,导致传统表格方法失效,必须引入神经网络进行近似。以月球登陆器为例,其状态由8维向量表示,动作有4种选择。通过设计精细的奖励函数引导智能体学习,最终目标是找到最优策略π。深度Q学习(DQN)通过神经网络近似Q函数,将强化学习转化为监督学习问题,利用贝尔曼方程构建训练集

文章图片
#机器学习#人工智能#python
【机器学习16】连续状态空间、深度Q网络DQN、经验回放、探索与利用

本文介绍了连续状态空间下的强化学习及其应用。相较于离散状态空间,连续状态空间(如自动驾驶直升机、月球登陆器)使用高维连续向量描述状态,导致传统表格方法失效,必须引入神经网络进行近似。以月球登陆器为例,其状态由8维向量表示,动作有4种选择。通过设计精细的奖励函数引导智能体学习,最终目标是找到最优策略π。深度Q学习(DQN)通过神经网络近似Q函数,将强化学习转化为监督学习问题,利用贝尔曼方程构建训练集

文章图片
#机器学习#人工智能#python
【机器学习15】强化学习入门、Q-Learning、贝尔曼方程

本文介绍了强化学习的基本概念和关键术语,重点阐述了Q-Learning算法在马尔可夫决策过程中的应用。内容分为三个部分: 强化学习入门:通过与监督学习的对比,说明强化学习通过奖励机制让智能体在环境中学习最优策略,并以自动驾驶直升机为例展示其应用场景。 关键术语解析:以火星车示例详细解释了状态、行动、奖励、回报、折扣因子和策略等核心概念,构建了强化学习的理论基础。 Q-Learning算法:引入马尔

文章图片
#机器学习#人工智能#python +1
【机器学习15】强化学习入门、Q-Learning、贝尔曼方程

本文介绍了强化学习的基本概念和关键术语,重点阐述了Q-Learning算法在马尔可夫决策过程中的应用。内容分为三个部分: 强化学习入门:通过与监督学习的对比,说明强化学习通过奖励机制让智能体在环境中学习最优策略,并以自动驾驶直升机为例展示其应用场景。 关键术语解析:以火星车示例详细解释了状态、行动、奖励、回报、折扣因子和策略等核心概念,构建了强化学习的理论基础。 Q-Learning算法:引入马尔

文章图片
#机器学习#人工智能#python +1
【机器学习15】强化学习入门、Q-Learning、贝尔曼方程

本文介绍了强化学习的基本概念和关键术语,重点阐述了Q-Learning算法在马尔可夫决策过程中的应用。内容分为三个部分: 强化学习入门:通过与监督学习的对比,说明强化学习通过奖励机制让智能体在环境中学习最优策略,并以自动驾驶直升机为例展示其应用场景。 关键术语解析:以火星车示例详细解释了状态、行动、奖励、回报、折扣因子和策略等核心概念,构建了强化学习的理论基础。 Q-Learning算法:引入马尔

文章图片
#机器学习#人工智能#python +1
【机器学习09】调试策略、错误分析、数据增强、迁移学习

本文以吴恩达视频为参考,介绍了机器学习模型调试的核心策略,包括针对高偏差(欠拟合)和高方差(过拟合)的不同优化方法。重点阐述了偏差-方差权衡原理,并详细说明了神经网络调试流程:先通过增大网络解决高偏差,再通过正则化或增加数据解决高方差。文章还提出了机器学习开发的迭代循环框架,并强调错误分析的重要性——通过统计模型错误类型来指导优化方向。最后指出以数据为中心的AI视角,建议针对性增加错误类型数据和采

文章图片
#机器学习#人工智能#计算机视觉 +3
    共 13 条
  • 1
  • 2
  • 请选择