logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习算法(三十):强化学习(Reinforcement Learning)

目录1 简介1.1 什么是强化学习1.2 强化学习的主要特点1.3 强化学习的组成部分2强化学习训练过程3强化学习算法归类3.1 Value Based3.2Policy Based3.3 Actor-Critic3.4 其他分类4EE(Explore & Exploit)探索与利用5 强化学习实际开展中的难点6 强化学习的实际应用6.1 自动驾驶6.2 游戏6.3 推荐系统7 Q-lea

#机器学习
机器学习算法(十一):异常检测(Anomaly detection)—高斯分布

1 异常检测异常检测虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。什么是异常检测呢?如下例:假想你是一个飞机引擎制造商,当你生产的飞机引擎从生产线上流出时,你需要进行QA(质量控制测试),而作为这个测试的一部分,你测量了飞机引擎的一些特征变量,比如引擎运转时产生的热量,或者引擎的振动等等。...

机器学习算法(三十):强化学习(Reinforcement Learning)

目录1 简介1.1 什么是强化学习1.2 强化学习的主要特点1.3 强化学习的组成部分2强化学习训练过程3强化学习算法归类3.1 Value Based3.2Policy Based3.3 Actor-Critic3.4 其他分类4EE(Explore & Exploit)探索与利用5 强化学习实际开展中的难点6 强化学习的实际应用6.1 自动驾驶6.2 游戏6.3 推荐系统7 Q-lea

#机器学习
机器学习算法(十二):聚类(1)K-means

目录1 无监督学习2K-均值算法K-meansAlgorithm2.1 算法步骤综述2.2 步骤详解2.3 算法图示3K-means算法损失函数3.1定义损失函数变量3.2K-means算法的优化目标3.3 K-means算法步骤与优化函数4K均值算法簇中心的随机初始化 Random initialization4.1 随机初始化遵循法则...

#机器学习
范数规则化(一):L0、L1与L2范数

目录1 范式2L0 范数2L1 范数2.1L12.2L1正则化和特征选择3L2 范数3.1L23.2L2正则化和过拟合3.3L2正则化和优化计算3.3.1 condition number3.3.2L2正则化和condition number4 L1与L2的差别4.1下降速度4.2 模型空间的限制5无穷范数...

#机器学习
机器学习算法(十四):决策树系列

目录1 决策树2 信息增益2.1香农熵2.2信息增益2.3信息增益比3决策树的生成和修剪3.1决策树的构建3.1.1 ID3算法3.1.2 C4.5算法3.2 决策树的剪枝3.3 CART算法3.3.1CART决策树生成3.3.2CART决策树剪枝3.3.3 CART剪枝算例4停止分裂的条件1 决策树...

#算法#决策树#机器学习
偏差bias与方差variance

学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise).在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error).1 含义偏差bias:期望输出与真实标记的差别称为偏差。方差variance:不同的训练数据集...

#机器学习#概率论#自动驾驶
为什么样本方差(sample variance)的分母是 n-1?

1 样本方差和总体方差我们通常所说的方差有两种,一种是样本方差,一种是总体方差。当求样本方差的时候,分母是n-1;当求总体方差的时候,分母是n。在数理统计中,一般所求的都是样本方差,这就需要构造一个统计量样本方差S^2(注意这是一个随机变量),需要使构造的统计量的期望与总体方差相等,这样才能使统计量具有无偏性。在小学数学,也可能是初中数学中才能遇到求总体方差...

#概率论#机器学习#人工智能
N-BEATS

通用的block多,原因可能是需要更多的block去学习,而可解释性的方法中添加了很多先验知识。[论文精读] N-BEATS:对可解释时序预测的神经基础扩展分析_哔哩哔哩_bilibili【论文分享】N-BEATS: 神经网络底层扩展分析,用于可解释的时间序列预测。_哔哩哔哩_bilibili...

#深度学习
机器学习算法(三):FFM(Field-aware Factorization Machine)(域分解机模型)

目录1 FFM原理2基于FFM的逻辑回归模型2.1损失的逻辑回归模型2.2∅(w,xp)的求导过程2.3 示例美团技术团队:https://tech.meituan.com/deep_understanding_of_ffm_principles_and_practices.htmlhttps://blog.csdn.net/zc02051126/article/...

#算法#机器学习
    共 47 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择