
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
目录1 简介1.1 什么是强化学习1.2 强化学习的主要特点1.3 强化学习的组成部分2强化学习训练过程3强化学习算法归类3.1 Value Based3.2Policy Based3.3 Actor-Critic3.4 其他分类4EE(Explore & Exploit)探索与利用5 强化学习实际开展中的难点6 强化学习的实际应用6.1 自动驾驶6.2 游戏6.3 推荐系统7 Q-lea
1 异常检测异常检测虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。什么是异常检测呢?如下例:假想你是一个飞机引擎制造商,当你生产的飞机引擎从生产线上流出时,你需要进行QA(质量控制测试),而作为这个测试的一部分,你测量了飞机引擎的一些特征变量,比如引擎运转时产生的热量,或者引擎的振动等等。...
目录1 简介1.1 什么是强化学习1.2 强化学习的主要特点1.3 强化学习的组成部分2强化学习训练过程3强化学习算法归类3.1 Value Based3.2Policy Based3.3 Actor-Critic3.4 其他分类4EE(Explore & Exploit)探索与利用5 强化学习实际开展中的难点6 强化学习的实际应用6.1 自动驾驶6.2 游戏6.3 推荐系统7 Q-lea
1gridSearchCV(网格搜索)sklearn.model_selection.GridSearchCV — scikit-learn 1.0.2 documentationGridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快
目录1linux安装conda并创建虚拟环境1.1 下载安装脚本1.2运行安装脚本1.3测试是否安装成功1.4查看当前存在虚拟环境1.5创建虚拟环境1.6激活虚拟环境1.7退出虚拟环境1.8删除虚拟环境1.9打包当前环境中用到的python包名称1.10载入打包的环境2卸载conda1linux安装conda并创建虚拟环境1.1 下载安装脚本conda的地址conda的地址:Index of /a
目录1. 对概率图模型的理解2. 贝叶斯方法2.1 频率派观点2.2 贝叶斯学派2.3 贝叶斯定理2.4 应用:拼写检查3 贝叶斯网络3.1 贝叶斯网络的定义3.2贝叶斯网络的3种结构形式3.2.1 形式1:head-to-head3.2.2 形式2:tail-to-tail3.2.3 形式3:head-to-tail3.3贝叶斯网络的实例3.4 因子图3.4.1 因子图的定义3.4.2 Sum-
目录1 无监督学习2K-均值算法K-meansAlgorithm2.1 算法步骤综述2.2 步骤详解2.3 算法图示3K-means算法损失函数3.1定义损失函数变量3.2K-means算法的优化目标3.3 K-means算法步骤与优化函数4K均值算法簇中心的随机初始化 Random initialization4.1 随机初始化遵循法则...
目录1 范式2L0 范数2L1 范数2.1L12.2L1正则化和特征选择3L2 范数3.1L23.2L2正则化和过拟合3.3L2正则化和优化计算3.3.1 condition number3.3.2L2正则化和condition number4 L1与L2的差别4.1下降速度4.2 模型空间的限制5无穷范数...
目录1 决策树2 信息增益2.1香农熵2.2信息增益2.3信息增益比3决策树的生成和修剪3.1决策树的构建3.1.1 ID3算法3.1.2 C4.5算法3.2 决策树的剪枝3.3 CART算法3.3.1CART决策树生成3.3.2CART决策树剪枝3.3.3 CART剪枝算例4停止分裂的条件1 决策树...
学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise).在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error).1 含义偏差bias:期望输出与真实标记的差别称为偏差。方差variance:不同的训练数据集...







