logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大连理工大学选修课——机器学习笔记(8):Boosting及提升树

优点可灵活处理各类数据在相对少的调参情况下,预测准确率也可以比较高对异常值鲁棒性强。

文章图片
#机器学习#boosting
大连理工大学选修课——机器学习笔记(2):机器学习的一般原理

属性为:价格和发动机的马力xx1​x2​​r1正例0负例​Xxtrtt1N​。

文章图片
#机器学习#人工智能
大连理工大学选修课——机器学习笔记(5):EM&K-Means

假设数据由k个高斯分布混合生成,每个高斯分布表示一个潜在的子群或簇。我们不知道样本点x属于哪个簇,因此需要PGiP(G_i)PGi​表示该点属于某个簇的概率。目标:估计模型参数miSiPGimi​Si​PGi​挑战:存在隐变量Z(样本所属簇的标签),直接最大化似然函数困难。似然函数:不完全似然(未观测到隐变量Z(数据点所属的高斯分布))Lθ∣X∑ilog∑j1kPGj⋅pxi∣GjLθ∣Xi∑。

文章图片
#机器学习#kmeans
计算机组成原理——计算机的基本组成

第一步,将取数指令传入控制单元:PC->MAR->存储体->MDR->IR->CU。第一步,将存数指令发给控制单元:PC->MAR->存储体->MDR->IR->CU。存储字长:存储单元中二进制代码的位数,每个存储单元有一个地址。第二步:执行取数指令:IR->MAR->存储体->MDR。PC:程序计数器,用于存放当前欲执行指令的地址。IR:指令寄存器,用于存放当前欲执行的指令。将内存单元中的加数送

文章图片
大连理工大学选修课——机器学习笔记(9):线性判别式与逻辑回归

产生式模型需要计算输入、输出的联合概率判别式模型直接构造判别式gi​x∣θi​,显式定义判别式参数,不关心数据生成过程基于判别式的方法只关注类区域之间的边界一般认为,估计样本集的类密度比估计类判别式更困难,因为构造判别式通常采用简单的模型gi​x∣wi​wi0​wiT​wi0​j1∑d​wij​xj​wi0​广义上,线性判别式代表了一类机器学习模型狭义上,线性判别式仅代表逻辑回归。

文章图片
#机器学习#逻辑回归
大连理工大学选修课——机器学习笔记(4):NBM的原理及应用

choose Ci ifP(Ci∣x)=maxP(Ck∣x)choose\ C_i\ if P(C_i|x)=maxP(C_k|x)choose Ci​ ifP(Ci​∣x)=maxP(Ck​∣x)贝叶斯定理公式为P(Ci∣x)=p(x∣Ci)P(Ci)p(x)P(C_i|x)=\frac{p(x|C_i)P(C_i)}{p(x)}P(Ci​∣x)=p(x)p(x∣Ci​)P(Ci​)​其中,p(

文章图片
#机器学习#概率论
大连理工大学选修课——机器学习笔记(3):KNN原理及应用

如果一个样本在特征空间中的 k 个最邻近 (即最相似)的样本中的大多数属于某一个类别,则该样本也属于这个类别。→KNN的决策边界仅由靠近类别边界的样本决定,而远离边界的样本(如类别内部的点)对分类结果无影响。定义:相容子集是训练集的一个最小子集,能够保持与原训练集完全相同的分类决策边界。随机变量 x 的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。目标:仅保留边界附近的样本(相容子

文章图片
#机器学习#人工智能
大连理工大学选修课——机器学习笔记(6):决策树

→每个结点的决策函数都是定义在d维空间的判别式将空间有效地分为较小区域子结点对父结点确定的区域进一步分裂每个结点的决策函数是一个简单函数不同的函数确定不同的判别式形状和区域形状→可以快速确定输入的区域对于二值分类,每次决策可以排除一半的实例如果是kkk个类别,可在log2klog_2klog2​k次决策后找到答案→可解释性好可写成容易理解的决策规则每个类可能存在对各分支对应的多个解释和描述这些不同

文章图片
#机器学习#决策树
到底了