
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本次实验设计逻辑回归的相关知识,逻辑回归本质并不是一个回归问题而是一个二分类问题,通过sigmoid函数将数据集映射到0-1的范围之内,而在为了得到最佳的回归系数,我们可以使用梯度上升或梯度下降算法,来确定最佳系数w,从而达到最佳的分类效果。在普通的梯度上身算法中,我们需要迭代算出最佳系数,时间复杂度过高,因此我们可以使用随机梯度上升算法来改进梯度上升算法的时间复杂度。

本次实验的内容旨在掌握如何衡量一个模型的好坏,学习了错误率、误差、混淆矩阵、TPR、FPR等概念,明白了如何使用画出混淆矩阵并且得出一个模型的TPR、FPR与查准率、查全率,并且了解了PR曲线与ROC曲线的作用,PR曲线与ROC曲线是衡量一个模型好坏的重要指标,能够直观地显示出一个模型的性能,此次的学习内容同时也让我对机器学习的相关概念有了更深一步的了解,为接下来的学习做好了铺垫。
本次实验涉及支持向量机的相关知识,支持向量机可用于二分类与回归问题上,相关概念并不复杂,但是如何找到最优超平面是很重要的问题,一般我们使用最大间隔来找到最优超平面,同时使用拉格朗日乘子法来简化推导过程。同时在划分过程中往往会发现一个超平面不能完全将数据集划分,这是我们可以使用软间隔,增加一定的容错,如果一个数据集是非线性的,那我们可以使用核函数,将数据集映射到更高维度的空间中,这样就可以进行分割。
k-近邻算法采用测量不同特征值之间的距离方法进行分类,简单来说就是“物以类聚”,计算k个与预测对象距离最近的点,并将出现次数最多的标签最为预测结果。在模型的训练过程中,k值对训练的结果有巨大的影响,k的取值过大会出现欠拟合,k的取值过小会出现过拟合。并且通过此次实验,也能对机器学习有一个大致的概念,明白机器学习的目的与应用,帮助之后对更难的算法的理解。

本次课程主要学习了朴素贝叶斯分类器的原理,朴素贝叶斯分类算法主要基于贝叶斯公式,利用概率学来解决分类问题,此算法简单易实现,能快速预测出结果,但是此算法是在假设条件独立的情况下实现的,在现实中很少有符合条件独立的例子,因此此算法所分类的结果可能会因此而受到影响。







