简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文首先介绍了智能推荐的概念、应用、评价指标,然后讲解了智能推荐常见的关联规则算法,包括Apriori和FP-Growth,最后讲解常见的协同过滤推荐技术,包括基于用户的协同过滤推荐和基于物品的协同过滤推荐。
Linux程序设计实验一:Linux环境及编程工具。
本文介绍了支持向量机的原理及其求解算法SMO。由于SVM属于非参数化模型,其模型中的参数与数据集的规模相同,求解较为复杂,但SMO算法大大降低了求解的难度。对于非线性分布的数据,通过引入非线性的核函数使SVM完成分类任务,达到和神经网络中激活函数类似的效果。
Python编程作业五:面向对象编程
随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS就是分布式文件管理系统中的一种。
本文介绍了决策树模型的基本概念和最基础的决策树生成算法ID3算法,以及分类和回归树CART算法。然后动手实现了ID3算法的改进版本C4.5算法的决策树,并学会使用Sklearn中的决策树工具。
本文介绍了数据降维的常用算法之一:PCA算法。数据降维是无监督学习的重要问题,在机器学习中有广泛的应用。利用特征分解进行PCA,动手实现了PCA算法,并使用sklearn实现PCA算法。
本文介绍大数据实验一体机并了解如何搭建集群,了解SSH免密登录的原理以及为何需要配置SSH免密登录,并掌握如何配置SSH免密登录。
本文介绍了无监督学习和深度学习中的重要模型之一——自编码器。讲解了自编码器的结构,并利用PyTorch库在手写数字数据集MNIST上实现自编码器,用自编码器提取图像的特征。
数据仓库与数据挖掘实验一:数据仓库建立实验。