
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文系统介绍了模型评估与优化的关键方法。详述统计显著性检验方法及其现代替代方案,提出模型性能对比框架,探讨了过拟合/欠拟合的检测方法,并提供了Python实现示例。

本文系统介绍了数据可视化和数据预处理中的关键流程。数据可视化部分详细讲解了单一图表,以及多重图表的使用场景和方法。数据预处理探讨了数据清洗(错误值、缺失值、异常值、重复值处理)、数据降维(PCA、LDA、t-SNE)、数据变换(整合、规范化、标准化)以及数据集成,为构建高质量数据集提供全面指导。

k-medoids聚类算法、DBSCAN聚类算法、OPTICS聚类算法

本文系统介绍了数据可视化和数据预处理中的关键流程。数据可视化部分详细讲解了单一图表,以及多重图表的使用场景和方法。数据预处理探讨了数据清洗(错误值、缺失值、异常值、重复值处理)、数据降维(PCA、LDA、t-SNE)、数据变换(整合、规范化、标准化)以及数据集成,为构建高质量数据集提供全面指导。

图像的基础知识、NumPy(Numerical Python)模块、OpenCV分离RGB和HSV图像的分通道显示

关联规则挖掘基本概念、Apriori算法、FP-Growth算法、推荐系统、协调过滤推荐算法

机器学习基础、Scikit-learn 机器学习库(安装)、机器学习的一般过程、(训练集、验证集和测试集)、机器学习常见名词、机器学习的预处理环节

聚类的原理与实现、如何度量距离、层次聚类算法、DataFrame数据结构、k-means聚类算法

Haar分类器、人脸识别相关函数讲解、人脸识别示例代码

特征选择是机器学习中的关键步骤,旨在从原始数据中筛选出最相关的特征,以提升模型性能、减少过拟合并降低计算复杂度。特征选择方法主要分为三类:过滤式、包裹式和嵌入式。








