Feihuooo 个人主页

@eihuo

Feihuooo

2025-03-20 15:17:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

《数据挖掘》学习笔记（十）：集成学习

摘要《数据挖掘》第十章系统介绍了集成学习技术。集成学习通过组合多个基学习器提升模型性能，主要方法包括：1）Bagging（如随机森林），通过自助采样并行训练多个模型并投票；2）Boosting（如AdaBoost、GBDT），序列化训练模型并调整样本权重；3）Stacking，使用次级学习器整合多个基模型的预测结果。本章通过Python代码示例展示了不同集成方法在分类和回归任务中的应用，并对比了

#数据挖掘 #学习 #机器学习 +3

《数据挖掘》学习笔记（八）：聚类

本文介绍了数据挖掘中的聚类方法，包括层次聚类、K-Means算法、高斯混合聚类和DBSCAN算法。层次聚类通过树状图展示聚类过程；K-Means通过肘部法则选择最佳K值；高斯混合模型基于概率分布进行软聚类；DBSCAN则基于密度识别任意形状的簇。每种方法都配有Python实现代码和可视化示例，帮助理解不同聚类技术的原理和应用场景。文章还提供了轮廓系数等评估指标的计算方法，为实际应用提供参考依据。

#学习 #数据挖掘 #聚类 +3

《数据挖掘》学习笔记（四）：回归分析

本文是《数据挖掘》系列笔记的第四章，重点介绍了回归分析方法。主要内容包括：一元线性回归和多元线性回归的基本原理与实现（含Python代码示例）；多重共线性问题及其诊断方法（VIF）；正则化方法（岭回归和LASSO回归）的应用；以及非线性回归（多项式回归）的实现。文章通过具体代码演示了数据准备、模型训练、评估指标计算（MSE、R²）等完整流程，并比较了不同回归方法的优缺点。最后还介绍了模型评估与选择

#数据挖掘 #学习 #人工智能 +3

到底了