logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第1关:朴素贝叶斯概论

摘要:本文介绍了朴素贝叶斯分类算法的基本原理和应用。文章首先对比了经典统计学和贝叶斯学派对概率的不同理解,重点阐述了朴素贝叶斯算法的特点:基于条件独立性假设简化计算,结合先验概率与后验概率提高分类准确率。通过垃圾邮件分类和新闻分类两个实际案例,展示了如何使用sklearn实现朴素贝叶斯模型,包括数据预处理、特征提取(如TF-IDF转换)、模型训练和评估(AUC指标)等关键步骤。文章指出朴素贝叶斯算

文章图片
#概率论
头歌 机器学习 第1关:决策树算法详解

摘要:本文介绍了决策树算法的实现过程,重点阐述了信息熵计算和最优划分方法。通过编写三个核心函数:split()用于数据划分、entropy()计算信息熵、try_spit()寻找最优划分属性和值,构建了决策树分类模型。使用鸢尾花数据集进行测试,输出划分后的叶子结点和分支结点熵值,验证了算法的有效性。该实现遵循ID3算法思想,通过最小化信息熵来选择最优划分,为决策树分类任务提供了基础解决方案。

文章图片
#机器学习#算法#决策树
头歌机器学习 第1关:基于决策树模型的应用案例

本文基于UCI成人收入数据集,使用决策树算法预测年收入是否超过50K。首先对数据进行预处理,包括去除冗余特征、处理缺失值和字符型特征编码。然后采用sklearn的DecisionTreeClassifier构建模型,通过训练集进行训练,并在测试集上评估性能。评估指标包括准确率、召回率、F1值等分类报告,以及计算AUC值来综合衡量模型表现。实验结果表明,该决策树模型能有效预测收入水平,AUC值达到较

文章图片
#机器学习#决策树#人工智能
到底了