logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习实验报告6-关联规则分析Apriori 算法

Apriori算法是关联规则挖掘中的经典算法,用于发现数据集中频繁出现的项集及其关联关系。该算法通过逐层搜索和候选项集生成来识别满足最小支持度的频繁项集,进而挖掘强关联规则。其核心思想基于"频繁项集的子集也必为频繁项集"的Apriori原理。算法实现包括数据准备、候选项集生成、频繁项集挖掘和规则提取四个主要步骤。虽然Apriori算法简单易实现,广泛应用于商业分析等领域,但也存在多次扫描数据库、产

文章图片
#机器学习#算法#人工智能
机器学习实验报告2—决策树

在划分数据集之前和之后信息发生的变化称为信息增益,知道如何计算信息增益,我们就可以计算每个特征值划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择。决策树模型的构建过程是一个不断地选择最优特征,并根据最优特征对训练数据进行划分的过程,从而将各个子数据集划分到最合适的类别。熵定义为信息的期望值,在信息论与概率统计中,熵是表示随机变量不确定性的度量,用一句通俗的话讲就是这个体系的混乱程度是

文章图片
#机器学习#决策树#人工智能
到底了