简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
机器学习常用编码方式:标签编码、序列编码、独热编码、频数编码、目标编码
若分类编码与目标遍历间具有一定关联性,则适合使用目标编码,如一个城市的房价与其所处的区域有很大关系,使用目标编码计算同一个区域的平均房价来代替区域属性上的离散值:上海黄埔区的目标编码>上海嘉定区的目标编码。目标编码(Target Encoding):目标编码将离散属性的每个类别编码为其在目标变量上的平均值或其他统计信息。2. 计算不同样本之间的距离有一定的意义,若想要得到更加精确的距离值,需要给定
到底了