
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
【Digit Recognizer】train_test_split 中使用 stratify ,保持数据划分后训练集和测试集的类别分布与原数据集一致
这在类别不平衡(Class Imbalance)的场景下尤为重要,例如手写数字识别(MNIST)中某些数字的样本可能较少(如数字。可以确保划分后的子集保留原始数据的类别比例,避免模型因训练集或测试集分布偏差而表现异常。可能无法严格分层(因无法拆分为训练集和测试集),此时会抛出警告或错误。如果某个类别的样本数过少(例如某类仅有1个样本),的类别分布进行分层抽样。
到底了







