简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
建议下载最新版本,避免有些R包无法运行。此外选择镜像下载,下载速度会快很多。国内的镜像比较多,所以可以根据自己的所在位置选择合适的镜像。因为笔者在北京,就选择了北大镜像下载。安装的话建议直接默认,点击下一步,装在C盘的位置。
将一定比例的数据挑选出来作为训练集,将其余未选中的样本作为测试集,先在训练集中构建模型,再在测试集中做预测。内部验证:手动将样本随机分为训练集和测试集,先在训练集中构建模型,再在测试集中进行测试。简单交叉验证:将原始的数据随机分成两组,一组作为训练集,一组作为测试集。K折交叉验证:将数据随机分为K个子集,对每个子集分别做一次测试集,其余的K-1组子集数据作为训练集,最终得到K个模型,用K个测试集的
森林图绘制教程
理解即为343人在新旧模型中被认为是低风险,21在新模型中为中风险,旧模型中为低风险,1人在新模型中高风险,旧模型中低风险,以此类推。在阴性组,预测阳性的概率比旧模型的小。在table3中,c1是原来模型没有预测对,新模型预测对的,同样的道理,b1是原来模型预测对,但新模型给预测错的,于是(c1 − b1)/N1便是疾病组或者event组增加的重分类的正确比。若IDI>0,则为正改善,说明新模型比
Calibration校准曲线:就是将实际发生率和预测发生率绘制的散点图。是对Hosmer-Lemeshow拟合优度检验的结果可视化。基本原理:首先利用列线图预测每位研究对象的预测值,并将其按从低到高的顺序排列,根据四分位数将队列分为4组(或者根据其他分位数分组),然后分别计算每组研究对象的预测值和相应的实际值得均值,并将两者结合起来作图得到4个校准点,最后将这4个校准点连接起来得到预测校准曲线。
ROC曲线分析,主要是评价模型的准确性,但无论如何选择,都会存在假阳性和/或假阴性的问题。如果疾病危害较小,尚无法治愈,则可以适当增加假阴性,避免假阳性;若疾病的危害大且晚发现预后差,则可以适当增加假阳性,避免假阴性。横坐标为阈概率(threshold probability),纵坐标为净获益( net benefit,NB)。DCA曲线中存在两种极端情况的曲线:1.横的曲线表示所有样本都是阴性,
logistic回归
1.ggplot直方图绘制fill:可以直接填充其他喜欢的颜色,weight表示需要计算的频数。将weigt去掉,即可。