Dr_long1996 个人主页

@Dr_long1996

Dr_long1996

2023-10-26 21:34:21 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

1.R语言基础知识

建议下载最新版本，避免有些R包无法运行。此外选择镜像下载，下载速度会快很多。国内的镜像比较多，所以可以根据自己的所在位置选择合适的镜像。因为笔者在北京，就选择了北大镜像下载。安装的话建议直接默认，点击下一步，装在C盘的位置。

#r语言

8.临床预测模型验证——交叉验证/Bootstrap法

将一定比例的数据挑选出来作为训练集，将其余未选中的样本作为测试集，先在训练集中构建模型，再在测试集中做预测。内部验证：手动将样本随机分为训练集和测试集，先在训练集中构建模型，再在测试集中进行测试。简单交叉验证：将原始的数据随机分成两组，一组作为训练集，一组作为测试集。K折交叉验证：将数据随机分为K个子集，对每个子集分别做一次测试集，其余的K-1组子集数据作为训练集，最终得到K个模型，用K个测试集的

#r语言

实用技巧——绘制森林图

森林图绘制教程

#r语言

7.评价预测模型——C指数，NRI，IDI计算

理解即为343人在新旧模型中被认为是低风险，21在新模型中为中风险，旧模型中为低风险，1人在新模型中高风险，旧模型中低风险，以此类推。在阴性组，预测阳性的概率比旧模型的小。在table3中，c1是原来模型没有预测对，新模型预测对的，同样的道理，b1是原来模型预测对，但新模型给预测错的，于是(c1 − b1)/N1便是疾病组或者event组增加的重分类的正确比。若IDI＞0，则为正改善，说明新模型比

#r语言

7.评价预测模型——Calibration校准曲线

Calibration校准曲线：就是将实际发生率和预测发生率绘制的散点图。是对Hosmer-Lemeshow拟合优度检验的结果可视化。基本原理：首先利用列线图预测每位研究对象的预测值，并将其按从低到高的顺序排列，根据四分位数将队列分为4组（或者根据其他分位数分组），然后分别计算每组研究对象的预测值和相应的实际值得均值，并将两者结合起来作图得到4个校准点，最后将这4个校准点连接起来得到预测校准曲线。

#r语言

7. 预测模型评价——DCA曲线

ROC曲线分析，主要是评价模型的准确性，但无论如何选择，都会存在假阳性和/或假阴性的问题。如果疾病危害较小，尚无法治愈，则可以适当增加假阴性，避免假阳性；若疾病的危害大且晚发现预后差，则可以适当增加假阳性，避免假阴性。横坐标为阈概率（threshold probability），纵坐标为净获益（ net benefit，NB）。DCA曲线中存在两种极端情况的曲线：1.横的曲线表示所有样本都是阴性，

#r语言

7.常用统计分析方法——Logistic回归

logistic回归

#r语言

绘制高级频率分布直方图——ggplot2

1.ggplot直方图绘制fill：可以直接填充其他喜欢的颜色，weight表示需要计算的频数。将weigt去掉，即可。

#r语言

到底了