logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

重叠加权(Overlap Weighting OW)在真实世界研究(仿RCT研究)的应用

摘要:真实世界研究(RWS)作为随机对照试验(RCT)的重要补充,通过重叠加权(OW)方法在非理想化场景中评估医疗干预效果。本文对比了四种协变量调整方法(未调整、倾向评分匹配、逆概率加权和重叠加权),发现重叠加权在平衡组间差异(SMD≈0)和保留样本量方面表现最优,其权重算法稳定可靠。通过R语言实例分析,验证了OW方法在模拟RCT三大核心属性(目标人群相关性、协变量平衡性和估计精确性)上的优势,与

文章图片
#r语言
中国老年健康调查(CLHLS)数据挖掘教程(1)--CLHLS简介和数据下载

北京大学主持的"中国老年健康调查(CLHLS)"是一项覆盖全国23个省市的长期追踪研究,1998-2018年间完成8次调查,累计入户访问11.3万人次,其中80岁以上高龄老人占67.4%。研究收集了老人健康、认知、社会参与及照料需求等丰富数据,并包含2.89万死亡老人临终前状况。调查数据已通过开放平台免费共享,被1万多位学者使用,产出大量学术成果。该数据集以sav格式存储,包含

文章图片
#数据挖掘#人工智能#r语言
charls数据库中虚弱变量(Frailty)的提取

2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。原创不易,需要全套代码的粉丝,把公众号的本篇文章转发

文章图片
#数据库
CHARLS数据库系列教程(4)--多模型效应分析、Per SD、P for trend及限制立方样条图绘制

为利用国际上最佳的数据采集方式,并确保研究结果的国际可比性CHARLS 参照包括美国的健康与退休研究(HRS)在内的系列国际老龄调查研究开展调查设计。2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质

文章图片
#数据库
自编R语言小程序助力孟德尔随机化(Mendelian Randomization)数据挖掘

假设我们研究的想研究的原因变量有两个"ieu-a-22",“prot-b-66”,想研究的结局变量有3个"finn-b-O15_MEMBR_PREMAT_RUPT",“ukb-b-12621”,“finn-b-O15_PLAC_PREMAT_SEPAR”,如果我们一个一个的做也是要花费一定时间的,如果变量更多就需要更多时间了。然而这个函数也是有部分缺点的,第一就是它是通过在线下载数据,如果你的网络

文章图片
#r语言#小程序#开发语言
CHARLS数据库挖掘系列教程(1)---数据库下载

Charls的数据量不大,但是变量挺多的,非常详尽,特别是一些社科类的数据,又经过多年的随访,挺适合做重复测量数据的,因为表格众多,所以涉及到数据的合并、拼接和清洗,这是一个重要的内容,下一节继续介绍。申请账号以后进入到主页面,需要哪一年的数据都要进行申请,一般都成功,大概3个工作日通过,通过上面的内可以得知2011年是数据的基线表,后面的是随访分析,所以2011年是一定要下载的。比如怎么收集都数

文章图片
#数据库#r语言
CHARLS数据库系列教程(5)---亚组分析,P for trend,P for interaction

调整了年龄、性别、教育程度、婚姻、吸烟、饮酒、体重指数、腰围、收缩压、高血压病史、心血管疾病史和降脂药物,我们看下亚组变量是不在协变量里面的,和我以前讲的完全一样,就是协变量中要删除亚组本身的那个变量。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。今天咱们继续介

文章图片
#数据库#r语言
CHARLS数据库系列教程(2)---数据清洗、拼接和整理(1)

作者指出甘油三酯葡萄糖指数被认为是胰岛素抵抗的替代物,研究TYG指数与中国中年和老年人患糖尿病的风险之间的关系,作者做了cox回归,分位数回归、多模型比较、限制性立方样条和亚组分析,咱们在后面将会一一进行介绍,咱们先看看作者是怎么获取数据的,主要看流程图。CHARLS数据最麻烦的就是整理数据了,因为没有成熟的查对系统,一边整理一边查找变量,我整理了这份数据也花了2天时间,整理数据内容比较多,光代码

文章图片
#r语言
Nhanes临床数据库挖掘教程1----数据库下载

21(1):292.为参照(糖尿病与肺功能之间的非线性关联:一项基于人群的研究)为参照,对数据进行下载,作者取的是2007-2012年的数据,我这里取的是2007-2008的数据。需要找到年龄、性别、种族、体重指数、血糖、FVC等相关指标,这是一个花时间的过程,需要慢慢找,先把人口统计数据下载下来看看,使用haven包的函数把数据打开。还需要关键的血糖和肺功能的指标,血糖应该在化验室指标那里,这次

CHARLS数据库系列教程(3)---绘制(加权和不加权)基线表一

为利用国际上最佳的数据采集方式,并确保研究结果的国际可比性CHARLS 参照包括美国的健康与退休研究(HRS)在内的系列国际老龄调查研究开展调查设计。2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。在上一篇文章中,咱们还有一个随访时间忘记生成了,这里我补充介绍一下,主要在合并数据后生

文章图片
#r语言
    共 172 条
  • 1
  • 2
  • 3
  • 18
  • 请选择