logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

scitable包+sciml包手把手带你复现一篇8.5分charls机器学习文章

这是一篇去年的比较新的文章,我查了下大概8.5分,文章大概就是介绍一种指数,叫做:甘油三酯葡萄糖-腰身高比指数(cumulative_TyG_WHtR),研究甘油三酯葡萄糖-腰身高比指数和新发心血管疾病的关系,作者搞了个K值聚类分析来把cumulative_TyG_WHtR指数分类,研究分类后指标和心血管疾病关系,这样类似的指数还有很多,比如TYG,WHtR,TyG_WHtR,目前这是一个发文的方

文章图片
#机器学习#人工智能
机器学习系列--R语言随机森林进行生存分析(2)

这条斜着的虚线是这两种方法的分界点,蓝色的点代表vimp大于0的,红色的点代表vimp小于0。红色斜着的虚线上的点,代表这个变量在两种分类方法排名相同,高于红色虚线上的点,代表它的vimp的排名更加高,低于红色虚线上的点,表明它的最小深度排名更高。如果我们根据阈值5.2757进行筛选,那么最终可以选出"bili" ,“albumin” ,“copper” ,“prothrombin” ,"edem

文章图片
#机器学习#r语言#随机森林
以因果图(DAG)形式表达因果问题—来自书籍Causal Inference in R的例子

摘要:因果推断中,有向无环图(DAG)是可视化因果假设的重要工具,包含三种基本结构:叉形(混杂偏倚)、链形(中介效应)和对撞形(选择偏倚)。通过分析研究生听播客与考试成绩关系的案例,展示了如何识别混杂路径(如情绪和准备程度)并调整变量以获得真实因果效应。模拟数据表明,未调整模型会得出虚假关联,而控制混杂因素后能消除偏差。DAG的应用能有效指导变量选择,避免因果推断中的常见错误。

文章图片
#r语言#android#java
重叠加权(Overlap Weighting OW)在真实世界研究(仿RCT研究)的应用

摘要:真实世界研究(RWS)作为随机对照试验(RCT)的重要补充,通过重叠加权(OW)方法在非理想化场景中评估医疗干预效果。本文对比了四种协变量调整方法(未调整、倾向评分匹配、逆概率加权和重叠加权),发现重叠加权在平衡组间差异(SMD≈0)和保留样本量方面表现最优,其权重算法稳定可靠。通过R语言实例分析,验证了OW方法在模拟RCT三大核心属性(目标人群相关性、协变量平衡性和估计精确性)上的优势,与

文章图片
#r语言
中国老年健康调查(CLHLS)数据挖掘教程(1)--CLHLS简介和数据下载

北京大学主持的"中国老年健康调查(CLHLS)"是一项覆盖全国23个省市的长期追踪研究,1998-2018年间完成8次调查,累计入户访问11.3万人次,其中80岁以上高龄老人占67.4%。研究收集了老人健康、认知、社会参与及照料需求等丰富数据,并包含2.89万死亡老人临终前状况。调查数据已通过开放平台免费共享,被1万多位学者使用,产出大量学术成果。该数据集以sav格式存储,包含

文章图片
#数据挖掘#人工智能#r语言
charls数据库中虚弱变量(Frailty)的提取

2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。原创不易,需要全套代码的粉丝,把公众号的本篇文章转发

文章图片
#数据库
CHARLS数据库系列教程(4)--多模型效应分析、Per SD、P for trend及限制立方样条图绘制

为利用国际上最佳的数据采集方式,并确保研究结果的国际可比性CHARLS 参照包括美国的健康与退休研究(HRS)在内的系列国际老龄调查研究开展调查设计。2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质

文章图片
#数据库
自编R语言小程序助力孟德尔随机化(Mendelian Randomization)数据挖掘

假设我们研究的想研究的原因变量有两个"ieu-a-22",“prot-b-66”,想研究的结局变量有3个"finn-b-O15_MEMBR_PREMAT_RUPT",“ukb-b-12621”,“finn-b-O15_PLAC_PREMAT_SEPAR”,如果我们一个一个的做也是要花费一定时间的,如果变量更多就需要更多时间了。然而这个函数也是有部分缺点的,第一就是它是通过在线下载数据,如果你的网络

文章图片
#r语言#小程序#开发语言
CHARLS数据库挖掘系列教程(1)---数据库下载

Charls的数据量不大,但是变量挺多的,非常详尽,特别是一些社科类的数据,又经过多年的随访,挺适合做重复测量数据的,因为表格众多,所以涉及到数据的合并、拼接和清洗,这是一个重要的内容,下一节继续介绍。申请账号以后进入到主页面,需要哪一年的数据都要进行申请,一般都成功,大概3个工作日通过,通过上面的内可以得知2011年是数据的基线表,后面的是随访分析,所以2011年是一定要下载的。比如怎么收集都数

文章图片
#数据库#r语言
CHARLS数据库系列教程(5)---亚组分析,P for trend,P for interaction

调整了年龄、性别、教育程度、婚姻、吸烟、饮酒、体重指数、腰围、收缩压、高血压病史、心血管疾病史和降脂药物,我们看下亚组变量是不在协变量里面的,和我以前讲的完全一样,就是协变量中要删除亚组本身的那个变量。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。今天咱们继续介

文章图片
#数据库#r语言
    共 175 条
  • 1
  • 2
  • 3
  • 18
  • 请选择