logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

中介效应分析及R实现

1.中介效应的定义如果自变量X通过某一变量M对因变量Y产生一定影响,则称M为X和Y的中介变量。研究中介作用的目的是在已知X和Y关系的基础上,探索产生这个关系的内部作用机制。作用关系图如下:X对Y的总效应分为直接效应(direct effect)和间接效应(indirect effect),直接效应是指当中介变量(M)固定在某一水平时,自变量X对结局变量Y的效应。间接效应是指自变量X通过...

Dirichlet Multinomial Mixtures (DMM)的R实现

Dirichlet Multinomial MixturesCommunity typing with Dirichlet Multinomial MixturesDirichlet Multinomial Mixtures (DMM)是一种用于对微生物群落分析数据进行群落分型(或聚类)的概率方法。 这是一个无限的混合模型,这意味着该方法可以推断出最佳数量的群落类型。 请注意,群落类型的数量可能会

Quantile g-computation的介绍及R实现

介绍qgcomp是一个实现g-computation的软件包,用于分析暴露混合物的影响。分位数g-computation产生了所有暴露同时增加一个分位数的效果的估计。因此,它估计的 "混合物效应 "对研究暴露混合物(如空气污染、饮食和水污染)很有用。 使用为因果效应估计而开发的术语,分位数g计算估计了边际结构模型的参数,该模型描述了在对所有暴露进行联合干预的情况下预期潜在结果的变化,可能以混杂因素

广义相加模型(GAM)及R实现

当解释变量与效应变量间关系不明确时,通常可以使用广义相加模型来检测比变量间是否具有非线性关系。广义相加模型通过光滑样条函数、核函数或者局部回归光滑函数,对变量进行拟合。GAM采用模型中的每个预测变量并将其分成多个部分(由'结'​​分隔),然后将多项式函数分别拟合到每个部分。GAM的原理是最小化残差(拟合优度)同时最大化简约性(最低可能自由度)。回归模型中部分或全部的自变量采用平滑函数,降低线...

Bray-curtis,unifrac,weighted unifrac,jaccard计算方法比较

原文链接:https://www.jianshu.com/p/066d90b556ad1、微生物β多样性利用宏基因组、16s rRNA测序等高通量测序技术分析微生物群体结构的时候,常见到有α和β多样性两个指标。α多样性主要反映样本内多样性,而β多样性指的是样本间多样性(Between-sample diversity),它的本质是一个量化的数值,其值的大小反映每个组内各个样本间的群落物种组...

NHANES数据库的介绍及使用(一)

一、数据库概况NHANES(National Health and Nutrition Examination Survey)是一项旨在评估美国成人和儿童健康和营养状况的研究计划,计划始于20世纪60年代初期,是一项针对不同人群或健康主题的调查。1999年该调查成为一项持续计划,涉及各种健康和营养测量,项目每年调查一个全国代表性的样本,约5000人,这些人群位于全国各县,每年对其中15个县进行访问

#数据库#database
R实现一次性合并多个数据框

数据处理中经常会有这样的情况,需要合并多个数据(按行或者按列合并),常规的merge或者rbind只能两个两个合并,操作繁琐。可以使用自写函数或do.call()函数进行数据库的拼接或合并,具体操作如下:按列合并mypath<-"C:/Users/18896/Desktop/example1"multmerge = function(mypath){filenames=list.files(

#r语言
ggplot2学习笔记-修改坐标轴刻度

1.修改坐标轴显示范围scale_x_continous(limits=c("A","B")#显示范围为A-B或者ylim(A,B)2.修改坐标轴显示刻度scale_x_continous(limits=c("A","B"), breaks=seq(起始值,终止值,间隔))3.修改坐标轴标签旋转坐标轴标签theme(a

逆概率加权法(Inverse Probability Weighting, IPW)的原理及R实现

逆概率加权(IPW)是一种用于解释由于非随机选择观测值或人群信息的非随机缺失而造成的缺失和选择偏差的方法。原理:这种方法可以通过对观察值的加权来修正分析,使其具有被选中的概率。IPW是基于这样一个假设,即整个研究人群都有可以预测纳入概率(非遗漏)的个体信息,因此,在考虑到这些信息后,我们可以仅从非遗漏的观察值开始对整个目标人群进行推断。计算的程序如下:首先,我们考虑整个研究人群,用逻辑回归模型计算

#r语言#逻辑回归
R语言subset函数

1.subset函数,从某一个数据框中选择出符合某条件的数据或是相关的列1)单条件查询df<-data.frame(Age=c(22,24,25,26),Gender=c("Girl","Girl","Boy","Boy"),City=c("Shanghai","Beijin

暂无文章信息