logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

R语言实战医学统计电子书已发布到github pages

把医学统计的部分重新生成了一本书,内容涵盖我认为还是很全面的,临床常用的医学统计方法基本上都有涉及,还包括一些SCI中常见的方法,比如倾向性评分,样条回归,p for trend,p for interaction 等方法的实现。我会把bookdown版本的电子书和配套用的数据一起通过百度云发给你。格式排版真的是太好看了,内容和PDF版相同~

文章图片
#r语言#开发语言
minfi包甲基化数据分析流程

minfiChMAP包的很多的函数都有minfi包的影子。minfi使用起来也很简单,就是5个对象走一遍流程即可,下面还是用之前的GSE194282数据集进行演示!

文章图片
#数据分析#数据挖掘
ChAMP甲基化数据分析:从β值矩阵开始

之前的推文详细介绍了ChMAP包从IDAT文件开始的甲基化数据分析流程,今天说一下从β矩阵开始的分析流程。

文章图片
#数据分析#数据挖掘
新版TCGA的甲基化数据分析

中,包括分组信息、生存信息、分期信息等,我们这里只要用到分组信息即可,所以先把。可以看到和转录组的差异分析结果差不多,但是都是探针信息,基因信息需要注释才行。主要是甲基化差异分析,甲基化的一些可视化,甲基化和转录组数据的联合作图。我们需要确定谁和谁进行相比,也就是要创建一个含有分组信息的列。我们还是使用之前下载好的TCGA-COAD的甲基化β值矩阵。对象和相应的分组信息就可以进行甲基化差异分析了。

文章图片
#r语言
新版TCGA数据库学习:批量下载新版TCGA数据

众所周知,TCGA数据库改版了!!改的比之前更好用了!对于常规转录组数据,主要是以下几点改变:下载一次即可获得counts、TPM、FPKM三种类型的表达矩阵,再也不用单独下载了自带gene symbol,不用自己找各种方法转换了自带基因类型,可以直接区分mRNA和lncRNA了TCGAbiolinks不仅是数据下载,它能访问、下载全部的TCGA数据(除了受限制的),用它下载的数据是最新最全的!这

#程序人生
新版TCGA数据库学习:提取新版TCGA表达矩阵(tpm/count/fpkm)

现在使用TCGAbiolinks下载转录组数据后,直接是一个SummarizedExperiment对象,这个对象非常重要且好用。因为里面直接包含了表达矩阵、样本信息、基因信息,可以非常方便的通过内置函数直接提取想要的数据,再也不用手扒了!!这个对象的结构是这样的:是不是感觉和单细胞的SingCellExperiment对象非常像~SingCellExperiment上次我们下载了常见的组学数据,

#程序人生
ChAMP甲基化数据分析:标准流程

我们直接进行甲基化数据分析。使用ChAMP包分析甲基化数据,这个包非常强大,甲基化数据分析必须得了解它。这个包在bioconductor上,不要问我为什么不过在使用ChAMP包的时候需要提供一个样本信息文件,.csv格式的,其实这个文件的准备非常简单。ChAMP包给我们准备了一个示例数据集,我们先看一下示例数据是什么样的。在示例文件夹中的数据是这样的:其中就是样本信息,打开之后是这样的:通常这个文

文章图片
#数据分析
R语言和office(Word,excel,PPT)交互

专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。

#r语言#开发语言#数据分析
R语言机器学习mlr3:模型评价和比较

目录二分类变量和ROC曲线重抽样benchmark前面一篇介绍了如何使用mlr3创建任务和学习器、拟合模型、预测和简单的评价,本篇将模型评价的一些细节问题,展示mlr3如何使得这些步骤变得更加简单!二分类变量和ROC曲线对于二分类变量,结果有阴性和阳性两种,而且判定阴性和阳性的阈值是可以认为设定的。ROC曲线可以很好的帮助我们确定最佳的分割点。首先看一下如何获取一个分类变量的混淆矩阵:librar

文章图片
#机器学习#r语言#人工智能
R语言机器学习mlr3:技术细节

获取更多R语言和生信知识,请欢迎关注公众号:医学和生信笔记医学和生信笔记 公众号主要分享:1.医学小知识、肛肠科小知识;2.R语言和Python相关的数据分析、可视化、机器学习等;3.生物信息学学习资料和自己的学习笔记!

文章图片
#r语言#机器学习#python
    共 72 条
  • 1
  • 2
  • 3
  • 8
  • 请选择