logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

simplifyEnrichment简化富集分析结果

主要针对富集分析的结果进行简化,并提供了一些强大的可视化函数。GO的条目是冗余的,做一次GO富集分析可以得到几千条term,让人眼花缭乱,可以使用simplify函数去冗余。做的是类似的事情,但是并,把相似性大的条目聚到一起,实现“物以类聚人以群分”的效果,让我们对所有的富集的结果有一个整体的认知。作者开发了一种binary cut但DOSEmeshesReactomePA以上几个函数都是计算相似

文章图片
#r语言#数据挖掘
MOVICS:分子分型一站式R包(01)

免疫浸润结果分子分型MOVICS。该包与其他分子分型R包最大的不同是它能同时使用多组学的数据,普通的分子分型R包只能通过一种组学数据进行分析,比如只能通过mRNA的表达矩阵进行分析。但是这R包它可以同时通过比如说mRNA、lncRNA、甲基化数据、突变数据进行分型。之外,它还提供了分型之后每个亚型的探索以及每个亚型内的分析。所以说这是一个一站式的包。这个的功能主要分为三个部分,示意图如下:第一个部

文章图片
#r语言
GSVA和ssGSEA

ORA和GSEA。假如你手上有一撮基因,但是你不知道它们有哪些功能,你可以先做个ORA富集分析;假如你有一撮基因,你想看看它们在两种状态下分别会富集在哪些通路,或者两种状态下的功能会有哪些不一样,那你可以做GSEA。平常最常见的GO和KEGG只是已知功能的基因集合而已,这些基因的功能我们已经研究透了,现在把它们放一起,用来方便大家探索你手上的基因可能有哪些功能,这就是注释基因集,用已知功能的基因来

文章图片
#r语言#数据挖掘
TCGA/GTEx泛癌数据1行代码整理

TCGA和GTEx的泛癌数据分析也是生信数据挖掘的必备技能,目前最好用的泛癌数据肯定是XENA网站上整理好的啦。我们直接下载用即可。而且XENA的数据估计短时间不会更新的,所以基本上是一次整理永久使用!我把整理泛癌数据的代码也写成了一个函数,并放到了easyTCGA包中,大家安装即可使用。

文章图片
#r语言#数据挖掘
超详细的R语言热图之complexheatmap系列(3)

包的一大特色就是可以同时绘制多个热图,本章主要介绍水平排列的热图,垂直排列的热图原理与此类似,会在后面简要介绍。单列热图有时在将可以显示的热图列表连接起来时很有用,例如,如果行是基因,则基因的类型(即是否编码蛋白质)可以表示为一列字符矩阵,而差异表达分析的p值或倍数变化可以表示为一列数字矩阵,并连接到主热图。对于多个热图来说,每个小热图的注释条高度是不一样的,但是使用。这里的标题是表示全局标题,也

文章图片
#r语言#开发语言
TCGA的拷贝数变异CNV可视化

大家看文献时可能经常遇到各种的可视化,都很好看,但是不知道怎么画出来的:GISTIC2会自动出一些结果,但是并不好看,而且扩增和删失是分开的:网络上也没找到怎么画,只能自己操作一下了!

文章图片
#r语言
Fine-Gray检验、竞争风险模型、列线图绘制

竞争风险模型(Competing Risk Model)适用于多个终点的生存数据,传统的生存分析(survival analysis) 一般只关心一个终点事件(即研究者感兴趣的结局)。将其他事件均按删失数据(Censored Data)处理,要求个体删失情况与个体终点事件相互独立,结局不存在竞争风险。竞争风险模型(Competing Risk Model) : 指的是在观察队列中,存在某种已知事件

文章图片
#r语言
R语言glmnet做lasso回归

本文是对glmnet包的说明,主要参考官方文档:https://glmnet.stanford.edu/glmnet包可以实现lasso回归、岭(ridge)回归、弹性网络(elastic-net),它非常强大,可以用于的Lasso或弹性网络正则化路径拟合,并且效率极高。我们主要介绍它的lasso回归功能,主要是因为lasso可以把变量的系数变为0,达到筛选变量的目的。并且我们会以逻辑回归和COX

文章图片
#r语言#回归#开发语言
GSEAvis富集分析可视化

GseaVis,专门用于GSEA富集分析可视化,相比于enrichplot,增加了很多好用的功能,很多功能让我直呼泰裤辣!!

文章图片
#r语言#数据挖掘
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择