
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在介绍完的查询下载和数据分析功能之后,我们简单展示几个示例,来练练手,加深对这个包的理解和使用我们主要从基因组、转录组和表观组3个维度分别举例来进行说明。

通常,在识别完了差异基因之后,都会对差异基因进行功能富集,来获取差异基因参与的潜在生物学功能通路或生物学进程,有助于理解基因之间的作用关系以及发现基因在癌症发生发展过程中发挥的作用。通路,通常是一些已知的功能相关的基因集合,而我们常说的基因集合,一般是忽略了基因之间互作关系的通路。最常见的通路富集,是使用GO和KEGG数据库中预定义的生物学通路。

数据进行差异表达分析的包,它的线性模型和差异表达函数可以应用于任何基因表达定量技术,也包括定量。包集成了很多功能,包括数据的读取、预处理(如背景矫正、组内或组件标准化等)和差异表达分析。不仅可以应用在基因水平,也可以在外显子、转录本水平进行差异分析,我们以基因水平为例。数据进行差异表达分析,也可以对其他芯片类型的数据进行分析,如。该算法的核心是使用负二项广义线性模型来检验基因表达的差异。等数据进行

加权基因共表达网络分析(WGCNA)是一种用来描述不同基因在样本中的表达关联模式的系统生物学方法。通过将表达高度相关的基因聚集成不同的模块,并探究不同模块与样本表型之间的关联。还可以探究模块内的关键基因的功能,作为潜在的生物标志物或治疗靶点进行后续分析WGCNA数据预处理构建加权相关性邻接矩阵计算拓扑重叠矩阵(TOM对基因进行层次聚类,划分模块。

对于单个基因,我们可以分析些什么呢?是癌与正常的差异表达,还是高低表达的生存差异,亦或是与某些特征基因之间的表达相关性呢?不只,我们能做的不仅仅只有这些。下面我们将通过一系列的文章来详细的介绍一下单个基因可以做哪些分析。首先要选择一个兴趣基因,选用哪个基因呢?选一个研究比较多,非常著名的癌症相关基因TP53,这个基因涉及的数据比较多,分析起来比较方便。首先来介绍点简单的,使用数据库检索单基因的信息

前面,我们介绍了如何获取TCGA的各种数据。在获取到数据之后,我们就可以进行数据分析及分析结果的可视化了也提供了一些列的函数,通过封装一些常用的算法来简化分析的流程。例如差异基因、富集分析、生存分析等先导入依赖包。

上一节所介绍的绘制多个Y轴,只能在图形的右侧依次添加Y轴。在Y轴数量过多的情况下(当然,轴不应该太多),将轴平均地放置在左右两侧会更美观些。因此,这节主要介绍如何在图形的左侧添加Y轴。

我们前面所介绍的图形,基本上都是在笛卡尔坐标系上的图形。今天,我们要介绍几种绘制在极坐标上的图形。

我们继续介绍,今天要介绍的内容是热图列表。包的一个重要的功能是,能够在水平或竖直方向连接多个热图和注释,以图形化的方式展示各信息之间的关联通常水平方向的连接比较常用,我们介绍的重点也是水平连接,竖直的连接原理基本是一致的。在进行水平连接时,热图和注释的行数要相同例如,我们要绘制三个热图列表,数据如下使用以水平方向连接热图默认情况下,第二幅热图的行树状图会删除,并且其行顺序与第一幅热图一样,同时第一

检验数据的分布有很多种方法,如卡方检验、K-S检验等。而以图形的角度来说,可以使用Q-Q图或P-Pbeta分布:t分布卡方分布gamma分布正态分布均匀分布logistic分布等Q-Q图通过将两个概率分布的相同分位数点的值映射为x和y轴。如果两个分布比较相似,那么图上的点大致落在y=x直线上;如果这两个分布线性相关,则点大致分布在一条直线上,但不一定在y=x上。如果样本数据近似服从正态分布,则图上








