d50e9f0d204c994caa0974129a41acea.png

上一期我们一起学习了如何差异表达基因的注释,接下来的工作就是统计分析和可视化。

对于差异表达分析,最主要的两种统计分析就是GO的富集分析和KEGG通路的富集分析。

今天我们一起学习GO分析

GO分析即基因本体论(Gene Onotology)分析,包括GO注释和GO富集分析。

GO是基因本体联合会(Gene Ontology Consortium)所建立的数据库,它由一组预先定义好的术语(GOterm)组成,这组术语对基因和蛋白质功能进行限定和描述,适用于各种物种,并能随着研究不断深入而更新。

GO中的每个术语都有唯一的一个GOID,GO的所有术语由有向无环图(DAG)来相互联系,术语之间通常有三种关系:"is_ a"、"part_ of" 和"regulates"。

在R语言中GO分析主要是由Bioconductor的GOstats包实现的。

我们这一期的代码内容是在上一期的内容的基础上运行的

Bioconductor基因芯片数据分析之注释

#加载所需R包

BiocManager::install("GOstats")library(GOstats)

#提取HG_U95Av2芯片中所有探针组对应的EntrezID,注意保证uniq

entrezUniverse 

#提取所有差异表达基因及其对应的EntrezID,注意保证uniq

entrezSelected 

#设置GO富集分析的所有参数

params 
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐