logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

常用数据库ID

RefSeq — NCBI数据库的参考序列。Entrez 是 NCBI 使用的能够对众多数据库进行联合搜索的搜索引擎,其对不同的 Gene 进行了编号,每个 gene 的编号就是 entrez gene id。它是最多有 11 位包含大写字母的字符串,一般有着 “X_Y” 的形式,其中 “X”是最多五个便于记忆的蛋白质编号,“_" 是下划线,“Y” 是最多五个便于记忆的物种编号。Ensembl s

#r语言
GEO数据库学习四(差异分析 可视化 GSEA)

定义:在某一特定基因子集中,多个基因共同参与的pathway通路,与标准背景相比,是否比例升高、具有统计显著性。,其中N:所有gene总数n:N中差异表达gene的总数M:N中属于某个GO term的gene个数k: n中属于某个GO term的gene个数p:表示差异表达gene富集到这个GO term上的可信程度当p

#学习
TCGA数据库学习一:基本知识

参数默认为FALSE,下载GDC Data Portal(hg38)。这里小编的建议是,下载转录组层面的数据使用hg38,下载DNA层面的数据使用hg19,因为比如做SNP分析的时候很多数据库没有hg38版本的数据,都是hg19的。并不是所有数据都可以下载。测序数据分为四层:level1、level2、level3、level4,其中level3和level4都是开放下载的,level1是最原始的

文章图片
#r语言
到底了