一、人群SNV频率数据库

数据库名称 网站 简介
dbSNP https://www.ncbi.nlm.nih.gov/snp/ dbSNP 包含人类单核苷酸变异、微卫星和小片段插入和缺失,以及常见变异和临床突变的发表、群体频率、分子结果以及基因组和 RefSeq 映射信息。
gnomAD http://gnomad.broadinstitute.org/或http://www.gnomad-sg.org/ gnomAD(v3.1.2)基于GRCh38,其中短变异(short variant)数据集涵盖了76,156个个体的全基因组测序数据,是各种疾病特异性研究和群体遗传研究的一部分。
1000Genomes http://www.internationalgenome.org/ 1000G旨在绘制当时(2012年)最为详尽、最有医学应用价值的人类基因组遗传多态性图谱。其后数据不断扩充,分析结果不断更新和迭代。目前已经有超过2500个人的基因组。2500个人的全部基因组可产生50 TB(5万 GB)的数据量,包含8万亿个DNA碱基对。
dbVar http://www.ncbi.nlm.nih.gov/dbvar/ dbVar由多种来源获得的基因结构变异 (通常>50 bp)信息组成。
ExAC http://exac.broadinstitute.org/ ExAC是gnomAD的前身,已被整合到gnomAD。
ESP https://evs.gs.washington.edu/EVS/ ESP 的目标是通过开创性地应用人类外显子组测序技术来发现导致心脏、肺和血液疾病的新基因和机制。

二、疾病数据库

数据库名称 网站 简介
OMIM https://omim.org/ OMIM,即在线人类孟德尔遗传(Online Mendelian Inheritance in Man),是一个综合的、权威的研究人类表型和基因型关系的数据库,收录了所有已知的孟德尔疾病,和超过4532个基因包含影响表型的突变的信息。
HGMD http://www.hgmd.org/ 人类基因突变数据库 (HGMD) 代表了对所有已知(已发表)导致人类遗传疾病的基因病变进行整理。
Clinvar https://www.ncbi.nlm.nih.gov/clinvar/ ClinVar记录了人类变异和表型之间的关系,并提供了支持性证据。ClinVar提供的变异临床意义判读标准包含:pathogenic, likely pathogenic, uncertain significance, benign等。
ClinGen https://www.clinicalgenome.org/ ClinGen是美国国立卫生研究院(NIH)资助的数据库资源,用于精准医学,研究基因和变异的临床相关性。ClinGen提供了变异的剂量敏感性,有助于辨别突变的显隐性异常模式。更重要的是ClinGen结合临床、遗传模式、人群、功能证据及专家评审,根据ACMG/AMP指南对变异进行致病性分类,结果保存在ClinVar中。实验室和临床医生也可以使用ClinGen的”variant curation tools”来**评估尚未经过专家审查的变异致病性的证据。
SwissVar https://web.expasy.org/ SwissVar在2020年8月停止访问,数据整合到UniProt数据库
InterVar https://wintervar.wglab.org/ InterVar 用于根据 ACMG/AMP 2015 指南对遗传变异进行临床解释。InterVar 的输入是由 ANNOVAR 生成的带注释的文件,而 InterVar 的输出是将变异分类为’Benign’, ‘Likely benign’, ‘Uncertain significance’, ‘Likely pathogenic’ and ‘Pathogenic’,以及详细的证据。

三、表型数据库

数据库名称 网站 简介
GeneReviews http://www.genereviews.org/ GeneReviews 是为忙碌的临床医生提供的国际即时护理资源,以标准化的期刊样式格式提供与遗传病相关的临床相关和医学上可操作的信息,涵盖患者及其家人的诊断、管理和遗传咨询。
中文版GeneReviews https://genereviews.nrdrs.org.cn/paper/index GeneReviews的中文版
HPO https://hpo.jax.org/app/ HPO数据库 提供了人类疾病中遇到的表型异常的标准化词汇表。HPO 目前包含超过 13,000 个术语和超过 156,000 个关于遗传性疾病的注释。
中文版HPO https://www.chinahpo.net/ HPO的中文版

四、序列数据库

数据库名称 网站 简介
Genome https://www.ncbi.nlm.nih.gov/genome/ 人类全基因组参考序列的来源。
RefSeqGene https://www.ncbi.nlm.nih.gov/refseq/rsg/ 医学相关基因参考序列。
NCBI-Gene https://www.ncbi.nlm.nih.gov/gene/ Gene整合了来自广泛物种的信息。包括命名法、参考序列(RefSeqs)、图谱、通路、变异、表型等
LRG http://www.lrg-sequence.org/ LRG记录了包含稳定的参考序列,用于报告具有临床意义的序列变异
MitoMap https://www.mitomap.org/MITOMAP/HumanMitoSeq/ 对“剑桥版-人类线粒体DNA参考序列”进行修订后形成。

五、预测软件数据库

错义预测

数据库名称 网站 简介
SIFT http://sift.jcvi.org或http://sift-dna.org 进化保守性
PolyPhen-2 http://genetics.bwh.harvard.edu/pph2 蛋白结构/功能和进化保守性
CADD http://cadd.gs.washington.edu CADD结合等位基因的多态性,变异的致病性等多个因素,构建了一套模型,对每个变异位点进行评估,并给出一个具体的得分,简称C-Scores。统计模型直接给出的打分叫做RawScore。这个值越高,代表该变异位点是一个有害突变的概率越高。对RawScores进行从大到小排序,采用-10*log10(rank/total)的公式计算出scaled C-scores。由于这个公式和phread的定义方式类似,所以scaled C-scores也叫做PHREAD。CADD对多种变异有害性预测工具进行了整合(例如PolyPhen和SIFT),并对所有的变异类型都进行了打分 (不止包含错义突变)。
MutationTaster http://www.mutationtaster.org 蛋白结构/功能和进化保守性
Consurf https://consurf.tau.ac.il/ 进化保守性
FATHMM http://fathmm.biocompute.org.uk 进化保守性
MutationAsses http://mutationassessor.org 进化保守性
PANTHER http://www.pantherdb.org/tools/csnpScoreForm.jsp 进化保守性
PhD-SNP http://snps.biofold.org/phd-snp/phd-snp.html 进化保守性
SNP&GO http://snps-and-go.biocomp.unibo.it/snps-and-go 蛋白结构/功能
Align GVGD http://agvgd.iarc.fr/ 蛋白结构/功能和进化保守性
MAPP http://mendel.stanford.edu/SidowLab/downloads/MAPP/index.html 蛋白结构/功能和进化保守性
MutPred http://mutpred.mutdb.org 蛋白结构/功能和进化保守性
PROVEAN http://provean.jcvi.org/index.php 变异序列和蛋白序列同源性之间的相似性比对和测量
nsSNPAnalyzer http://snpanalyzer.uthsc.edu 多序列比对和蛋白结构分析
Condel http://bg.upf.edu/fannsdb/ 综合SIFT、PolyPhen-2和MutationAssessor进行综合预测

剪接位点预测

数据库名称 网站 简介
GeneSplicer http://www.cbcb.umd.edu/software/GeneSplicer/gene_spl.shtml 马尔可夫模型
Human Splicing Finder http://www.umd.be/HSF/ 位置依赖的逻辑
MaxEntScan http://hollywood.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq.html 最大熵原则
NetGene2 http://www.cbs.dtu.dk/services/NetGene2/ 神经网络
NNSplice http://www.fruitfly.org/seq_tools/splice.html 神经网络
FSPLICE http://www.softberry.com/berry.phtml?topic=fsplice&group=programs&subgroup=gfind 基于权重矩阵模型进行种特异性预测

核酸保守性预测

数据库名称 网站 简介
GERP http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html 基因组进化速率分析
PhastCons http://compgen.bscb.cornell.edu/phast/ 保守打分及鉴定保守元件
PhyloP http://compgen.bscb.cornell.edu/phast/help-pages/phyloP.txt 比对和分子进化树:在家系特异或者所有分支中,计算保守或者加速的P值
UCSC GenomeBrowser http://genome.ucsc.edu/ UCSC基因组浏览器可视化查看特定区域的保守信息

六、基因组拷贝数变异分析数据库

数据库名称 网站 简介
DGV http://dgv.tcag.ca/dgv/app/home DGV的目标是提供人类基因组结构变异的综合总结。我们将结构变异定义为涉及大于 50bp 的 DNA 片段的基因组改变。数据库的内容仅代表在健康对照样本中识别到的结构变异。
ClinGen https://www.clinicalgenome.org/ ClinGen提供了部分CNV对照库。在自己没有CNV数据库 (In-house database)的情况下,可与ClinGen的公共CNV数据库比较 。
DECIPHER https://www.deciphergenomics.org/ 使用Ensemble基因组浏览器,将基因芯片数据和临床表型进行关联,便于临床医生和研究人员使用的细胞分子遗传学数据库。
UCSC Genome Browser http://genome.ucsc.edu/ 该网站包括广泛的脊椎动物和模型生物,以及一大套工具,用于查看,分析和下载数据。

七、其他数据库

数据库名称 网站 简介
Pharmgkb https://www.pharmgkb.org/ PharmGKB是一个综合资源,为临床医生和研究人员管理有关基因变异对药物反应影响的知识。
Orphadata http://www.orphadata.org/cgi-bin/index.php Orphadata为科学界提供罕见疾病和孤儿药物相关的全面、高质量的数据集。
HGVS http://www.hgvs.org/ 本数据库由人类基因组变异协会 (HGVS)开发,提供数千种专门针对人群中的特殊变异进行的注释。
LOVD http://www.lovd.nl LOVD为基因组变异和表型收集、展示和管理提供灵活、免费的工具。

八、在线可视化平台

数据库名称 网站 简介
ImageGP http://www.ehbio.com/Cloud_Platform/front/ 高颜值免费SCI图形绘制网站。
EVenn http://www.ehbio.com/test/venn/ 5种Venn图和Venn网络快捷在线绘制。

新鲜出炉 | 临床基因组学数据分析实战将于2021年11月12-14开课!!!

往期精品(点击图片直达文字对应教程)

ff852e49fc68489992577faca9c62709.png

71b5dff13531dcb7d7cc5a701f6201b6.png

13a150058f4a51d811bb8e0eb4a7c8aa.png

b1c6cdb9ca6344cb32d472d3aad1cb6f.png

99583e286f4704e3808fef2af5edae06.png

fc25b90d5a7cdd1737b756f105162e4a.png

045e39b186e37ce0203ab5c7c312c831.png

56587a69ed891485db161c01d1e67345.png

ef2283197f4d2362a326054dafd62d7c.png

ce39f83b339b8419f763e45add7831f9.png

406a8381f6992028e566f559e6668d24.png

a98888b4288f64687f9eca371f5e8b21.png

ad2a1f594c79ebe177545334ffa49903.png

e38db36a9b9dc5ae0c84ebb6ed019aa2.png

0f9b6bd07c54c3f7a2ac95516f38d172.png

de454269b17eb51a810a93f340538cc7.png

07b90e9f207788c6d5b0e1e4bc9d1d94.png

1c9aa8ed237d732ac491fcb2ae32a763.png

89cbad863a114cde28f30366860257cb.png

dbb4727655ee41d672ee30097d48ff41.png

64ba1cbd4f00ee66475d849d18eee27a.png

31ee6a8916471c17074d724d5e51aed6.png

3e78269bcfd9f95fc6b7efe9ee888785.png

c3eab0ce8680815fc2bde6436159bf62.png

8bc0b80420973ff9e685b7dbe70f0705.png

64fbb311a295113cf383fe986f67d4bb.png

6a97b3cf8de7223e2640a70d49fa39ce.png

d554f5ecb7a567397a73d83780021117.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

5e8aa743d72dcc460b29c5cfc5fc8ca9.png

c69a284a14692d34d51287d35c9b89b9.png

822b4df5306b9419bd396865e4515529.png

点击阅读全文
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐