今天向大家介绍一个集合了蛋白结构预测、功能注释、cadd等相关功能的在线服务网站:
https://zhanggroup.org/

如下图,左边栏列出了它的所有功能。挑了几个使用频率可能比较高的几个仔细了解了一下。

网站主页概览


I-TASSER

I-TASSER是一种蛋白质结构预测和基于结构的功能注释的分层方法。它首先使用LOMETS找寻建模的模板pdb结构,然后经过多次碎片组装模拟最终建立起目标序列的三维结构。这之后将该预测出的三维结构放到他们自己构建的结构功能注释数据库(BioLiP)进行功能注释。
*注意:还网页的所有在线工具均需要注册(限学术邮箱)

I-TASSER提交任务页面

C-I-TASSER

C-I-TASSER是一种从I-TASSE发展而来的高精度结构预测与功能注释的工具。它首先使用深度学习神经网络训练的contact map预测模型获得你所提交序列的contact map。然后使用LOMETS找寻建模的模板pdb结构,最后用contact-map指导的副本交换蒙特卡洛模拟对模板pdb碎片组装以获得最终的预测结果。将预测的结构上传至功能注释数据库(BioLip)获得蛋白功能注释。大规模测试结果显示C-I-TASSER预测的结构比I-TASSER更准确,尤其是对于没有同源结构模板的目标蛋白而言。

C-I-TASSER提交任务页面

QUARK

QUARK不同于前面介绍的两个,它是一种从头结构预测工具。可以仅从序列上就能预测出蛋白的结构,不需要模板结构的存在。它是依靠N多个1-20个长度的氨基酸碎片在使用经验力场的蒙特卡洛模拟的指引下构建模型。对于QUARK而言不需要提供任何多余的模板信息,因此十分适用于没有同源结构的蛋白预测。



C-QUARK

C-QUARK也是一种从头结构预测工具。它之于QUARK的关系类似于C-I-TASSER之于I-TASSER的关系。首先,利用ResPRE和NeBcon预测多个contact map;其次借助QUARK实现副本交换蒙特卡洛折叠模拟;最后将模拟产生的多个构象作为“诱饵”喂给SPICKER(一种聚类算法,用于识别一众结构中最接近天然结构的构象);得到的最终结构用ModRefiner、FASPR这两个工具优化。



LOMETS

LOMETS是一种依赖模板的下一代结构预测以及三维结构功能注释的方法。首先它通过引入结构域划分和组装模块处理具有多结构域蛋白,并使用基于梯度的优化工具(deepfold)进行三维结构的构建(基于训练的深度学习模型以及排名靠前的模板引导构建);接着使用COFACTOR工具进行结构功能注释。大规模测试结果显示,新一代的LOMETS性能较前两代有明显提升。

返回结果包括如下内容:

  1. 二级结构预测结果
  2. 溶剂可及性预测结果
  3. contact-map和distance-map预测结果
  4. 结构域划分结果(可在高级选项中控制是否输出)
  5. 单独结构域预测的建模结果(可在高级选项中控制是否输出)
  6. 排名前十的各结构域模板组合而成的模板(可在高级选项中控制是否输出)
  7. 排名前十的全长序列模板
  8. 预测的三维结构模型
  9. 与预测排名第一的结构最相似的10个其他结构
  10. GO词条注释(所属生物学过程、细胞组分、分子功能)

COACH

COACH是一种蛋白-配体结合位点预测的工具。COACH将使用TM-site和S-site这两种方法来预测配体结合位点,这两种方法是从BioLIP功能注释数据库中和靶蛋白子结构/子序列进行比对,找到潜在的配体结合位点。该工具使用时可以输入靶蛋白序列也可以输入靶蛋白三维坐标,只不过输入蛋白序列可能要稍慢,因为这之间多了一步I-TASSER预测三维结构的过程。

COACH功能主页


COFACTOR

COFACTOR可以用于匹配同源结构、预测配体结合位点、GO分析、酶功能注释。首先读入输入的蛋白三维结构信息,接着前往BioLIP数据库中匹配相似的结构,最后以匹配最相似的结构为指导进行功能注释,包括所属生物学过程、细胞组分、分子功能、酶催化功能、配体分子结合位点。

COFACTOR功能主页


MetaGO

MetaGo是一种对蛋白质GO词条(所属生物学过程、细胞组分、分子功能)预测注释的工具。第一步对输入的三维结构进行局部或全局结构的比对;第二步对蛋白序列进行比对;第三步对与其同源蛋白相互作用的分子进行匹配(map)。最后对这三步整合得到蛋白功能信息。

MetaGo功能主页


EvoDesign

EvoDesign是一款以生物进化轮廓为基础的蛋白设计工具。同时满足单体蛋白以及复合物蛋白设计的需求。对于输入的单体蛋白或复合物蛋白,EvoDesign首先通过结构比对从pdb数据库中找到具有相似折叠方式(对单体蛋白而言)或相似接触面(对复合物蛋白而言)的结构;对这些匹配到的结构和输入结构一起分析,以此作为输入结构蛋白序列设计的指引(在这一过程中,侧链的摆放、骨架的朝向都遵循一种全新的力场EvoEF)。最后返回的结果是设计好的蛋白序列,虽然在该工具下有一个调用I-TASSER建模的选项,但它们并不推荐使用。推荐的做法是将设计好的序列放到I-TASSER模块进行单独预测。

单体蛋白设计的主页面

复合物蛋白设计主页面


FG-MD

FG-MD是一种基于分子动力学的结构优化算法。旨在改进初始模型,使其更接近自然构象。还可以通过消除空间碰撞、改善扭转角和氢键网络来改善局部构象。它首先通过结构比从pdb数据库中找到结构相似的碎片。从碎片分子提出的空间约束应用到MD采样过程中。

FG-MD主页面


EDOCK

EDOCK适用于小分子和蛋白的对接。不同于常规对接需要选定结合口袋,EDOCK实现了“盲”对接。具体地,第一步通过我们上文介绍过的COACH进行结合口袋的预测,第二步使用一种改进的图匹配算法将配体分子置于结合口袋中(产生初始构象),第三步采用副本交换的分子动力学模拟手段对小分子进行采样。最后用基于先验经验的综合打分函数挑选出优势构象。

EDOCK主页面


GPCR-I-TASSER

GPCR-I-TASSER是一种用于预测G蛋白偶联受体三维结构的计算方法。输入的预测序列首先提交给LOMETS(上文介绍过)用于找寻同源结构。如果同源模板找到了,那么就进行基于模板的碎片重组程序进行模型构建。如果没有找到同源模板,利用ab initio TM-helix folding程序从头组装7次跨膜螺旋束,然后进行GPCR-I-tasser结构重组模拟。最后的结构经由FG-MD(上文提过)工具优化。GPCR-I-TASSER只适用于G蛋白偶联受体结构的预测,一般蛋白的预测一般选用I-TASSER。

GPCR-I-TASSER主页面


CR-I-TASSER

CR-I-TASSER是一种辅助冷冻电镜解析结构的工具。他需要同时读入蛋白序列以及cryo-EM电子云密度图。读入的电子云密度图通过卷积神经网络预测Cα位置。读入的蛋白序列用于搜寻同源蛋白结构。同源蛋白模板信息以及预测的Cα位置信息一道指引着蛋白模型的构建。大规模测试表明,CR-I-TASTER在冷冻电镜结构确定方面比其他方法具有显著的优势。

CR-I-TASSER操作页面

:::

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐