MaxQuant的安装和使用(linux OR windows)
MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。
目录
MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。
1. 安装
MaxQuant
下载方式:
- 通过官网 下载,包括
andromeda
(搜索引擎)+viewer
(检查原始数据、鉴定和定量结果)。 - 通过conda下载,详见下面代码。(linux安装时推荐使用该方法)
conda create -n maxquant
conda activate maxquant
conda install -c bioconda maxquant
maxquant --help # 查看命令行参数
#maxquant mqpar.xml
#报错如下:.NET Core 3.1 needs to be installed. Please visit https://dotnet.microsoft.com/download/dotnet-core/3.1 and install the SDK x64.
#mkdir -p dotnet; cd dotnet
#wget ...
#tar xzvf dotnet-sdk-3.1.426-linux-x64.tar.gz
#export DOTNET_ROOT=/path/software/dotnet
#export PATH=$PATH:/path/software/dotnet
此外,官网还提供了Perseus
软件,用于对MaxQuant
输出进行统计分析。
2. 用法
2.1 命令行方式(linux)
通过以下任一方法生成配置文件。其中方法1需要人工修改较多地方,方法2仅需修改文件位置,更加方便,但需要注意使用相同版本GUI来产生配置文件。
# 方法1. 生成配置文件mqpar.xml
maxquant --create mqpar.xml
#maxquant mqpar.xml --changeFolder=mqpar_new.xml /fasta /raw
vi mqpar.xml
# 方法2. 相同版本GUI保存参数文件,传输到linux
基于配置文件运行软件。
maxquant mqpar.xml
2.2 GUI方式(windows)
双击MaxQuant.exe
,打开以下界面。红框为参数配置模块。其中大部分参数通常并不需要改变,一般使用官方protocol中提供的minimal workflow就可以,见下文高亮部分。 另外,官方protocol中一些参数随着版本更新其位置已经发生改变或者被移除,此类参数会以删除线标识。
Andromeda配置/Configuration(2)
Modifications
(3-10):修饰的增、改。Proteases
(11):Sequence databases
(12-13)v2.0.3.0
中没有发现该参数。
数据上传/Raw files (14)
- Load data(15):通过以下任一方法导入原始数据,如.raw等。
Load
:导入原始数据。Load folder
: 导入选中文件夹中所有原始数据。
- Experimental design(16):通过以下任一方法设置元数据。
Set*
:选中行后,①通过Set experiment
设置实验(分组/样本),相同实验的数据后续会被合并;②通过Set paramter group
设置参数组,不同参数组可以应用不同的参数设置,具体设置见(17);③通过Set fraction
设置fraction;Write*
:当数据项较多时,可以通过Write template
导出包含数据的模板文件,然后在直接编辑模板文件,最后将编辑好的模板文件通过Read from file
导入软件。
组特异参数/Group-specific parameters(17)
Type
(19)- Type(19):指定LC-MS run的类型。①label-free和MS1-labeled样本选择Standard;②传统的同位素标记标记样本选择Reporter ion MS2;③同位素标记的MS3质谱选择Reporter ion MS3。
- Multiplicity(19):指定MS1标签数。如果没有使用标签,设置为1。下方复选框选择使用的标签。
Digestion
(20)- Digestion mode(21):
- Enzyme(22):因为准确的裂解特异性等优点,胰蛋白酶在多数自下而上的蛋白质组学实验中都被用作蛋白酶。因此Enzyme默认值为Trypsin/P。胰蛋白酶能裂解精氨酸和赖氨酸C末端的肽段,除非其后有脯氨酸。MaxQuant使用该规则对蛋白质数据库进行in silico裂解。
- Max. missed cleavages(23):蛋白酶消化并不总是完全的,通过将参数设为2,in silico裂解的序列中也包括含有额外精氨酸或赖氨酸的肽段。
Modifications
(24):根据in silico生成的多肽数据库计算出多肽的质量,并与测量的质量相匹配,从而对其进行识别。肽的质量会因肽的修饰而改变,例如在不同定量策略中应用的化学标记或生物学翻译后修饰。因此,在in silico生成的肽质量列表中还必须包括可能的肽修饰。- Variable modifications(25):Variable modifications是指并非每个氨基酸都会发生的修饰,如蛋氨酸氧化(Oxidation (M))可能只发生在某些蛋氨酸上。再比如,只有少数肽的 N 端会发生乙酰化(Acetyl (Prorein N-term))。需要注意的是可变修饰会增加in silico肽数据库的容量,进而增加分析时间。
- Fixed modifications(39):Fixed modifications是指特定氨基酸每次出现时都会发生的修饰。这些修饰通常是人为引入的,如蛋白质组学样品制备中防止二硫键重新形成的半胱氨酸的氨基甲酰甲基化,也是该参数的默认值Carbamidomethyl (C)。
- Max. number of modifications allowed per peptide(26);
Label-free quantification
(27):- Label-free quantification(27):选择是否应用LFQ算法。
- min. ratio count(28)
- Fast LFQ(29)
Skip normalization(30)
- Label-free quantification(27):选择是否应用LFQ算法。
Instrument
(31)First search
: (32)Misc.
(33): Re-quantify(34); Match type(35)???
全局参数/Global parameters (36)
-
Sequences
(37)
- Add(37):添加数据库。此外,还可以通过Identifier和Description定义的正则,从fasta头提取ID和描述。
- Include contaminants(38): 将conf/contaminants.fasta中的蛋白添加到搜索数据库。
Fixed modifications(39):v2.0.3.0中该参数已移动至页面(24)下,详见上文。- Min. peptide length & Max. peptide mass(40):设置用于蛋白鉴定和定量肽段的最短长度(典型值7-9,长度<7的肽段不是唯一的。注:甚至更长的肽段也不是唯一的,比如源于同一结构域的肽段可能被同源蛋白共有,可以通过设置min unique peptides处理该情况)和最大质量。
- (Min|Max). peptide lengths for unspecific(41):设置非特异性搜索(即不使用消化酶)情况下的最小和最大肽段长度;
-
Identification
(42)
红框中的13个参数在v2.0.3.0和v1.5.3.30中都在Identification
下。- PSM FDR(43):PSM水平的FDR阈值,由TDA计算得出,0.01代表1% FDR。
- Protein FDR(44):蛋白质水平的FDR阈值。
- Site decoy fraction(45):修饰位点表水平上对饵命中进行过滤。
- Min. peptides(46):鉴定一个蛋白质簇所需总肽段数的最小值,并在最终表格中报告。
- Min. razor + unique peptides(46):鉴定一个蛋白质簇所需razor+unique肽段数的最小值,并在最终表格中报告。
- Min. unique peptides(46):鉴定一个蛋白质簇所需unique肽段数的最小值,并在最终表格中报告。肽会以统计的方式组合成相应的蛋白质,因此主要应根据唯一肽进行判断。可以将参数设为1,即输出表中只报告至少有一个唯一肽的蛋白质。
- Min. score for unmodified peptides(47):接受MS2鉴定无修饰肽的最小Andromeda分数。推荐值为0,即除FDR外,没有额外的过滤。
- Min. score for modified peptides(47):接受MS2鉴定修饰肽的最小Andromeda分数。默认值为40。除对PSMs应用的FDR外,还需额外过滤。
- Min. delta score for unmodified peptides(47):接受MS2鉴定无修饰肽的最小Andromeda delta分数。推荐值为0,即除FDR外,没有额外的过滤。
- Min. score for modified peptides(47):接受MS2鉴定修饰肽的最小Andromeda delta分数。默认值为6。除对PSMs应用的FDR外,还需额外过滤。
- Base FDR calculations on delta score:如果选中,所有 FDR 计算都将使用 delta 分数作为输入。delta 分数是得分最高的 PSM 与氨基酸序列不同、得分次之的 PSM 之间的分数差。
- Dependent peptides:无偏搜索来自已鉴定肽的修饰肽。
- …
-
(51)Adv. Identification???
-
Protein quantification
(55)
- (Label)? Min. ratio count:设置蛋白定量的最小比值计数。对于定量标记肽对/三联体数量较少的蛋白质,将不报告比值。如果使用实验设计,则该标准将分别应用于每个实验。
- Peptides for quantification:指定蛋白质比率的计算方式。All 选项将使用所有肽段进行定量。Unique 选项则只使用簇中特有肽进行定量。Unique + razor 选项通过簇中特有肽和剃刀肽计算蛋白质比率。剃刀肽(razor)是指分配给蛋白簇的非特有肽,该蛋白质簇中有最多的其他肽。
- Use only unmodified peptides and …:指定蛋白质定量应使用哪种多肽。如果未选中,则使用所有肽段(无论其修饰状态)。如果选中,则使用所有未修饰肽段+仅在下面字段中指定修饰的肽段。
- Modifications used in protein quantification:
- Discard unmodified counterpart peptide:如选中,则未修饰的多肽也将被丢弃,因为鉴定的修饰多肽对应的修饰未在上述字段中指定。
- Adavanced ratio estimation:
-
Tables
(66) -
Folder locations
(67) -
Advanced
(72)
- Used for occupancies:在计算基于标签的occupancies,使用归一化还是非归一化比率。
-
Number of threads
(80) -
Start
(81)
Performance(82)
处理器数量(80)
3. Troubleshooting
https://groups.google.com/g/maxquant-list
参考
Neuhauser, Nadin, et al. “High performance computational analysis of large-scale proteome data sets to assess incremental contribution to coverage of the human genome.” Journal of proteome research 12.6 (2013): 2858-2868.
2013年,作者发布了支持并行计算的版本(1.3.7.4)。
MaxQuant goes Linux
2018年,作者发布了MaxQuant的linux版本(1.6.1.0)。该版本主要依赖mono
。
MaxQuant Doc
官方文档链接。
【6】蛋白质组学鉴定定量软件之MaxQuant
一篇MaxQuant的中文实践。
Label-free data analysis using MaxQuant
文章介绍了如何Galaxy平台中使用MaxQuant,本文翻译了其中对参数的解释。
更多推荐
所有评论(0)