python3.6+pytorch1.6+cuda10.1

问题

由于nnUNet框架需要pytorch1.6以上版本,而cuda版本为10.1,使用如下语句安装

conda install pytorch torchvision cudatoolkit=10.1 -c pytorch

导致默认安装的pytorch为1.4,所以需要指定安装的pytorch版本。

1.安装Anaconda

上传下载的anaconda到服务器,cd到需要安装的文件夹,运行如下命令

bash Anaconda3-2019.10-Linux-x86_64.sh

修改安装目录,直接输入想要安装的位置路径

2.安装pytorch

创建环境

conda create -n pytorch python=3.6

激活环境

source activate pytorch

安装pytorch1.6

pip install torch==1.6.0+cu101 torchvision==0.7.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html

执行以下语句检验pytorch是否安装成功                                                                                            

import torch
print(torch.__version__)
torch.cuda.is_available()

显示如下表示安装成功

 3.安装NVIDIA-Apex:

在你用来安装环境的目录下打开终端

git clone https://github.com/NVIDIA/apex;

出现‘fatal:unable to access’错误重新执行语句即可

 cd apex 进入你刚才下载下来的apex文件夹里面执行语句

python setup.py install --cuda_ext --cpp_ext

tips:

(1)安装apex碰到No module named 'packaging'

解决方案:pip install -v --no-build-isolation --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

ModuleNotFoundError: No module named 'packaging' ERROR · Issue #13761 · microsoft/onnxruntime · GitHub

(2)pytorch=1.8时

cd https://github.com/NVIDIA/apex/tree/22.04-dev

下载后cd 22.04-dev

git checkout apex_no_distributed
pip install -v --no-cache-dir ./

AttributeError: module 'torch.distributed' has no attribute '_all_gather_base' · Issue #98 · MILVLG/bottom-up-attention.pytorch · GitHub

 安装成功

 4.安装hiddenlayer

pip install --upgrade git+https://github.com/nanohanno/hiddenlayer.git@bugfix/get_trace_graph#egg=hiddenlayer(没有换行,这是一行代码)

5.安装nnUNet
在home下创建nnUNet_sd_loss文件夹(自己定),在这个文件夹内打开终端,输入如下命令

git clone https://github.com/MIC-DKFZ/nnUNet.git
cd nnUNet
pip install -e .(别忘了加 . )

当你安装完成这些以后,你的每一次对nnUNet的操作,都会在命令行里以nnUNet_开头,代表着你的nnUNet开始工作的指令。

 安装完成

Logo

更多推荐