Linux——nohup后台运行程序并记录PID

文章目录后台执行nohup1.最简单的nohup方式2.指定log输出路径和文件的nohup方式3.指定log输出路径和文件并记录程序的PIDnohup日志实时监控并打印输出由于这周在服务器端训练大型的模型，一般都需要几天的时间，结果，这周连续断了两次电，服务器是没断电，但是主机没电关机了，导致意外训练中止。我一个程序跑了3天，还差一天的时候中断了；另一个是跑了一天多，还剩1/3的时候又中断了。。

Irving.Gao

3200人浏览 · 2022-05-15 14:49:48

Irving.Gao · 2022-05-15 14:49:48 发布

文章目录

由于这周在服务器端训练大型的模型，一般都需要几天的时间，结果，这周连续断了两次电，服务器是没断电，但是主机没电关机了，导致意外训练中止。我一个程序跑了3天，还差一天的时候中断了；另一个是跑了一天多，还剩1/3的时候又中断了。。。所以泪目找nohup，防止网络中断导致训练停止。

后台执行nohup

1.最简单的nohup方式

使用nohup命令，最后加上&即可：

# nohup xxxx xxxx &
nohup python train.py &

Ctrl + C不会中断程序的执行；
nohup会将所有的输出默认写入在当前路径的nohup.out文件中。

如下所示：
在这里插入图片描述
如果你的程序有后缀参数，可以这样优雅的写：

nohup python train.py --log_iter 1 \ # 所有的参数最后加 \
                      --vis_log_iter 1 \
                      --nepochs 10 \
                      --bsz 10 \
                      & 			# 将 & 放在最后即可

2.指定log输出路径和文件的nohup方式

# nohup xxxx xxxx > xxx(ur_log_file) 2>&1 &
nohup python train.py > train.log 2>&1 &

nohup会将所有的输出默认写入在你指定的的log_file文件中，我这里的就是train.log。

带参数优雅版：

nohup python train.py --log_iter 1 \ # 所有的参数最后加 \
                      --vis_log_iter 1 \
                      --nepochs 10 \
                      --bsz 10 \
                      > runs_seg/train.log 2>&1 &

3.指定log输出路径和文件并记录程序的PID

# nohup xxxx xxxx > xxx(ur_log_file) 2>&1 & echo $! > xxx(pid file)
nohup python train.py > train.log 2>&1 & echo $! > run.pid

nohup会将所有的输出默认写入在你指定的的log_file文件中，我这里的就是train.log；
同时会将当前python的PID记录在run.pid中，方便你中止程序（一般训练中都用会使用多进程，所以实际上会有多个程序，但是nohup只会记录当前启动的那个程序的PID，不过不影响，因为你只要杀掉1个子进程，所有进程都会中止）。

在这里插入图片描述

4.运行bash脚本

# nohup sh xxxx.sh 可跟参数 > train.log 2>&1 &
nohup sh tools/dist_train_semi.sh configs/semi_bevdet/semi_bevdet_baseline.py 8 > train.log 2>&1 &

nohup日志实时监控并打印输出

实时监控nohup输出log的内容：

tail -f train.log

在这里插入图片描述

参考文章：

Linux

更多推荐

网卡速率和双工模式的配置

http://linux.chinaitlab.com/system/792187.html1、mii-tool 配置网络设备协商方式的工具； 1.1 mii-tool 介绍； mii-tool - view, manipulate media-independent interface status （mii-tool 是查看，管理介质的网络接口的状态）

Linux

Linux虚拟文件系统之文件系统卸载（sys_umount())

Linux中卸载文件系统由umount系统调用实现，入口函数为sys_umount()。较于文件系统的安装较为简单，下面是具体的实现。1. /*sys_umont系统调用*/2. SYSCALL_DEFINE2(umount, char __user *, name, int, flags)3. {4.struct path path;

Linux

Linux系统下超级终端Minicom的使用方法（例如：连接交换机，路由器等）转http://baike.baidu.com/view/2911642.htm?fr=ala0_1

Linux系统下超级终端Minicom的使用方法 　　Linux下的Minicom的功能与下的超级终端功能相似，适于在通过超级终端对设备的管理以及对嵌入操作系统的升级，现写出Minicom的使用手册： 　　1．启动minicom 　　以root权限登录系统 　　使用命令 　　minicom –s 则minicom启动，屏

Linux

所有评论(0)

查看更多评论

Irving.Gao

@qq_45779334

已为社区贡献3条内容