在工作中,我们排除app出现的一些性能/资源问题时,通常要先知道当前app的资源使用情况,方能进一步思考改进措施。获取这些信息的途径有很多,我这里简单分享下两种:1)从proc文件系统;2)通过Linux 的API函数。

一、/proc/[PID]/下的各个文件

1、proc简介

  /proc 目录是一个特殊的虚拟文件系统,它提供了对内核运行时信息的访问,包括进程、设备、网络、文件系统等各个方面的信息。它不是一个真正的文件系统,而是基于内核数据结构的一个接口,通过这个接口可以获取系统的运行时状态。

下面是 /proc 目录的一些重要子目录和关键内容的说明:

  • /proc/[PID]:此目录以进程的 ID(PID)命名,并包含与该进程有关的文件和目录,如之前所讲的 /proc/pid/目录。

  • /proc/cpuinfo:该文件包含有关 CPU(处理器)的信息,如厂商、型号、频率、缓存等。

  • /proc/meminfo:该文件包含有关系统内存的信息,如总内存、可用内存、缓存、交换分区等。

  • /proc/mounts:此文件列出了系统上已挂载的文件系统,包括文件系统类型、挂载点、挂载选项等信息。

  • /proc/net:此目录包含有关网络协议、接口和连接的信息,如 /proc/net/tcp、/proc/net/udp 等文件。

  • /proc/sys:此目录包含与内核参数和系统配置相关的文件。可以通过读写这些文件来修改内核的运行时行为。

  • /proc/version:该文件包含了当前正在运行的内核版本信息。

  • /proc/cmdline:此文件包含了系统引导时传递给内核的命令行参数。

  • /proc/uptime:该文件包含自系统开机以来的运行时间和空闲时间。

  • /proc/sys/kernel/hostname:此文件包含主机的名称(hostname)。

  除了上述目录和文件,/proc 目录下还有很多其他文件和目录,涵盖了系统和进程的各个方面的信息。

  需要注意的是,/proc 目录下的文件是动态生成的,信息在进程运行时改变。读取这些文件时,请确保有足够的权限,并理解每个文件的含义和用途。此外,不要轻易对 /proc 目录下的文件进行修改,因为这可能会导致系统不稳定或损坏。

2、/proc/[PID]/详解

在这里插入图片描述

  • arch_status: 该文件包含了有关进程所运行的指令集架构的信息。例如,它可以显示进程在x86或ARM架构上运行。

  • attr: 此目录包含与进程关联的文件、目录和进程的访问控制列表(ACL)信息。这些文件和目录的访问权限可以在这里进行管理和修改。

  • autogroup: 这个文件显示了进程是否被自动控制分组,以限制对CPU资源的访问。如果进程分配给自动控制分组,则该文件中的值为"1";否则,为"0"。

  • auxv: 此文件包含了进程的辅助向量信息,这些信息在加载动态链接器时向其传递参数。辅助向量为动态链接器提供有关进程环境和运行状态的信息。

  • cgroup: 该文件显示了进程所属的控制组(cgroup)的路径。控制组是一种组织和限制进程资源使用的方式。

  • cmdline: 该文件包含了启动进程时使用的命令行参数,以null字符分隔各个参数。可以通过读取该文件来获取进程的命令行参数信息。

  • comm: 进程的命令名可以通过这个文件获得。它可以是可执行文件名或进程自描述。

  • coredump_filter:这个文件决定了进程在发生崩溃时生成核心转储(core dump)的内容。通过修改该文件的值,可以控制生成核心转储时包含的内容,这对于调试崩溃问题非常有用。可以使用 echo 命令将特定的值写入这个文件中,以修改核心转储的行为。

  • cpu_resctrl_groups:这个文件是与 CPU 资源控制(Resource Control)相关的,用于管理进程对CPU资源的使用。通过这个文件,可以查询或配置进程关联的 CPU ResCtrl(CPU资源控制)组的信息。CPU资源控制是用于管理和限制进程对CPU资源的访问的一种技术,可以实现资源隔离、分配和监控。

  • cwd: 这是一个符号链接,指向进程的当前工作目录(current working directory)。

  • environ: 该文件包含了进程的环境变量,以null字符分隔各个环境变量。通过读取该文件,可以获取进程的环境变量信息。

  • cpuset: 这个文件包含了进程所属的 cpuset(CPU affinity)的信息,可以用于管理进程所能使用的 CPU 核心。 通过这个文件,可以查询或设置进程所在的 cpuset。

  • exe:这是一个符号链接,指向进程正在执行的可执行文件。通过读取这个符号链接,可以获取进程当前正在执行的可执行文件的路径。

  • fdinfo: 这个目录包含了关于进程打开的文件描述符(file descriptor)的详细信息,如文件的偏移量(offset)等。

  • gid_map:这个文件用于表示进程的实际组ID(GID)与其用户命名空间中的GID之间的映射关系。

  • io:这个文件包含了有关进程的输入/输出统计信息,如读取和写入的字节数、I/O操作次数等。

  • limits:这个文件包含了对进程资源限制的报告,显示了一些限制项目的值,比如内存限制、文件大小限制等。

  • loginuid:这个文件记录了与进程关联的登录用户ID(login UID)。

  • map_files:这个目录包含了进程打开的映射文件的相关信息,可以用于查询进程当前使用的文件映射情况。

  • fd: 此目录包含了进程打开的文件描述符(file descriptor)的符号链接。可以通过查看这些符号链接来获取进程打开的文件等信息。

  • maps: 该文件包含有关进程内存映射的信息,包括进程的内存地址范围、映射的文件等。

  • mounts: 此文件显示了进程的挂载点信息,包括进程当前挂载的各个文件系统的详细数据。

  • mem:这个文件允许对进程的内存空间进行直接访问,可以用于调试、内存分析等目的。

  • mountinfo:这个文件提供了有关进程所挂载的文件系统的详细信息,包括挂载点、挂载选项等。

  • mountstats: 此文件包含了有关挂载点的统计信息,如 I/O 统计等。

  • net:目录包含了一系列与网络相关的文件和子目录,可以用于查询进程的网络连接、端口等信息。

  • ns:这个目录包含了进程的各种命名空间相关的符号链接,可以用于查询和操作进程的命名空间。

  • numa_maps:这个文件包含了有关进程内存使用和NUMA节点分布情况的信息,对于了解进程的NUMA相关性非常有用。

  • oom_adj:这个文件包含了与进程的OOM(Out Of Memory)分级相关的信息,用于调整进程在内存不足情况下被系统杀死的优先级。

  • oom_score:这个文件包含了进程的OOM分数,用于在系统内存不足时选择性地终止进程。

  • oom_score_adj:与 oom_adj 类似,这个文件也用于调整进程在内存不足情况下被系统杀死的优先级。

  • pagemap:这个文件提供了有关进程虚拟内存页面到物理内存帧的映射信息,对于内存管理方面的深入了解非常有用。

  • patch_state:这个文件包含了有关进程的内核安全补丁状态的信息,通常用于安全审计和补丁管理。

  • personality: 这个文件包含了与进程的运行环境和虚拟机架构相关的信息,用于指定进程的特定行为。

  • projid_map:在用户命名空间中使用的文件,用于表示进程实际项目ID(Project ID)与其用户命名空间中的项目ID之间的映射关系。

  • root:这是一个符号链接,指向进程的根目录。

  • sched:这个文件提供了与进程调度策略和优先级相关的信息,包括当前调度策略、优先级等。

  • schedstat:这个文件包含了与进程调度统计相关的信息,如运行时间、等待时间等。

  • sessionid:这个文件记录了与进程关联的会话ID。

  • setgroups:这个文件包含了与进程的附加组(supplementary group)相关的信息。

  • smaps:这个文件提供了详细的进程内存映射信息,包括每个内存区域的权限、大小、映射文件等。

  • smaps_rollup: 类似于 smaps 文件,但提供了按文件和库合并的内存映射信息,用于更简洁的内存分析。

  • stack:这个文件记录了进程的当前栈的内容。

  • stat: 这个文件提供了与进程状态相关的信息,如进程ID、父进程ID、运行状态等。

  • statm:这个文件提供了与进程内存使用量相关的信息,包括进程的总内存、共享内存、库内存、堆内存等。

  • status:这个文件提供了有关进程的多种信息,包括进程状态、内存使用、文件描述符等。

  • syscall:这个目录包含与进程相关的系统调用信息,可以用于跟踪和分析进程的系统调用。

  • task:这个目录包含了进程的所有线程(task)的信息。

  • timens_offsets:这个文件提供了与进程关联的时间命名空间偏移量的信息,用于跟踪进程的时间命名空间变化。

  • timers:这个目录包含了与进程相关的定时器的信息,如定时器ID、时间值等。

  • timerslack_ns:这个文件包含了与进程的定时器松弛值(timerslack)有关的信息,用于调整进程的定时行为。

  • uid_map:这个文件用于表示进程的实际用户ID(UID)与其用户命名空间中的UID之间的映射关系。

  • wchan:是一个用于描绘一个进程在等待什么的内核函数指针。它表示了进程当前正在等待的内核函数或系统调用。可用于调试和分析进程的等待状态。

   这些文件和目录提供了关于特定进程的多种信息,如进程状态、资源使用情况、环境变量等,通常被用于性能调优、调试以及资源管理方面,对于普通用户来说可能并不经常需要直接操作这些文件。通过读取这些文件,可以了解并监视系统中各个进程的情况。请注意,有些文件是符号链接,需要使用readlinkls -l等命令来获取其指向的真实路径。

知识补充:
   命名空间(Namespace)在Linux系统中是一种用于隔离系统资源的机制。它允许在同一台物理机上创建多个隔离的环境,每个环境可以拥有自己独立的资源实例,例如进程ID、挂载点、网络、用户等。这种隔离使得不同的进程能够在同一系统上运行,而彼此之间互不干扰。

在Linux中,有多种类型的命名空间,包括但不限于以下几种:

  1. PID 命名空间(PID Namespace):使得进程拥有自己独立的进程ID空间,进程在不同的PID命名空间中可以拥有相同的PID而不会相互影响。

  2. 挂载命名空间(Mount Namespace):使得进程拥有独立的文件系统挂载点,不同的挂载命名空间中可以有不同的文件系统视图。

  3. 网络命名空间(Network Namespace):允许每个命名空间中拥有独立的网络设备、IP地址等网络资源,实现网络隔离。

  4. IPC 命名空间(IPC Namespace):用于隔离进程间通信资源,如消息队列和共享内存等。

  5. UTS 命名空间(UTS Namespace):用于隔离系统标识,如主机名等。

  6. 用户命名空间(User Namespace):允许分配不同的用户和组ID给进程,从而实现用户隔离。

   通过使用命名空间,容器技术得以实现,并且不同的容器可以在相互隔离的环境中运行,从而实现更高效的资源利用和更好的安全性。

二、通过Linux API获取当前进程或线程的资源使用情况

  要获取当前进程或线程的资源使用情况,可以使用Linux提供的一些系统调用或API。以下是一些常用的方法:

1、getrusage

   getrusage 是一个用于获取进程或线程的资源使用情况的系统调用函数,在 Linux 系统中的头文件 <sys/resource.h> 中定义。

#include <sys/time.h>
#include <sys/resource.h>

int getrusage(int who, struct rusage *usage);

参数who用于指定获取资源使用情况的对象,包括以下两个选项:

  • RUSAGE_SELF: 获取当前进程的资源使用情况。
  • RUSAGE_CHILDREN: 获取当前进程创建的所有子进程的资源使用情况的汇总信息。

参数 usage 是一个指向 struct rusage 结构体的指针,用于存储获取到的资源使用情况信息。

//struct rusage 结构体包含了一系列字段,用于表示不同类型的资源使用情况
struct rusage {
    struct timeval ru_utime; /* user CPU time used */
    struct timeval ru_stime; /* system CPU time used */
    long   ru_maxrss;        /* maximum resident set size */
    long   ru_ixrss;         /* integral shared memory size */
    long   ru_idrss;         /* integral unshared data size */
    long   ru_isrss;         /* integral unshared stack size */
    long   ru_minflt;        /* page reclaims (soft page faults) */
    long   ru_majflt;        /* page faults (hard page faults) */
    long   ru_nswap;         /* swaps */
    long   ru_inblock;       /* block input operations */
    long   ru_oublock;       /* block output operations */
    long   ru_msgsnd;        /* IPC messages sent */
    long   ru_msgrcv;        /* IPC messages received */
    long   ru_nsignals;      /* signals received */
    long   ru_nvcsw;         /* voluntary context switches */
    long   ru_nivcsw;        /* involuntary context switches */
};
  • ru_utime:用户级别的 CPU 时间(执行用户程序的时间)。
  • ru_stime:系统级别的 CPU 时间(执行系统调用的时间)。
  • ru_maxrss:进程最大的常驻内存大小(以 KB 为单位)。
  • ru_ixrss:进程的共享内存大小。
  • ru_idrss:进程的非共享数据段的大小。
  • ru_isrss:进程的栈大小。
  • ru_minflt:产生的次缺页错误(对不存在的内存页面发生的访问,需要从硬盘加载)。
  • ru_majflt:产生的主缺页错误(必须从硬盘加载数据)。
  • ru_nswap:发生的交换次数(从内存到磁盘或反之)。
  • ru_inblock:从块设备读取的次数。
  • ru_oublock:向块设备写入的次数。
  • ru_msgsnd:发送的消息数。
  • ru_msgrcv:接收的消息数。
  • ru_nsignals:发出的信号数。
  • ru_nvcsw:从等待状态唤醒的上下文切换次数(通过虚拟终端 I/O、文件系统路径名查找、等待 CPU 时间等方式)。
  • ru_nivcsw:无法满足进程需求而导致的上下文切换次数。

   这些资源使用情况信息对于进程性能分析和系统监控非常有用。getrusage 函数返回的资源使用情况是关于当前进程或线程的信息。要获取其他进程的资源使用情况,需要使用相应的进程相关的系统调用(如 wait4),并将返回的 rusage 结构体作为参数传递给 wait4

   wait4 是一个用于等待子进程结束并获取其状态信息的系统调用函数。在 Linux 系统中的头文件 <sys/wait.h> 中定义。wait4 函数的原型为:

pid_t wait4(pid_t pid, int *status, int options, struct rusage *rusage);

其中参数含义如下:

  • pid:指定要等待的子进程的 ID。传入 -1 表示等待任意子进程结束。
  • status:用于获取子进程的退出状态信息。
  • options:用于指定等待的选项,包括一些控制子进程状态获取行为的选项。
  • rusage:用于获取子进程的资源使用情况信息,即上一条回答中提到的 struct rusage 结构体。

   wait4 函数会阻塞父进程,直到指定的子进程结束。当子进程结束后,父进程将获得子进程的退出状态信息存储在 status 中,并且如果传入了 rusage 参数,则会获取子进程的资源使用情况信息。

   通常情况下,wait4 函数与 fork 函数结合使用,父进程通过 fork 创建子进程,然后通过 wait4 等待子进程结束,并获取其状态信息。这样可以实现父子进程之间的同步和协作。

#include <sys/resource.h>

int main() {
    struct rusage usage;

    getrusage(RUSAGE_SELF, &usage);

    // 打印CPU时间
    printf("CPU时间: %ld.%06ld 秒\n", usage.ru_utime.tv_sec, usage.ru_utime.tv_usec);

    // 打印最大使用的内存
    printf("最大内存使用量: %ld 字节\n", usage.ru_maxrss);

    // 其他资源使用情况,可以在usage结构体中查看
    // ...

    return 0;
}

2、sysinfo

  sysinfo 是一个用于获取系统信息的系统调用函数,在 Linux 系统中的头文件 <sys/sysinfo.h> 中定义。函数原型如下:

int sysinfo(struct sysinfo *info);

参数 info 是一个指向 struct sysinfo 结构体的指针,用于存储获取到的系统信息。

//Since Linux 2.3.23 (i386) and Linux 2.3.48 (all architectures) the structure is:
struct sysinfo {
    long uptime;             /* Seconds since boot */
    unsigned long loads[3];  /* 1, 5, and 15 minute load averages */
    unsigned long totalram;  /* Total usable main memory size */
    unsigned long freeram;   /* Available memory size */
    unsigned long sharedram; /* Amount of shared memory */
    unsigned long bufferram; /* Memory used by buffers */
    unsigned long totalswap; /* Total swap space size */
    unsigned long freeswap;  /* Swap space still available */
    unsigned short procs;    /* Number of current processes */
    unsigned long totalhigh; /* Total high memory size */
    unsigned long freehigh;  /* Available high memory size */
    unsigned int mem_unit;   /* Memory unit size in bytes */
    char _f[20-2*sizeof(long)-sizeof(int)]; /* Padding to 64 bytes */
};
  • long uptime:系统已经运行的时间(以秒为单位)。
  • unsigned long loads[3]:系统的平均负载值,分别代表过去1分钟、5分钟和15分钟的平均负载。这些值是无符号长整型数,表示了负载值乘以 2^16 的结果。
  • unsigned long totalram:系统总共的物理内存大小(以字节为单位)。
  • unsigned long freeram:系统可用的物理内存大小(以字节为单位)。
  • unsigned long sharedram:被共享的物理内存大小(以字节为单位)。
  • unsigned long bufferram:被用作缓冲区的物理内存大小(以字节为单位)。
  • unsigned long totalswap:交换空间的总大小(以字节为单位)。
  • unsigned long freeswap:可用的交换空间大小(以字节为单位)。
  • unsigned short procs:当前进程数量。
  • unsigned long totalhigh:可用的高位内存大小(以字节为单位)。
  • unsigned long freehigh:空闲的高位内存大小(以字节为单位)。
  • unsigned int mem_unit:内存单元大小(以字节为单位)。

sysinfo 函数的返回值为 0 表示成功,-1 表示失败,并且可以通过 errno 来获取具体错误信息。

#include <sys/sysinfo.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
    struct sysinfo info;

    sysinfo(&info);

    // 打印总内存大小
    printf("总内存大小: %ld 字节\n", info.totalram * info.mem_unit);

    // 打印已使用内存大小
    printf("已使用内存大小: %ld 字节\n", (info.totalram - info.freeram) * info.mem_unit);

    // 其他资源使用情况,可以在info结构体中查看
    // ...

    return 0;
}

struct sysinfo 结构体中,loads 数组中的数值表示了负载值乘以 2^16 的结果,这是因为 sysinfo 结构体中的 loads 数组使用了 unsigned long 类型。

在 Linux 内核中,负载值是以固定点数的格式表示的,使用了定点数表示方式来保留小数部分。在这里,每个负载值都被乘以了 2^16(65536),以便将小数部分转换为整数。

这种表示方式的好处在于,它可以比较精确地表示系统的负载情况,同时又不需要使用浮点数来表示,因为浮点数的运算会耗费相对更多的 CPU 时间。通过将负载值乘以一个固定的倍数(2^16),可以在不牺牲太多精度的情况下,使用整数进行表示和计算,这样会更高效。

当我们从 struct sysinfo 结构体中获取负载值时,需要将其除以 2^16 来得到真实的负载值。例如,在上面的示例代码中,打印负载值时并没有除以 2^16,因此实际的负载值应当是 info.loads[x] / 65536 才能得到系统的实际负载情况。

总之,通过将负载值乘以 2^16 来表示,Linux 内核可以在保持较高精度的同时,使用更高效的整数表示方式,用于存储和计算系统的负载情况。

3、times

times 函数是一个用于获取进程和子进程的系统和用户 CPU 时间的系统调用,其原型如下:

#include <sys/times.h>

clock_t times(struct tms *buf);
  • buf 是一个指向 tms 结构的指针,它用来存储 CPU 时间的信息。

struct tms 结构包含了进程和子进程的 CPU 时间信息,其定义如下:

struct tms {
    clock_t tms_utime;  // 进程在用户态花费的时间
    clock_t tms_stime;  // 进程在内核态花费的时间
    clock_t tms_cutime; // 所有已终止子进程在用户态花费的时间
    clock_t tms_cstime; // 所有已终止子进程在内核态花费的时间
};
  • tms_utime 表示进程在用户态花费的 CPU 时间。
  • tms_stime 表示进程在内核态花费的 CPU 时间。
  • tms_cutime 表示所有已终止子进程在用户态花费的 CPU 时间。
  • tms_cstime 表示所有已终止子进程在内核态花费的 CPU 时间。

示例代码如下所示,演示了如何使用 times 函数来获取进程的 CPU 时间信息:

#include <stdio.h>
#include <sys/times.h>
#include <time.h>
#include <unistd.h>

int main() {
    struct tms tms_buf;
    clock_t start, end;

    // 获取起始时间
    start = times(&tms_buf);
    printf("Starting time: %ld\n", start);

    // 模拟一些工作
    for (int i = 0; i < 100000000; ++i) {
        // do something
    }

    // 获取结束时间
    end = times(&tms_buf);
    printf("Ending time: %ld\n", end);

    // 计算 CPU 时间消耗
    clock_t user_time = tms_buf.tms_utime;
    clock_t sys_time = tms_buf.tms_stime;
    printf("User CPU time: %ld\n", user_time);
    printf("System CPU time: %ld\n", sys_time);

    return 0;
}

  这个示例代码中,我们首先调用 times 函数获取了进程的 CPU 时间信息,并输出了起始时间。然后进行了一些模拟工作,之后再次调用 times 函数获取了结束时间,最后计算了用户态和内核态的 CPU 时间消耗。

  欢迎大家指导和交流!如果我有任何错误或遗漏,请立即指正,我愿意学习改进。期待与大家一起进步!

Logo

更多推荐