linux中的可执行二进制文件执行流程

1,常见名称缩写及概念。

缩写说明
ELF可执行文件和链接格式,在计算领域,可执行和可链接格式是可执行文件、目标代码、共享库和核心转储的通用标准文件格式。1 2
bssBSS段属于静态内存分配。指用来存放程序中未初始化的全局变量和未初始化的局部静态变量。未初始化的全局变量和未初始化的局部静态变量默认值是0,本来这些变量也可以放到data段的,但是因为他们都是0,所以为他们在data段分配空间并且存放数据0是没有必要的。
INTERP对于动态二进制文件,它包含运行时链接器 ld.so 的完整路径名。该段与 ELF 链接视图中的 .interp 段相同。

2,可执行文件执行流程分析

2.1,查看Linux内核在编译的时候是否设置成支持ELF格式的文件

cat /lib/modules/`uname -r`/build/.config | grep  CONFIG_BINFMT_ELF
或者
zcat /proc/config.gz | grep CONFIG_BINFMT_ELF

2.2,bash执行可执行程序

在shell上面编辑文件,vim hello.c,并输入如下内容:

# include<stdio.h>

int main()
{
	printf("\nhello gzhuflyer\n\n");
	return 0;
}

执行gcc hello.c -o hello生成可执行文件 hello。并在当前界面上执行 echo $$ 获取当前shell的进程号,打开另外一个shell界面,执行 strace -s 512 -p 8412 -f -o strace.log。数字 8412:为执行echo $$ 获取到的进程号。
strace.log为strace命令获取到的系统调用日志
strace.log日志
从日志中可以看到,shell实际上是调用 clone() 和 execve()两个系统调用,然后执行 ./hello可执行程序。

2.3,execve函数相关调用

当shell使用execve开始执行一个可执行程序的时候,Linux内核会进行如下相关函数调用。3 4
1,sys_execve 函数会调用 do_execve 函数在用户空间处理execve系统调用。
2,do_execve 函数会调用search_binary_handler函数打开可执行文件,并做一些准备工作。
3,search_binary_handler函数获取可执行文件的二进制执行类型,并返回一个响应句柄,当执行上文中的hello可执行程序时,讲返回 load_elf_binary函数。
4,load_elf_binary 函数加载用户可执行文件到内存,为程序申请所需要的内存,调用函数padzero将程序 bss段清零。
同时也检查可执行程序是否包含 INTERP 段。
5,如果可执行程序需要链接其他动态库,在编译成可执行程序的时候,编译器会为可执行程序创建 INTERP 段,并包含 INTERP 段的解释器程序路径,通常该解释器为 ld.so。
可以通过命令 readelf -p .interp hello 查看该解释器的路径。一般为 /lib64/ld-linux-x86-64.so.2。
6,当可执行程序包含 INNTERP 段时,load_elf_binaray 将调用 load_elf_interp 加载解释器。
7,load_elf_binary函数在最后会调用 start_thread(在 arch/x86/kernel/process_64.c)并将CPU使用权给到解释器或者用户程序。

2.4, ld.so 作用

在2.3中第5步,解释器ld.so会进行一系列操作,下面分析ld.so进行做了那些工作
1,分析用户可执行程序中 DYNAMIC 段,并查找程序依赖的库。
2,定位并加载依赖库,并分析依赖库中 DYNAMIC 段,从而确定这些依赖库是否还需依赖其他库。
3,进行重定向操作并绑定所需要的依赖库。
4,最后将控制权交给可执行程序。

3, Linux X86 程序在执行main函数前前后后

3.1,程序执行与函数调用

编写程序查看在main函数之前和程序退出之后有那些函数会被执行到。

#include <stdio.h>
#include <stdlib.h>

void preinit(int argc, char **argv, char **envp) {
	printf("%s\n", __FUNCTION__);
}

void init(int argc, char **argv, char **envp) {
	printf("%s\n", __FUNCTION__);
}

void fini() {
	printf("%s\n", __FUNCTION__);
}

__attribute__((section(".init_array"))) typeof(init) *__init = init;
__attribute__((section(".preinit_array"))) typeof(preinit) *__preinit = preinit;
__attribute__((section(".fini_array"))) typeof(fini) *__fini = fini;

void  __attribute__ ((constructor)) constructor() {
	printf("%s\n", __FUNCTION__);
}

void __attribute__ ((destructor)) destructor() {
	printf("%s\n", __FUNCTION__);
}

void my_atexit() {
	printf("%s\n", __FUNCTION__);
}

void my_atexit2() {
	printf("%s\n", __FUNCTION__);
}

int main() {
	atexit(my_atexit);
	atexit(my_atexit2);
}

下面是程序的执行结果
在这里插入图片描述
从上图中打印信息可以直观的看到main函数执行前后调用的函数。
下图是gdb设置端点并运行程序,也同样能查看到main函数执行前后流程。
在这里插入图片描述

参考文章链接


  1. https://en.wikipedia.org/wiki/Executable_and_Linkable_Format ↩︎

  2. http://manpages.courier-mta.org/htmlman5/elf.5.html ↩︎

  3. https://asm.sourceforge.net/articles/startup.html ↩︎

  4. http://s.eresi-project.org/inc/articles/elf-rtld.txt ↩︎

Logo

更多推荐