1.看一段程序

这个程序调用了一个函数getpid(),用于获取当前进程的ID号。

#include

#include

int main()

{

int id;

id=getpid();

printf("%d",id);

reurn 0;

}

2. getpid()是什么?在哪里声明?在哪里实现?

(1)getpid()是一个POSIX标准的API,用于用户程序从用户态进入到内核态,在内核态读取当前进程的(tack_struct)的Pid,然后

返回给用户态的程序。

(2)getpid()函数在/usr/include/unistd.h里面声明。你可以试着找到这个声明。

(3)getpid()函数在glibc函数库里面实现。gcc 编译程序时,会到glibc函数库里面寻找getpid()的实现代码,然后编译。

[是所有API都要进入内核态吗?NO.比如字符串函数strcpy()就不会进入内核态。要请求操作系统服务的API才进入内核态。]

3. getpid()是怎么使cpu进入内核态的?getpid()往内核传递了什么信息?从内核获得了什么信息?

(1)getpid()是通过软中断的方式使程序进入内核态的。getpid()编译成汇编代码时,里面会有条这样的指令:int 0x80,当执行到这条

指令时,getpid()的工作暂停,内核开始工作。

(2)getpid()的功能是返回当前进程的ID,它本身是不能完成的,必须请求操作系统服务,让操作系统把当前进程的ID告诉给getpid().

操作系统能够提供很多服务,那么,getpid()就得告诉操作系统提供什么服务,所以,getpid()给内核一个参数__NR_getpid(系统调用号),

把__NR_getpid这个服务号(系统调用号),放在了一个寄存器eax里面。内核就从eax这个寄存器里面取出值,就明白了:哦!原来getpid()是让

我提供__NR_getpid这个服务啊。[当API请求服务时,可能会告诉内核多个参数,这时就要把这些参数放在:

ebx --- 置第一个参数

ecx --- 置第二个参数

edx --- 置第三个参数

esi --- 置第四个参数

edi --- 置第五个参数

ebp --- 置第六个参数 (系统调用最大参数个数为6)]

(3)getpid()自然从内核得到当前进程的ID号,因为内核已经把ID号放在了getpid()的堆栈里面。

getpid()是在glibc里面实现的。实现过程大概入下:

getpid()

{

往exa寄存器存入__NR_getpid;

int 0x80,产生软中断。

---------

内核执行

---------

从堆栈里面读取ID返回。

}不要到glibc库里面去看,只会浪费时间,因为很难明白。

4. 内核是如何为getpid()提供服务的?具体过程是什么?

int 0x80 ; 进入软中断,cpu进入高级特权模式

CPU到地址(中断描述符表IDT地址 + 0x80),取出指令并执行。执行结果,跳到标号system_call处执行;

system_call:

保存现场;

读取exa寄存器的值__NR_getpid;

读取数组 sys_call_table[__NR_getpid]的值;这个值就是__NR_getpid()服  务程序的地址;

跳到__NR_getpid()服务程序的地址,执行。即,执行内核函数,sys_getpid();

[sys_getpid()读取用户进程数据结构task_struct的成员变量pid,把用户进程的pid放在了eax寄存器中。]

把eax寄存器的值复制到用户态”eax寄存器栈单元“里面。

恢复现场,返回到用户态。

5. getpid()在eax寄存器栈单元里面取出pid,给用户程序。一切ok!

后记:网上任何人写的文档都不如,Source Insight + linux内核源代码。内核的学习是不能故意去学习的,只能是你在高层想知道内核是怎么工作的时候才去看看代码。下一篇博客将是有关Bootloder方面的。

参考博客:

关于gcc,libc等相关概念的理解

http://blog.openrays.org/blog.php?do=showone&tid=422

绕过 libc 直接使用系统调用系统调用

系统调用

使用通用接口

linux内核标准教程

http://blog.csdn.net/sylin/archive/2006/07/20/949420.aspx

被glibc忽悠了

系统调用过程

Logo

更多推荐