Linux学习之zImage内核镜像解压过程详解---说明为什么解压地址可以是zImage载入地址

转自：http://www.embedu.org/Column/Column13.htm作者：刘洪涛，华清远见嵌入式培训中心讲师。在华清远见教学过程中，发现很多学员对内核镜像解压过程比较感兴趣，但网上相关的文章往往不能把关键问题讲清楚，所以写了这篇文章。本文以linux-2.6.14内核在S3C2410平台上运行为例，讲解内核的解压过程。内核编译完成后会生成zImage内核镜像文件。关于boo

dumb_man

3504人浏览 · 2017-11-20 17:50:53

dumb_man · 2017-11-20 17:50:53 发布

转自：http://www.embedu.org/Column/Column13.htm

作者：刘洪涛，华清远见嵌入式培训中心讲师。

在华清远见教学过程中，发现很多学员对内核镜像解压过程比较感兴趣，但网上相关的文章往往不能把关键问题讲清楚，所以写了这篇文章。

本文以linux-2.6.14内核在S3C2410平台上运行为例，讲解内核的解压过程。

内核编译完成后会生成zImage内核镜像文件。关于bootloader加载zImage到内核，并且跳转到zImage开始地址运行zImage的过程，相信大家都很容易理解。但对于zImage是如何解压的过程，就不是那么好理解了。本文将结合部分关键代码，讲解zImage的解压过程。

先看看zImage的组成吧。在内核编译完成后会在arch/arm/boot/下生成zImage。

在arch/armboot/Makefile中：

$(obj)/zImage: $(obj)/compressed/vmlinux FORCE

$(call if_changed,objcopy)

由此可见，zImage的是elf格式的arch/arm/boot/compressed/vmlinux二进制化得到的

在arch/armboot/compressed/Makefile中：

$(obj)/vmlinux: $(obj)/vmlinux.lds $(obj)/$(HEAD) $(obj)/piggy.o \

$(addprefix $(obj)/, $(OBJS)) FORCE

$(call if_changed,ld)

$(obj)/piggy.gz: $(obj)/../Image FORCE

$(call if_changed,gzip)

$(obj)/piggy.o: $(obj)/piggy.gz FORCE

其中Image是由内核顶层目录下的vmlinux二进制化后得到的。注意：arch/arm/boot/compressed/vmlinux是位置无关的，这个有助于理解后面的代码。，链接选项中有个 –fpic参数：

EXTRA_CFLAGS := -fpic

总结一下zImage的组成，它是由一个压缩后的内核piggy.o，连接上一段初始化及解压功能的代码（head.o misc.o）,组成的。

下面就要看内核的启动了，那么内核是从什么地方开始运行的呢？这个当然要看lds文件啦。zImage的生成经历了两次大的链接过程：一次是顶层vmlinux的生成，由arch/arm/boot/vmlinux.lds（这个lds文件是由arch/arm/kernel/vmlinux.lds.S生成的）决定；另一次是arch/arm/boot/compressed/vmlinux的生成，是由arch/arm/boot/compressed/vmlinux.lds（这个lds文件是由arch/arm/boot/compressed/vmlinux.lds.in生成的）决定。zImage的入口点应该由arch/arm/boot/compressed/vmlinux.lds决定。从中可以看出入口点为‘_start’

OUTPUT_ARCH(arm)

ENTRY(_start)

SECTIONS

{

. = 0;

_text = .;

.text : {

_start = .;

*(.start)

*(.text)

……

}

在arch/arm/boot/compressed/head.S中找到入口点。

看看head.S会做些什么样的工作：

? 对于各种Arm CPU的DEBUG输出设定，通过定义宏来统一操作；

?设置kernel开始和结束地址，保存architecture ID；

? 如果在ARM2以上的CPU中，用的是普通用户模式，则升到超级用户模式，然后关中断

? 分析LC0结构delta offset，判断是否需要重载内核地址(r0存入偏移量，判断r0是否为零)。

?需要重载内核地址，将r0的偏移量加到BSS region和GOT table中的每一项。

对于位置无关的代码，程序是通过GOT表访问全局数据目标的，也就是说GOT表中中记录的是全局数据目标的绝对地址，所以其中的每一项也需要重载。

? 清空bss堆栈空间r2－r3

?建立C程序运行需要的缓存

?这时r2是缓存的结束地址，r4是kernel的最后执行地址，r5是kernel境象文件的开始地址

?用文件misc.c的函数decompress_kernel()，解压内核于缓存结束的地方(r2地址之后)。

可能大家看了上面的文字描述还是不清楚解压的动态过程。还是先用图表的方式描述下代码的搬运解压过程。然后再针对中间的一些关键过程阐述。

假定zImage在内存中的初始地址为0x30008000(这个地址由bootloader决定，位置不固定)

1、初始状态

.text	0x30008000开始，包含piggydata段（即压缩的内核段）
.got	?
.data	?
.bss	?
.stack	4K大小

2、head.S调用misc.c中的decompress_kernel刚解压完内核后

.text	0x30008000开始，包含piggydata段（即压缩的内核段）
.got	?
.data	?
.bss	?
.stack	4K大小
解压函数所需缓冲区	64K大小
解压后的内核代码	小于4M

3、此时会将head.S中的部分代码重定位

.text	0x30008000开始，包含piggydata段（即压缩的内核段）
.got	?
.data	?
.bss	?
.stack	4K大小
解压函数所需缓冲区	64K大小
解压后的内核代码	小于4M
head.S中的部分重定位代码代码	reloc_start至reloc_end

4、跳转到重定位后的reloc_start处，由reloc_start至reloc_end的代码复制解压后的内核代码到0x30008000处，并调用call_kernel跳转到0x30008000处执行。

解压后的内核

0x30008000开始

在通过head.S了解了动态过程后，大家可能会有几个问题：

问题1：zImage是如何知道自己最后的运行地址是0x30008000的？

问题2：调用decompress_kernel函数时，其4个参数是什么值及物理含义？

问题3：解压函数是如何确定代码中压缩内核位置的？

先回答第1个问题

这个地址的确定和Makefile和链接脚本有关，在arch/arm/Makefile文件中的

textaddr-y := 0xC0008000 这个是内核启动的虚拟地址

TEXTADDR := $(textaddr-y)

在arch/arm/mach-s3c2410/Makefile.boot中

zreladdr-y := 0x30008000 这个就是zImage的运行地址了

在arch/arm/boot/Makefile文件中

ZRELADDR := $(zreladdr-y)

在arch/arm/boot/compressed/Makefile文件中

zreladdr=$(ZRELADDR)

在arch/arm/boot/compressed/Makefile中有

.word zreladdr @ r4

内核就是用这种方式让代码知道最终运行的位置的

接下来再回答第2个问题

decompress_kernel(ulg output_start, ulg free_mem_ptr_p, ulg free_mem_ptr_end_p,

int arch_id)

l output_start：指解压后内核输出的起始位置，此时它的值参考上面的图表，紧接在解压缓冲区后；

l free_mem_ptr_p：解压函数需要的内存缓冲开始地址；

l ulg free_mem_ptr_end_p：解压函数需要的内存缓冲结束地址，共64K；

l arch_id ：architecture ID，对于SMDK2410这个值为193；

最后回答第3个问题

首先看看piggy.o是如何生成的，在arch/arm/boot/compressed/Makefie中

$(obj)/piggy.o: $(obj)/piggy.gz FORCE

Piggy.o是由piggy.S生成的，咱们看看piggy.S的内容：

.section .piggydata,#alloc

.globl input_da ta

input_da ta:

.incbin "arch/arm/boot/compressed/piggy.gz"

.globl input_da ta_end

input_da ta_end:

再看看misc.c中decompress_kernel函数吧，它将调用gunzip()解压内核。gunzip()在lib/inflate.c中定义，它将调用NEXTBYTE()，进而调用get_byte()来获取压缩内核代码。

在misc.c中

#define get_byte() (inptr < insize ? inbuf[inptr++] : fill_inbuf())

查看fill_inbuf函数

int fill_inbuf(void)

{

if (insize != 0)

error("ran out of input da ta");

inbuf = input_da ta;

insize = &input_da ta_end[0] - &input_da ta[0];

inptr = 1;

return inbuf[0];

}

发现什么没？这里的input_da ta不正是piggy.S里的input_da ta吗？这个时候应该明白内核是怎样确定piggy.gz在zImage中的位置了吧。

时间关系，可能叙述的不够详细，大家可以集合内核代码和网上的其它相关文章，理解启动解压过程。

Linux

更多推荐

网卡速率和双工模式的配置

http://linux.chinaitlab.com/system/792187.html1、mii-tool 配置网络设备协商方式的工具； 1.1 mii-tool 介绍； mii-tool - view, manipulate media-independent interface status （mii-tool 是查看，管理介质的网络接口的状态）

Linux

Linux虚拟文件系统之文件系统卸载（sys_umount())

Linux中卸载文件系统由umount系统调用实现，入口函数为sys_umount()。较于文件系统的安装较为简单，下面是具体的实现。1. /*sys_umont系统调用*/2. SYSCALL_DEFINE2(umount, char __user *, name, int, flags)3. {4.struct path path;

Linux

Linux系统下超级终端Minicom的使用方法（例如：连接交换机，路由器等）转http://baike.baidu.com/view/2911642.htm?fr=ala0_1

Linux系统下超级终端Minicom的使用方法 　　Linux下的Minicom的功能与下的超级终端功能相似，适于在通过超级终端对设备的管理以及对嵌入操作系统的升级，现写出Minicom的使用手册： 　　1．启动minicom 　　以root权限登录系统 　　使用命令 　　minicom –s 则minicom启动，屏

Linux

所有评论(0)

查看更多评论

dumb_man

@dahailantian1

已为社区贡献5条内容