编译过程指的是gcc对一个程序进行编译时完成的内部处理和步骤。编译程序时会自动完成预处理(Preprocessing)、编译(Compilation)、汇编(Assembly)和链接(Linking)4 个步骤。本节将讲解如何对这 4 个步骤进行控制。
gcc把一个程序的源文件编译成一个可执行文件,中间包括很多复杂的过程。可以用图 4.2来表示编译中 4 个步骤的作用和关系。
图4.2 gcc将源文件编译成可执行文件的过程
在编译过程中,每个操作都完成了不同的功能。编译过程的功能如下所示。
● 预处理:在预处理阶段,主要完成对源代码中的预编译语句(如宏定义define等)和文件包含进行处理。需要完成的工作是对预编译指令进行替换,把包含文件放置到需要编译的文件中。完成这些工作后,会生成一个非常完整的C程序源文件。
● 编译:gcc对预处理以后的文件进行编译,生成以.s为后缀的汇编语言文件。该汇编语言文件是编译源代码得到的汇编语言代码,接下来交给汇编过程进行处理。汇编语言是一种比C语言更低级的语言,直接面对硬盘进行操作。程序需要编译成汇编指令以后再编译成机器代码。
● 汇编:汇编过程是处理汇编语言的阶段,主要调用汇编处理程序来完成将汇编语言汇编成二进制机器代码的过程。通常来说,汇编过程是将.s的汇编语言代码文件汇编为.o的目标文件的过程。所生成的目标文件作为下一步链接过程的输入文件。
● 链接:链接过程就是将多个汇编生成的目标文件以及引用的库文件进行模块链接,生成一个完整的可执行文件。在链接阶段,所有的目标文件被安排在可执行程序中的适当位置。同时,该程序所调用的库函数也从各自所在的函数库中链接到程序中。经过这个过程以后,生成的文件就是可执行的程序。
-E参数可以完成程序的预处理工作而不进行其他的编译工作。下面的命令,可以对本章编写的程序进行预处理,然后保存到a.cxx文件中。
输入下面的命令,查看经过预处理以后的a.cxx文件。
可以发现,a.cxx文件约有 800 行代码。程序中默认包含的头文件已经被展开写到这个文件中。显示的a.cxx文件前几行代码如下所示。可见,在程序编译时,需要调用非常多的头文件和系统库函数。
-S参数可以控制gcc在编译C程序时只生成相应的汇编程序文件,而不继续执行后面的编译。下面的命令,可以将本章中的C程序编译成一个汇编程序。
输入下面的命令,查看汇编文件a.s。可以发现,这个文件一共有 60 行代码,这些代码是这个程序的汇编指令。部分汇编程序代码如下所示。
-c参数可以使得gcc在编译程序时只生成目录代码而不生成可执行程序。输入下面的命令,将本章中的程序编译成目录代码。
输入下面的命令,查看这个目录代码的信息。
显示文件a.o的结果如下所示,显示文件a.o是一个可重定位的目标代码文件。
gcc可以把上一步骤生成的目录代码文件链接生成一个可执行文件。在终端中输入下面的命令。
这时生成一个可执行文件aa.out。输入下面的命令查看这个文件的信息。
显示的结果如下所示,表明这个文件是可在Linux系统下运行的程序文件。