概述
链接(linking)是将各种代码和数据片段搜集并组合成为一个单一文件的过程,这个文件可被加载(复制)到内存并执行。
- 链接可以执行于编译时(compile time),也就是在源代码被翻译成机器代码时;
- 也可以执行于加载时(load time),也就是在程序被加载(loader)加载到内存并执行时;
- 甚至于执行于运行时(run time),也就是由应用程序来执行。
在早期的计算机系统中,链接是手动执行的。在现代系统中,链接是由连接器(linker)的程序自动执行的。
连接器在软件开发中扮演一个重要的角色,因为它们使得分离编译(separate compilation)成为可能。
我们不用将一个大型的应用程序组织为一个巨大的源文件,而是可以吧它分解成为更小、更好管理的模块,可以独立地修改和编译这些模块。当我们改变这些模块中的一个时,只需简单地重新编译它,并重新连接应用,而不必重新编译其它文件。
为什么需要连接的知识?
- 理解连接器将帮助构造大型程序
- 构建大型程序经常会遇到缺少模块、缺少库或者不兼容的库版本引起的连接器错误。
- 除非你理解连接器是如何解析引用、什么是库以及连接器是如何使用库来解析引用的,菲欧这类错误将令你感到迷惑和挫败
帮助避免一些危险的编译错误
- Linux连接器解析符号引用时所做的决定可以不动声色地影响你程序的正确性。
帮助理解语言的作用域规则是如何实现的
- 全局和局部变量之间的区别是什么?当你定义一个具有static属性的变量或者函数时,实际到底意味着什么?
理解其它重要的系统概念
- 连接器产生的可执行目标文件在重要的系统功能中扮演着关键角色,比如加载和运行程序、虚拟内存、分页、内存映射。
将使你能够利用共享库
- 随着共享库和动态链接在现代操作系统中重要性的日益增强,链接成为一个复杂的过程。比如,许多软件产品在运行时使用共享库来升级压缩包装的(shrink-wrapped)二级制程序。还有,大多数Web服务器都依赖于共享库的动态链接来提供内容。
这一章提供了关于链接各方面的全面讨论,从传统静态链接到加载时的共享库的动态链接,以及到运行时的共享库的动态链接。
无论什么样的操作系统,ISA或者目标文件格式、基本的链接概念是通用的。
编译器驱动程序
静态链接
静态连接器(static linker)以一组可重定位目标文件和命令行参数作为输入,生成一个完全链接的、可以加载和运行的可执行目标文件作为输出。
输入的可重定位目标文件由各种不同的代码和数据结节(section)组成,每一节都是一个连续的字节序列。指令在一节中,初始化了的全局变量在另一节中,而未初始化的变量又在另外一节中。
为了构造可执行文件,链接器必须完成两个主要任务。
符号解析(symbol resolution)。目标文件定义和引用符号,每个符号对应于一个函数、一个全局变量或一个静态变量(即C语言中任何以static属性声明的变量)。
- 符号解析的目的是将每个符号引用正好和一个符号定义关联起来。
- 重定位(relocation)。编译器和汇编器生成从地址0开始的代码和数据节。链接器通过把每个符号定义与一个内存位置关联起来,从而重定位这些节,然后修改所有对这些符号的引用,使得它们指向这个内存位置。链接器使用汇编器产生的重定位条目(relocation entry)的详细指令,不加甄别地执行这样的重定位。
要记住关于链接器的一些基本事实:
- 目标文件纯粹是字节块的集合
- 这些块中,有些包含程序代码,有些包含程序数据,而其他的则包含引导链接器和加载器的数据结构。
- 链接器将这些块连接起来,确定被链接块的运行时位置,并且修改代码和数据块中的各种位置。
目标文件
目标文件有三种形似:
可重定向目标文件
- 包含二进制代码和数据,其形式可以在编译时与其他可重定位目标文件合并起来,创建一个可执行目标文件。
可执行目标文件
- 包含二进制代码和数据,其形式可以被直接复制到内存并执行。
共享目标文件
- 一种特殊类型的可重定位目标文件,可以在加载或者运行时被动态地加载进内存并连接。
编译器和汇编器生成可重定位目标文件(包括共享目标文件)。
连接器生成可执行目标文件。
从技术上来说,一个目标模块(object module)就是一个字节序列,而一个目标文件(object file)就是一个以文件形式存放在磁盘中的目标模块。