技术标签: 计算机系统
链接是将各种代码和数据片段收集并组合成为一个单一文件的过程,这个文件可被加载到内存并执行。
链接器必须完成的两个任务:
三种形式:
可重定位目标文件,包含二进制代码和数据的文件,可与其他可重定位文件合并,生成可执行目标文件。
可执行目标文件,包含二进制代码和数据的文件,可直接复制至内存并执行。
共享目标文件,特殊的可重定位目标文件,可在加载或运行时动态地加载至内存并链接。
编译器和汇编器生成可重定位目标文件,链接器生成可执行目标文件。
典型的ELF可重定位目标文件的格式,如下:
图1 典型的ELF可重定位目标文件
ELF中各节功能及意义:
类型 | 功能及意义 |
---|---|
ELF头 | 以16字节序列开始,描述生成该文件的系统的字的大小和字节顺序 |
.text | 已编译程序的机器代码 |
.rodata | 只读数据 |
.data | 已初始化的全局和静态变量 |
.bas | 未初始化的全局和静态变量 |
.symtab | 存放程序中定义和引用的函数和全局变量的信息的符号表 |
.rel .text | .text节中位置列表,在组合目标文件和其他文件时,需修改这些位置 |
.rel .data | 被模块引用或定义的所有全局变量的重定位信息 |
.debug | 调试符号表,包含程序中定义的局部变量、定义和引用的全局变量以及原始的C源文件 |
.line | 原始C源程序中的行号和.text节中机器指令之间的映射 |
.strtab | 字符串表,包括.symtab和.debug节中的符号表,以及节头部中的节名字 节点部表 |
链接的上下文中,三种不同的符号:
符号表由汇编器构造,.symtab节中包含ELF符号表,符号表包含一个条目的数据,每个条目的格式如下:
typedef struct {
int name; /*字符串表中的字节偏移*/
char type : 4, /*函数或数据 4字节*/
binding : 4; /*本地或全局 4字节*/
char reserved; /*未定义的符号*/
short section; /*节头部表的索引,指定分配到目标文件的某个节*/
long value; /*距定义目标的节的起始位置偏移*/
long size; /*目标的大小*/
} Elf64_Symbol;
链接器解析符号是将每个引用与它输入的可重定位目标文件的符号表中的一个确定的符号定义关联起来。
解析多重定义的全局符号规则
与静态库链接
将所有相关的目标模块打包成一个单独的文件,称为静态库。
相关的函数可以被编译为独立的目标模块,然后封装成一个单独的静态库文件。
链接时,链接器只复制被程序引用的目标模块,从而减少了可执行文件在磁盘和内存中的大小。
静态库使用示例:
#include <stdio.h>
#include "vector.h"
#include "windows.h"
int x[2] = {
1, 2 };
int y[2] = {
3, 4 };
int z[2];
int main() {
addvec(x, y, z, 2);
printf("z=[%d %d]\n", z[0], z[1]);
system("pause");
return 0;
}
void addvec(int*, int*, int*, int);
void multivec(int*, int*, int*, int);
int addcnt = 0;
void multivec(int* x, int* y, int* z, int n) {
int i;
addcnt++;
for (i = 0; i < n; i++)
z[i] = x[i] + y[i];
}
int multicnt = 0;
void addvec(int* x, int* y, int* z, int n) {
int i;
multicnt++;
for (i = 0; i < n; i++)
z[i] = x[i] * y[i];
}
分别执行以下指令,则生成可执行目标文件file。
gcc -c addvec.c multivec.c
ar rcs libvector.a addvec.o multivec.o
gcc -c main.c
gcc -static -o file main.c libvector.a
链接器行为如下图所示:
图2 与静态库链接
链接器如何使用静态库来解析引用
符号解析阶段,链接器从左到右按照命令行上出现的次序来扫描可重定位目标文件和存档文件。
链接器维护一个可重定位目标文件集合 E E E,一个未解析符号集合 U U U,一个在前面输入文件已经定义的符号集 D D D。初始时,各集合全空。
因此,命令行上库和目标文件的次序非常重要。因保证定义一个符号的库在引用这个符号的目标文件之后。
如foo.c调用libx.a中的函数,该库又调用liby.a中的函数,而liby.a有调用libx.a中的函数,则命令行格式为:
gcc foo.c libx.a liby.a libx.a
即libx.a需重复出现,亦可将libx.a和liby.a合并。
重定位就是把程序的逻辑地址空间变换成内存中的实际物理地址空间的过程。
完成符号解析后,代码中的每个符号和一个符号定义完成关联,此时链接器开始重定位。
重定位条目
汇编器生成目标模块时,对数据和代码在内存中的位置、模块引用的外部定义的函数或全局变量的位置均未知。对这些未知的引用都会生成一个重定位条目,用于指导链接器在合并阶段如何修改这个引用。
ELF重定位条目的格式:
typedef struct {
long offset; /*需要被修改的引用的节偏移*/
long type : 32, /*告知链接器如何修改新的引用*/
symbol : 32; /*符号表索引*/
long addend; /*有符号常数,对修改引用的偏移做调整*/
}Elf64_Rela;
两种基本的重定位类型:
重定位符号引用
假设每个节s是一个字节数组,每个重定位条目r是一个类型为Elf64_Rela的结构。
重定位符号引用时,链接器已经为每个节(ADDR(s))和每个符号(ADDR(r.symbol))都选择了运行时的地址。
伪重定位算法:
refptr = s + r.offset;
if (r.type == R_X86_64_PC32) {
refaddr = ADDR(s) + r.offset;
*refptr = (unsigned)(ADDR(r.symbol) + r.addend - refaddr);
}
if (r.type == R_X86_64_32)
*refptr = (unsigned)(ADDR(r.symbol) + r.addend);
重定位如下实例程序的引用:
1 int sum(int* a, int n);
2
3 int array[2] = {
1, 2};
4
5 int main() {
6 int val = sum(array, 2);
7 return val;
8 }
1 int sum(int* a, int n) {
2 int i, s = 0;
3
4 for(i = 0; i < n; i++)
5 s += a[i];
6 }
7 return s;
8 }
main.o的反汇编代码:
// main.o
1 0000000000000000 <main>:
2 0: 48 83 ec 08 sub $0x8, %rsp
3 4: be 02 00 00 00 mov $0x2, %esi
4 9: bf 00 00 00 00 mov $0x0, %edi
5 a: R_X86_64_32 array
6 e: e8 00 00 00 00 callq 13 <main+0x13>
7 f: R_X86_64_PC32 sum-0x4
8 13: 48 83 c4 08 add $0x8, %rsp
9 17: c3 retq
链接器修改从偏移量0xf开始的32位PC相对引用,使程序指向sum入口地址。:
r e f a d d r = A D D R ( s ) + r . o f f s e t = 0 × 4004 d 0 + 0 × f = 0 × 4004 d f \,\,\begin{array}{l} refaddr=\,\,ADDR\left( s \right) \,\,+\,\,r.offset\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\ \ =\,\,0\times 4004d0\,\,+\,\,0\times f\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\ \ =\,\,0\times 4004df\\ \end{array} refaddr=ADDR(s)+r.offset =0×4004d0+0×f =0×4004df
∗ r e f a d d r = ( u n s i g n e d ) ( A D D R ( r . s y m b o l ) + r . a d d e n d − r e f a d d r ) = ( u n s i g n e d ) ( 0 × 4004 e 8 + ( − 4 ) − 0 × 4004 d f ) = ( u n s i g n e d ) ( 0 × 5 ) \,\,\begin{array}{l} *refaddr=\,\,\left( unsigned \right) \ \left( ADDR\left( r.symbol \right) \ +\ r.addend\ -\ refaddr \right)\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,=\,\,\left( unsigned \right) \ \left( 0\times 4004e8\ \ \ \ \ \ \ \ \ +\,\,\,\,\, \left( -4 \right) \ \ \ \ \ -\ 0\times 4004df \right) \,\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,=\,\,\left( unsigned \right) \ \left( 0\times 5 \right)\\ \end{array} ∗refaddr=(unsigned) (ADDR(r.symbol) + r.addend − refaddr)=(unsigned) (0×4004e8 +(−4) − 0×4004df)=(unsigned) (0×5)
得到下面的重定位形式:
4004de: e8 05 00 00 00 callq 4004e8 <sum>
运行时,call指令存放在 0 × 4004 d e 0\times4004de 0×4004de处,CPU执行call指令时,PC指向下一条指令即 0 × 4004 e 3 0\times4004e3 0×4004e3。由于相对地址偏移位 0 × 5 0\times5 0×5,读PC新值为 0 × 4004 e 3 + 0 × 5 = 0 × 4004 e 8 0\times4004e3 + 0\times5 = 0\times4004e8 0×4004e3+0×5=0×4004e8,刚好指向sum入口地址。
2.重定位绝对引用
对于array条目:
r . o f f s e t = 0 × a r . s y m b o l = a r r a y r . t y p e = R _ X 86 _ 64 _ 32 r . a d d e n d = 0 \,\begin{matrix}{} \,\,\,\,\,\,\,\,\,\,\,\,\,\,r.offset\ \ =\ 0\times a\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,r.symbol\ =\ array\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,r.type =\ R\_X86\_64\_32\\ r.addend\ =\ 0\\ \end{matrix} r.offset = 0×ar.symbol = arrayr.type= R_X86_64_32r.addend = 0
已知 m a i n main main首地址 A D D R ( s ) = A D D R ( . t e x t ) = 0 × 4004 d 0 ADDR\left( s \right) \ =\ ADDR\left( .text \right) \ =\ 0\times 4004d0 ADDR(s) = ADDR(.text) = 0×4004d0和 a r r a y array array首地址 A D D R ( r . s y m b o l ) = A D D R ( a r r a y ) = 0 × 601018 ADDR\left( r.symbol \right) \ =\ ADDR\left( array \right) \ =\ 0\times 601018 ADDR(r.symbol) = ADDR(array) = 0×601018
链接器修改从偏移量 0 × 0\times 0×开始的绝对引用,使程序指向 a r r a y array array的第一个字节。
r e f a d d r = A D D R ( s ) + r . o f f s e t = 0 × 4004 d 0 + 0 × a = 0 × 4004 d a \,\,\begin{array}{l} refaddr=\,\,ADDR\left( s \right) \,\,+\,\,r.offset\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\ \ =\,\,0\times 4004d0\,\,+\,\,0\times a\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\ \ =\,\,0\times 4004da\\ \end{array} refaddr=ADDR(s)+r.offset =0×4004d0+0×a =0×4004da
∗ r e f a d d r = ( u n s i g n e d ) ( A D D R ( r . s y m b o l ) + r . a d d e n d ) = ( u n s i g n e d ) ( 0 × 601018 + 0 ) = ( u n s i g n e d ) ( 0 × 601018 ) \,\,\begin{array}{l} *refaddr=\,\,\left( unsigned \right) \ \left( ADDR\left( r.symbol \right) \ +\ r.addend\ \right)\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,=\,\,\left( unsigned \right) \ \left( 0\times 601018\ \ \ \ \ \ \ \ \ +\,\,\,\,\, 0 \ \ \right) \,\\ \,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,=\,\,\left( unsigned \right) \ \left( 0\times 601018 \right)\\ \end{array} ∗refaddr=(unsigned) (ADDR(r.symbol) + r.addend )=(unsigned) (0×601018 +0 )=(unsigned) (0×601018)
得到下面的重定位形式:
4004d9: bf 18 10 60 00 mov $0x601018, %edi
已重定位的.text节,如下:
1 00000000004004d0 <main>:
2 4004d0: 48 83 ec 08 sub $0x8, %rsp
3 4004d4: be 02 00 00 00 mov $0x2, %esi
4 4004d9: bf 18 10 60 00 mov $0x601018, %edi
5 4004de: e8 05 00 00 00 callq 4004e8 <sum>
6 4004e3: 48 83 c4 08 add $0x8, %rsp
7 4004e7: c3 retq
8 00000000004004e8 <sum>:
9 4004e8: b8 00 00 00 00 mov $0x0, %eax
10 4004ed: ba 00 00 00 00 mov $0xx, %edx
11 4004f2: eb 09 jmp 4004fd <sum+0x15>
12 4004f4: 48 63 ca movslq %edx, %rcx
13 4004f7: 03 04 8f add (%rdi, %rcx, 4), %eax
14 4004fa: 83 c2 01 add $0x1, %edx
15 4004fd: 39 f2 cmp %esi, %edx
16 4004ff: 7c f3 jl 4004f4 <sum+0xc>
17 400501: f3 c3 repz retq
已重定位的.data节,如下:
1 000000000601018 <array>:
2 601018: 01 00 00 00 02 00 00 00
典型的ELF可执行文件中的各类信息,如下:
图2 典型的ELF可执行目标文件
格式类似于可重定位目标文件格式。.init节中定义_init函数,代码初始化时调用。
可执行文件prog的程序头部表,如下:
Read-only code segment
1 Load off 0x0000000000000000 vaddr 0x0000000000400000 paddr 0x0000000000400000 align 2**21
2 filesz 0x000000000000069c memsz 0x000000000000069c flag r-x
Read/write data segment
3 Load off 0x0000000000000df8 vaddr 0x0000000000600df8 paddr 0x0000000000600df8 align 2**21
4 filesz 0x0000000000000228 memsz 0x0000000000000230 flag rw-
off:目标文件中的偏移; vaddr/paddr:内存地址; align:对齐要求; filesz:目标文件中的段大小;memsz:内存中的段大小; flags:运行时访问权限。
1和2行(代码段),只读权限,开始于内存地址 0 × 400000 0\times400000 0×400000处,总共内存大小 0 × 69 c 0\times69c 0×69c,被初始化为可执行目标文件的头 0 × 69 c 0\times69c 0×69c个字节。
3和4行(数据段),读写权限,开始于内存地址0x600df8处,总内存大小 0 × 230 0\times230 0×230字节,初始化为从目标文件中偏移 0 × d f 8 0\times df8 0×df8处开始的.data节中的 0 × 228 0\times228 0×228个字节初始化。
对于任何段s,起始地址满足:vaddr mod align = off mod align。优化对齐,便于目标文件中的段高效地传送至内存。
系统调用加载器将可执行目标文件的代码和数据从磁盘复制到内存,然后跳转至入口地址来运行程序,这一过程称为加载。
图3 Linux x86-64运行时内存映像
代码段总是从 0 × 400000 0\times400000 0×400000处开始,后面是数据段。堆在数据段之后,通过调用malloc向上增长。用户栈总是从最大的合法用户地址 2 48 − 1 2^{48}-1 248−1处开始。
共享库,用于解决多个进程调用相同静态库造成的内存浪费问题。
共享库是一个目标模块,在运行或加载时,可以加载到任意的内存地址,并在内存中的程序链接起来(动态链接)。
共享库(so)中的代码和数据不会复制到引用它们的可执行文件中。
在内存中,共享库的.text节副本可被不同的正在运行的进程共享。
图4 动态链接共享库
使用动态链接共享库的命令行参数,如下。注:后缀.so和.dll均可。
gcc -shared -fpic -o libvector.so addvec.c multivec.c
gcc -o prog main.c libvector.so
动态链接的功能:
可以加载而无需重定位的代码称为位置无关代码(Position-Independent Code,PIC)。
PIC数据引用
无论在内存中的何处加载一个目标模块,数据段和代码段的距离总是保持不变。
因此,代码段中的任何指令和数据段中任何变量之间的距离为常量。
基于上述原理,编译器在数据段开始处创建全局偏移量表(Global Offset Table, GOT),实现对全局变量PIC引用。
PIC函数调用
共享模块在运行时,随机加载到内存的任何位置,编译器无法预测其函数的运行地址。
GNU编译系统使用延迟绑定,将过程地址的绑定推迟到函数的第一次调用时。基于GOT和过程连接表(PLT)的交互实现。
允许截获对共享库函数的调用,取而代之执行自己的代码。
打桩可发生在编译、链接以及程序加载和执行时。
文章浏览阅读2w次,点赞7次,收藏51次。四个步骤1.创建C++ Win32项目动态库dll 2.在Win32项目动态库中添加 外部依赖项 lib头文件和lib库3.导出C接口4.c#调用c++动态库开始你的表演...①创建一个空白的解决方案,在解决方案中添加 Visual C++ , Win32 项目空白解决方案的创建:添加Visual C++ , Win32 项目这......_c#调用lib
文章浏览阅读4.6k次。苹方字体是苹果系统上的黑体,挺好看的。注重颜值的网站都会使用,例如知乎:font-family: -apple-system, BlinkMacSystemFont, Helvetica Neue, PingFang SC, Microsoft YaHei, Source Han Sans SC, Noto Sans CJK SC, W..._ubuntu pingfang
文章浏览阅读159次。表单表单概述表单标签表单域按钮控件demo表单标签表单标签基本语法结构<form action="处理数据程序的url地址“ method=”get|post“ name="表单名称”></form><!--action,当提交表单时,向何处发送表单中的数据,地址可以是相对地址也可以是绝对地址--><!--method将表单中的数据传送给服务器处理,get方式直接显示在url地址中,数据可以被缓存,且长度有限制;而post方式数据隐藏传输,_html表单的处理程序有那些
文章浏览阅读1.2k次。使用说明:开启Google的登陆二步验证(即Google Authenticator服务)后用户登陆时需要输入额外由手机客户端生成的一次性密码。实现Google Authenticator功能需要服务器端和客户端的支持。服务器端负责密钥的生成、验证一次性密码是否正确。客户端记录密钥后生成一次性密码。下载谷歌验证类库文件放到项目合适位置(我这边放在项目Vender下面)https://github.com/PHPGangsta/GoogleAuthenticatorPHP代码示例://引入谷_php otp 验证器
文章浏览阅读4.3k次,点赞5次,收藏11次。matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距
文章浏览阅读2.2k次。①Storage driver 处理各镜像层及容器层的处理细节,实现了多层数据的堆叠,为用户 提供了多层数据合并后的统一视图②所有 Storage driver 都使用可堆叠图像层和写时复制(CoW)策略③docker info 命令可查看当系统上的 storage driver主要用于测试目的,不建议用于生成环境。_docker 保存容器
文章浏览阅读834次,点赞27次,收藏13次。网络拓扑结构是指计算机网络中各组件(如计算机、服务器、打印机、路由器、交换机等设备)及其连接线路在物理布局或逻辑构型上的排列形式。这种布局不仅描述了设备间的实际物理连接方式,也决定了数据在网络中流动的路径和方式。不同的网络拓扑结构影响着网络的性能、可靠性、可扩展性及管理维护的难易程度。_网络拓扑csdn
文章浏览阅读1.8k次,点赞5次,收藏8次。IOS系统Date的坑要创建一个指定时间的new Date对象时,通常的做法是:new Date("2020-09-21 11:11:00")这行代码在 PC 端和安卓端都是正常的,而在 iOS 端则会提示 Invalid Date 无效日期。在IOS年月日中间的横岗许换成斜杠,也就是new Date("2020/09/21 11:11:00")通常为了兼容IOS的这个坑,需要做一些额外的特殊处理,笔者在开发的时候经常会忘了兼容IOS系统。所以就想试着重写Date函数,一劳永逸,避免每次ne_date.prototype 将所有 ios
文章浏览阅读5.3k次。方法一:用PLSQL Developer工具。 1 在PLSQL Developer的sql window里输入select * from test for update; 2 按F8执行 3 打开锁, 再按一下加号. 鼠标点到第一列的列头,使全列成选中状态,然后粘贴,最后commit提交即可。(前提..._excel导入pl/sql
文章浏览阅读83次。Git常用命令速查手册1、初始化仓库git init2、将文件添加到仓库git add 文件名 # 将工作区的某个文件添加到暂存区 git add -u # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,不处理untracked的文件git add -A # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,包括untracked的文件...
文章浏览阅读202次。分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120
文章浏览阅读1.8k次。版权声明:转载请注明出处 http://blog.csdn.net/irean_lau。目录(?)[+]1、缺省构造函数。2、缺省拷贝构造函数。3、 缺省析构函数。4、缺省赋值运算符。5、缺省取址运算符。6、 缺省取址运算符 const。[cpp] view plain copy_空类默认产生哪些类成员函数