关于Linux中程序的内存布局

我对 Linux中程序的内存布局有一些疑问.我从各种来源(我正在阅读“从头开始编程”)中了解到,每个部分都被加载到它自己的内存区域.文本部分首先在虚拟地址0x8048000加载,数据部分在此之后立即加载,接下来是bss部分,然后是堆和堆栈.

为了试验布局我在汇编中制作了这个程序.首先,它打印一些标签的地址并计算系统断点.然后它进入一个无限循环.循环递增指针,然后它尝试访问该地址的内存,在某些时候,分段错误将退出程序(我故意这样做).

这是该计划:

.section .data

start_data:
str_mem_access:
.ascii "Accessing address: 0x%x\n\0"
str_data_start:
.ascii "Data section start at: 0x%x\n\0"
str_data_end:
.ascii "Data section ends at: 0x%x\n\0"
str_bss_start:
.ascii "bss section starts at: 0x%x\n\0"
str_bss_end:
.ascii "bss section ends at: 0x%x\n\0"
str_text_start:
.ascii "text section starts at: 0x%x\n\0"
str_text_end:
.ascii "text section ends at: 0x%x\n\0"
str_break:
.ascii "break at: 0x%x\n\0"
end_data:

.section .bss

start_bss:
.lcomm buffer,500
.lcomm buffer2,250
end_bss:

.section .text
start_text:

.globl _start
_start:

# print address of start_text label
pushl $start_text
pushl $str_text_start
call printf
addl $8,%esp
# print address of end_text label
pushl $end_text
pushl $str_text_end
call printf
addl $8,%esp
# print address of start_data label
pushl $start_data
pushl $str_data_start
call printf
addl $8,%esp
# print address of end_data label
pushl $end_data
pushl $str_data_end
call printf
addl $8,%esp
# print address of start_bss label
pushl $start_bss
pushl $str_bss_start
call printf
addl $8,%esp
# print address of end_bss label
pushl $end_bss
pushl $str_bss_end
call printf
addl $8,%esp
# get last usable virtual memory address
movl $45,%eax
movl $0,%ebx
int $0x80

incl %eax # system break address
# print system break
pushl %eax
pushl $str_break
call printf
addl $4,%esp

movl $start_text,%ebx

loop:
# print address
pushl %ebx
pushl $str_mem_access
call printf
addl $8,%esp

# access address
# segmentation fault here
movb (%ebx),%dl

incl %ebx

jmp loop

end_loop:
movl $1,%ebx
int $0x80

end_text:

而这个输出的相关部分(这是Debian 32bit):

text section starts at: 0x8048190
text section ends at: 0x804823b
Data section start at: 0x80492ec
Data section ends at: 0x80493c0
bss section starts at: 0x80493c0
bss section ends at: 0x80493c0
break at: 0x83b4001
Accessing address: 0x8048190
Accessing address: 0x8048191
Accessing address: 0x8048192
[...]
Accessing address: 0x8049fff
Accessing address: 0x804a000
Violación de segmento

我的问题是:

1)为什么我的程序从地址0x8048190而不是0x8048000开始?有了这个,我想“_start”标签上的指令不是第一个加载的东西,那么地址0x8048000和0x8048190之间的区别是什么?

2)为什么文本部分的结尾和数据部分的开头之间有差距?

3)bss的起始地址和结束地址是相同的.我假设两个缓冲区存储在其他地方,这是正确的吗?

4)如果系统断点位于0x83b4001,为什么我早些时候在0x804a000处得到分段错误?

解决方法

我假设您使用gcc -m32 -nartartfiles segment-bounds.S或类似的构建它,因此您有一个32位动态二进制文件. (如果您实际使用的是32位系统,则不需要-m32,但大多数想要测试它的人都将使用64位系统.)

我的64位Ubuntu 15.10系统在某些方面给出了与程序略有不同的数字,但整体行为模式是相同的. (不同的内核,或者只是ASLR,解释了这一点.brk地址变化很大,例如,值为0x9354001或0x82a8001)

1) Why is my program starting at address 0x8048190 instead of 0x8048000?

如果构建静态二进制文件,则_start将为0x8048000.

我们可以从readelf -a a.out看到0x8048190是.text部分的开头.但它不是在映射到页面的文本段的开头. (页面是4096B,并且Linux要求映射在文件位置的4096B边界上对齐,因此对于这样布局的文件,execve不可能将_start映射到页面的开头.我认为关闭列是文件中的位置.)

据推测,.text段之前的文本段中的其他部分是动态链接器所需的只读数据,因此将它映射到同一页面中的内存是有意义的.

## part of readelf -a output
Section Headers:
  [Nr] Name              Type            Addr     Off    Size   ES Flg Lk Inf Al
  [ 0]                   NULL            00000000 000000 000000 00      0   0  0
  [ 1] .interp           PROGBITS        08048114 000114 000013 00   A  0   0  1
  [ 2] .note.gnu.build-i NOTE            08048128 000128 000024 00   A  0   0  4
  [ 3] .gnu.hash         GNU_HASH        0804814c 00014c 000018 04   A  4   0  4
  [ 4] .dynsym           DYNSYM          08048164 000164 000020 10   A  5   1  4
  [ 5] .dynstr           STRTAB          08048184 000184 00001c 00   A  0   0  1
  [ 6] .gnu.version      VERSYM          080481a0 0001a0 000004 02   A  4   0  2
  [ 7] .gnu.version_r    VERNEED         080481a4 0001a4 000020 00   A  5   1  4
  [ 8] .rel.plt          REL             080481c4 0001c4 000008 08  AI  4   9  4
  [ 9] .plt              PROGBITS        080481d0 0001d0 000020 04  AX  0   0 16
  [10] .text             PROGBITS        080481f0 0001f0 0000ad 00  AX  0   0  1         ########## The .text section
  [11] .eh_frame         PROGBITS        080482a0 0002a0 000000 00   A  0   0  4
  [12] .dynamic          DYNAMIC         08049f60 000f60 0000a0 08  WA  5   0  4
  [13] .got.plt          PROGBITS        0804a000 001000 000010 04  WA  0   0  4
  [14] .data             PROGBITS        0804a010 001010 0000d4 00  WA  0   0  1
  [15] .bss              NOBITS          0804a0e8 0010e4 0002f4 00  WA  0   0  8
  [16] .shstrtab         STRTAB          00000000 0010e4 0000a2 00      0   0  1
  [17] .symtab           SYMTAB          00000000 001188 0002b0 10     18  38  4
  [18] .strtab           STRTAB          00000000 001438 000123 00      0   0  1
Key to Flags:
  W (write),A (alloc),X (execute),M (merge),S (strings)
  I (info),L (link order),G (group),T (TLS),E (exclude),x (unknown)
  O (extra OS processing required) o (OS specific),p (processor specific)

2) Why is there a gap between the end of the text section and the start of the data section?

为什么不?它们必须位于可执行文件的不同段中,因此映射到不同的页面. (文本是只读的和可执行的,可以是MAP_SHARED.数据是读写的,必须是MAP_PRIVATE.顺便说一下,在Linux中,默认情况下数据也是可执行的.)

留下空隙为动态链接器留出空间,以便在可执行文本旁边映射共享库的文本段.这也意味着数据部分的越界数组索引更容易发生段错误. (早期和嘈杂的故障总是更容易调试).

3)bss的起始地址和结束地址是相同的.我假设两个缓冲区存储在其他地方,这是正确的吗?

那很有意思.他们在bss中,但IDK为什么当前位置不受.lcomm标签的影响.可能它们在链接之前会进入不同的子部分,因为您使用的是.lcomm而不是.comm.如果我使用.skip或.zero来预留空间,我会得到您期望的结果:

.section .bss
start_bss:
#.lcomm buffer,500
#.lcomm buffer2,250
buffer:  .skip 500
buffer2: .skip 250
end_bss:

即使您没有切换到该部分,.lcomm也会将内容放入BSS.即它不关心当前部分是什么,也可能不关心或影响.bss部分中的当前位置. TL:DR:当您手动切换到.bss时,请使用.zero或.skip,而不是.comm或.lcomm.

4) If the system break point is at 0x83b4001,why I get the segmentation fault earlier at 0x804a000?

这告诉我们文本段和brk之间有未映射的页面. (您的循环以ebx = $start_text开头,因此它在文本段之后的第一个未映射页面上出现故障).除了文本和数据之间的虚拟地址空间中的漏洞之外,数据段之外可能还有其他漏洞.

内存保护具有页面粒度(4096B),因此第一个故障地址始终是页面的第一个字节.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读1.8k次,点赞63次,收藏54次。Linux下的目录权限!!!粘滞位!!!超详解!!!
文章浏览阅读1.6k次,点赞44次,收藏38次。关于Qt的安装、Windows、Linux、MacBook_mack book 安装qt
本文介绍了使用shell脚本编写一个 Hello
文章浏览阅读1.5k次,点赞37次,收藏43次。【Linux】初识Linux——了解操作系统的发展历史以及初次体验Linux编程环境
文章浏览阅读3k次,点赞34次,收藏156次。Linux超详细笔记,个人学习时很认真的记录的,觉得好的麻烦点个赞。
文章浏览阅读6.8k次,点赞109次,收藏114次。【Linux】 OpenSSH_9.3p1 升级到 OpenSSH_9.5p1(亲测无问题,建议收藏)_openssh_9.5p1
文章浏览阅读3.5k次,点赞93次,收藏78次。初识Linux中的线程,理解线程的各种概念,理解进程地址空间中的页表转换,介绍pthread线程库并理解线程库!
文章浏览阅读863次。出现此问题为Linux文件权限问题,解决方案为回到引擎目录执行命令。输入用户密码后运行./UnrealEditor。_increasing per-process limit of core file size to infinity.
文章浏览阅读2.9k次。使用文本编辑器:打开CSV文件,并使用文本编辑器(如Notepad++、Sublime Text、Visual Studio Code等)来查看文件的字符编码格式。通常在编辑器的底部状态栏或设置中可以找到当前编码的显示。请注意,上述方法并非绝对准确,特别是当文件没有明确的编码标识时。因此,如果你发现CSV文件在不同的工具或方法中显示不同的编码格式,可能需要进行进一步的分析和判断,或者尝试使用不同的编码转换方法。该命令将输出文件的MIME类型和编码信息。使用命令行工具:在命令行中,你可以使用。_shell读取csv文件逐行处理
本文介绍了如何在Linux系统中升级gcc版本,以便更好地支持C++11及以上版本的新特性。通过升级gcc,可以提升编译器的功能和性能,获得更好的开发体验。详细的步骤和方法请参考原文链接。
文章浏览阅读4.4k次,点赞6次,收藏19次。Mosquitto是一个开源的MQTT消息代理服务器。MQTT是一个轻量级的、基于发布/订阅模式的消息传输协议。 mosquitto的安装使用比较简单,可以方便的来进行一些测试。_linux mosquitto
文章浏览阅读7.2k次,点赞2次,收藏12次。Linux中,用于根目录下有一个.ssh目录,保存了ssh相关的key和一些记录文件。_~/.ssh/
文章浏览阅读4.5k次,点赞5次,收藏18次。首先需要安装 snmp ,使用下面的命令进行安装安装完毕之后,使用下面的命令查看是否安装成功当命令行显示如图即为安装成功。_snmp工具
文章浏览阅读3.5k次,点赞7次,收藏24次。本地部署和使用llama.cpp进行量化Llama2,linux和Windows平台方案,支持CPU和GPU多版本。_llama cpp gpu
文章浏览阅读1.4k次,点赞46次,收藏44次。在vim中,最为常见的有三种模式,分别是:命令模式(command mode)、插 入模式(Insert mode)和底行模式(last line mode)文件保存或退出,也可以进行文件替换,找字符串,列出行号等操作。在命令模式下,shift+: 即可进入该模 式。在进入vim后,使用 i 进入插入模式,插入模式就是vim的编辑模式,可以在vim中进行内容的编辑和修改。vim的核心模式,使用vim进入文件编辑时的最初模式,在该模式中只能移动光标和使用命令对文件内容进行编辑。
Linux常用命令大全,包括目录操作命令和文件操作命令,以及查看登录用户命令和文件内容查看命令等。
文章浏览阅读1.7k次,点赞57次,收藏50次。Yearning 简单, 高效的MYSQL 审计平台 一款MYSQL SQL语句/查询审计工具,为DBA与开发人员使用.本地部署,注重隐私,简单高效的MYSQL审计平台。下面介绍Linux 简单部署Yearning 并结合cpolar 内网穿透工具实现远程访问,破除访问限制,提高工作效率!!
文章浏览阅读1.9w次,点赞7次,收藏18次。Microsoft Edge是一款现代化的浏览器,它拥有众多功能和强大的性能,为用户带来更加流畅的浏览体验。Edge最近推出了分屏功能,支持一个窗口同时显示两个选项卡,这可以大大提高生产力和多任务处理能力。欢迎大家使用分屏及其他新功能后分享自己的使用心得与建议。首先,使用Microsoft Edge的分屏功能确实能够提高生产力,尤其是在需要同时浏览两个不同网页的情况下。分屏功能使得在一个窗口中同时显示两个选项卡,用户可以在两个网页之间快速切换,而无需打开新的窗口或使用多个浏览器窗口。_edge linux
文章浏览阅读1.8k次,点赞83次,收藏71次。C语言实现倒计时和进度条并进行演示。_linux不换行输出倒计时
文章浏览阅读1.5k次,点赞28次,收藏25次。基于嘉立创泰山派开发板,本机使用VMware+Unbuntu,编译泰山派的Linux SDK。详细教程,0基础小白可操作!内涵大量基础操作和linux基本知识。_立创泰山派sdk编译